L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2478

 
Maxim Dmitrievsky #:
C'è più un effetto di standardizzazione che di bilanciamento qui, secondo me. Inoltre il campionamento dalle distribuzioni aiuta a evitare il sovrallenamento

Ho capito bene, più campioni sono, più sono vicini alla standardizzazione?

 
iwelimorn #:

Ho capito bene, più campioni ci sono, più i segni sono vicini alla standardizzazione?

È difficile dire quale sia la dimensione ottimale del campione, probabilmente dipende dal numero di componenti delle miscele gaussiane. Un campionamento troppo grande, con set di dati rumorosi, porta alla generazione di campioni molto simili, cioè la probabilità di occorrenza di campioni ripetuti frequentemente aumenta, perché le gaussiane sono usate per la stima della densità e la generazione. Pertanto, è più probabile che sia no che sì.
Ho letto da qualche parte che GMM non funziona bene con grandi serie di dati.
 
Maxim Dmitrievsky #:
È difficile dire quale sia la dimensione ottimale del campione, probabilmente dipende dal numero di componenti della miscela gaussiana. Un campione troppo grande, con un set di dati rumoroso, porta alla generazione di campioni molto simili, cioè la probabilità di occorrenza di campioni ripetuti frequentemente aumenta, perché le gaussiane sono usate per la stima della densità e la generazione. Quindi è più probabile che sia no che sì.

Grazie. Probabilmente non ho posto correttamente la domanda, intendevo dire che è possibile che più campioni generati diano un campione più standardizzato.

 
iwelimorn #:

Grazie. Probabilmente non ho posto correttamente la domanda, intendevo dire che è possibile che più campioni generati diano un campione più standardizzato.

Sì, certo
 
iwelimorn #:

Grazie. Probabilmente non ho posto correttamente la domanda, intendevo dire che è possibile che più campioni generati diano un campione più standardizzato.

L'importante è avere meno incongruenze possibili quando si genera il campione, altrimenti l'allenamento sarà inutile. Immaginate che in un caso con lo stesso valore del vettore di input il target abbia valore 1, e nel caso successivo con un vettore di input identico il target abbia valore 0. Cosa dovrebbe fare allora l'algoritmo? Come reagire? Quindi aumentare i campioni di allenamento è rilevante solo se non porta ad un aumento della contraddizione. È una questione filosofica. Per esempio, copro 3 mesi di mercato su M5 su 100 campioni di formazione. Come esempio...
 
E a proposito, c'è una signora nelle nostre file, se ho capito bene. Questo è un caso davvero raro, si potrebbe dire un'eccezione alla regola... :-)
 
Mihail Marchukajtes #:
È importante avere meno contraddizioni possibili quando si forma il campione, altrimenti l'allenamento sarà inutile . Immaginate che in un caso con lo stesso valore del vettore di input il target abbia valore 1, e nel caso successivo con un vettore di input identico il target abbia valore 0. Allora cosa dovrebbe fare l'algoritmo? Come reagire? Quindi aumentare i campioni di allenamento è rilevante solo se non porta ad un aumento della contraddizione. È una questione filosofica. Per esempio, copro 3 mesi di mercato su M5 su 100 campioni di formazione. Come esempio...

Hai almeno capito quello che hai scritto?

 

Mihail Marchukajtes #:
È importante avere meno contraddizioni possibili quando si forma il campione, altrimenti l'allenamento sarà inutile. Immaginate che in un caso con lo stesso valore del vettore di input il target abbia valore 1, e nel caso successivo con un vettore di input identico il target abbia valore 0. Allora cosa dovrebbe fare l'algoritmo? Come reagire? Quindi aumentare i campioni di allenamento è rilevante solo se non porta ad un aumento della contraddizione. È una questione filosofica. Per esempio, copro 3 mesi di mercato su M5 su 100 campioni di formazione. Come esempio...

Sono d'accordo con te, se uno stesso esempio descrive diversi stati, allora quando classifichiamo con qualsiasi algoritmo disponibile otterremo una probabilità vicina a 1/n dove n è il numero di stati.

Ma non ci sono esempi assolutamente simili, sono simili fino a un certo punto. La questione è come rilevare questa "somiglianza".


100 esemplari in tre mesi sulla M5... Mi chiedo... Selezionate dei campioni dal campione originale secondo le regole , che poi utilizzate nel trading?

 
iwelimorn #:

Sono d'accordo con te, se lo stesso esempio descrive diversi stati, otterremo una probabilità vicina a 1/n dove n è il numero di stati quando si classifica con qualsiasi algoritmo disponibile.

Ma non ci sono esempi assolutamente simili, sono simili fino a un certo punto. La questione è come rilevare questa "somiglianza".


100 esemplari in tre mesi sulla M5... Mi chiedo... Selezionate dei campioni dal campione originale secondo le regole , che poi utilizzate nel trading?

Se la stessa serie di variabili indipendenti nel campione di allenamento corrisponde a una sola variabile dipendente, allora si tratta di una serie deterministica.

Non c'è niente da classificare lì - l'errore di predizione è 0.

Sì, è già un'agonia.

 
Dmytryi Nazarchuk #:

Se la stessa serie di variabili indipendenti nel campione di allenamento corrisponde a una sola variabile dipendente, si tratta di una serie deterministica.

Non c'è niente da classificare lì - l'errore di predizione è 0.

Sì, questa è un'agonia.

Grazie, forse non è l'agonia ma la mia mancanza di conoscenze fondamentali.

È vero anche se più serie di variabili indipendenti corrispondono alla stessa variabile?

Motivazione: