L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1488

 
Aleksey Vyazmikin:

Dobbiamo assumere che tutto quello che possiamo fare è sviluppare un algoritmo per il miglior adattamento ai dati, perché non conosciamo il futuro e ci sono molte variazioni, anche sulla base dei valori predittivi disponibili. E se siamo fortunati, possiamo rilevare un modello che continuerà ad esistere per qualche tempo, ecco perché è importante cercare un tale modello con certi criteri, e la logica dice che almeno dovrebbe essere un modello che si verifica in tutto il campione.

C'è solo un modello sul mercato e sarà sempre - cicli di tempo, periodi: sessione di trading, giorno, settimana, ..., e i loro semiperiodi. Questi cicli sono indistruttibili in linea di principio, formano una struttura temporale complessa e determinano il volume di un campione con cui lavorare. Identificando il comportamento dei prezzi all'interno di questa struttura gerarchica, il sistema di trading funzionerà sempre.

 
Il mercato non è frattale in sé. Ha solo le proprietà di autosimilarità all'interno dei periodi di tempo, formando certe strutture al loro interno. Il volume di tick o qualsiasi altro campione per pallone non può essere scelto - deve essere qualche valore definito che soddisfi i cicli di tempo annidati.
 
Aleksey Vyazmikin:

Gli algoritmi standard sono progettati per lavorare con fenomeni stazionari, sistemi chiusi, quindi lì qualsiasi informazione è considerata utile a priori e non è valutata in termini di casualità, ma solo la possibilità di utilizzarla per il compito in questione (classificazione per target), mentre noi abbiamo molto rumore e ho suggerito un modo logico per affrontarlo.

Cioè l 'uniformità dei mestieri di successo nell'area di formazione?
Va bene così com'è, perché l'adattamento è esattamente per l'apprendimento, fino allo 0% di errore.

Suppongo che dovrebbe essere così quando si regolarizza/coarsening il modello con la riduzione della profondità o altri metodi. E fermarsi per esempio al 20% di errore nell'area di allenamento.

Penso che ci sia solo un modo - dopo ogni versione di nodo aggiunta, eseguire tutti i dati attraverso la parte risultante dell'albero e analizzare la linea di bilancio.

Numero di versioni = (numero di caratteristiche * numero di nodi nell'albero * 3 (se diviso per quartili)) * numero di alberi

Ci vorrà molto tempo per calcolare, temo anche più di NS.

 
Alexander_K:

C'è un modello nel mercato e sarà sempre - cicli di tempo, periodi: sessione di trading, giorno, settimana, ... così come i loro semi-periodi. Questi cicli sono indistruttibili in linea di principio, formano una struttura temporale complessa e determinano il volume del campione con cui lavorare. Identificando il comportamento del prezzo all'interno di questa struttura gerarchica, il sistema di trading funzionerà sempre.

Non nego l'importanza del tempo, ma non è sufficiente per creare un modello - hai bisogno di altre variabili che influenzano il prezzo.

 
Aleksey Vyazmikin:

Non nego l'importanza del tempo, ma non è sufficiente per creare un modello - hai bisogno di altre variabili che influenzano il prezzo.

Basta così.

È all'interno dei cicli temporali che si trova il Graal. La struttura in un ciclo di tempo è parte della struttura in un altro.

Se lavorate con lo stesso dimensioni del campione che corrispondono a diverso periodi di tempo strettamente definiti, allora queste strutture annidate sono proprio come sul palmo della mano.

Non può occuparsene la NS? L'ho fatto nel mio TS senza rete neurale.

 
elibrario:

Cioè l'uniformità dei mestieri di successo nell'area di formazione?

Personalmente, valuto il risultato finanziario per ogni anno (attualmente 5 anni), tenendo conto del fattore di estrazione e di recupero, e di altri criteri di valutazione. Al momento non guardo nemmeno la classificazione, perché c'è una strategia di tendenza, e anche con una classificazione corretta al 35% può essere un profitto di fine anno (altro periodo).

elibrario:


Va bene così com'è, perché l'adattamento è esattamente per l'apprendimento, fino allo 0% di errore.

La questione è quanti alberi vengono utilizzati per questo, ed essenzialmente quale memoria ha il modello. Un solo albero, con una profondità di 6 spaccature, non può fare un tale adattamento...


elibrario:

Immagino che debba essere regolarizzando/caricando il modello con la riduzione della profondità o altri metodi. E fermarsi per esempio al 20% di errore nella sezione di allenamento.

Io uso già le divisioni e la restrizione di completezza, e sì, dovrebbe essere usato nell'allenamento.


elibrario:

Penso che ci sia solo un modo - dopo ogni versione di nodo aggiunta, eseguire tutti i dati attraverso la parte risultante dell'albero e analizzare la linea di bilancio.

Numero di versioni di un nodo = (numero di caratteristiche * numero di nodi nell'albero * 3 (se diviso per quartili)) * numero di alberi

Questo richiederà un tempo molto lungo per il calcolo, temo anche più lungo di NS.

Questo sarà più efficiente, il che è più importante, e alla fine ci saranno più modelli commerciabili.

Al momento passo circa 15 giorni per il calcolo - ottengo circa 800 foglie uniche e in media 8 di esse, la metà delle quali sono simili, che mostrano risultati stabili su intervalli di tempo (e il controllo richiede ancora non poco tempo alla macchina). Cioè, rallentando il calcolo di 800/8 di un fattore 100, si otterrebbe anche un risultato comparabile.

 
Alexander_K:

Quando è troppo è troppo.

È all'interno dei cicli temporali che si trova il Graal. La struttura in un ciclo di tempo è parte della struttura in un altro.

Se lavorate con lo stesso dimensioni del campione che corrispondono a diverso periodi di tempo strettamente definiti, allora queste strutture annidate sono proprio lì nel palmo della vostra mano.

Non può occuparsene la NS? L'ho fatto nel mio TS senza rete neurale.

Non ne ricavo un graal, anche se sto lavorando solo con strutture e somiglianze di frattali, cioè l'annidamento del tempo in diversi TF. Non è abbastanza, forse non ho ancora realizzato tutto.

Il NS è uno strumento, il cervello umano può o non può trovare una soluzione più veloce e più accurata...

 
Aleksey Vyazmikin:

Personalmente, stimo il risultato finanziario per ogni anno (attualmente 5 anni), tenendo conto del fattore di estrazione e di recupero, e di altri criteri di valutazione. Al momento non guardo nemmeno la classificazione, perché c'è una strategia di tendenza, e anche con una classificazione corretta al 35% può essere un profitto di fine anno (altro periodo).

La questione è quanti alberi vengono utilizzati per questo, ed essenzialmente quale memoria ha il modello. Un solo albero, con una profondità di 6 spaccature, non può fare un tale adattamento...


Il vincolo di divisione e completezza è qualcosa che già uso, e sì, dovrebbe essere usato nella formazione.


Sarà più efficiente, che è la cosa più importante, e il risultato finale saranno modelli più commerciabili.

Al momento spendo circa 15 giorni per calcolare - ottengo circa 800 foglie uniche e di queste in media 8, di cui la metà sono simili, che mostrano risultati stabili su intervalli di tempo (e il controllo richiede ancora non poco tempo alla macchina). Cioè, rallentando il calcolo di 800/8 di un fattore 100 si otterrà anche un risultato comparabile.

Sembra che tu stia facendo dei test in avanti sulle valvole.
Anch'io, ma a mano. Penso che questo sia il modo migliore per valutare i modelli.

Non ho ancora trovato un modello stabile nel tempo. Spostandosi di mezzo anno/anno avanti/indietro i modelli cominciano già a performare male o a scaricare. Anche appena addestrato sulle stesse caratteristiche e con gli stessi parametri del modello. Cioè, cambia anche l'importanza delle caratteristiche.

 
elibrario:

Sembra che tu stia facendo dei test in avanti di valking.
Anch'io, ma manualmente. Penso che questo sia il modo migliore per valutare i modelli.

Non ho ancora trovato un modello stabile nel tempo. Spostandosi di mezzo anno/anno avanti/indietro i modelli cominciano già a performare male o a scaricare. Anche appena addestrato sulle stesse caratteristiche e con gli stessi parametri del modello. Cioè cambia anche l'importanza delle caratteristiche.

Ecco perché è necessario tener conto di tutto questo nell'addestramento, e fare delle suddivisioni, tenendo conto se non dell'equilibrio, allora valutando la probabilità di precisione della classificazione. La parte che è discutibile dovrebbe semplicemente andare o al divieto di commercio o alla probabilità del 99%, poi può essere filtrata quando si applica il modello.

 
Aleksey Vyazmikin:

Ecco perché è necessario tenere conto di tutto questo nell'addestramento, e fare delle suddivisioni tenendo conto, se non dell'equilibrio, di una stima della probabilità di precisione della classificazione. La parte che è dubbia dovrebbe essere proibita per il trading o contrassegnata come 99% di probabilità, e poi può essere filtrata quando si applica il modello.

Le suddivisioni sono fatte in base alla probabilità di classificazione. Più precisamente, non per probabilità, ma per errore di classificazione. Perché tutto è noto nell'esercitazione di allenamento, e abbiamo una valutazione esatta, non una probabilità.
Anche se ci sono diverse fi bre di separazione, cioè misure di impurità (campionamento a sinistra o a destra).
Motivazione: