L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 426

 
Ivan Negreshniy:

Hai ragione, prevedere l'indicatore è ridondante. Ma prevedere il prezzo è anche ridondante, perché l'obiettivo della strategia di trading non è il prezzo ma il profitto.

Seguendo questa logica, dovremmo modellare non gli indicatori e non i grafici dei prezzi, ma il comportamento del trader, e la migliore funzione di destinazione sarebbero gli indicatori del suo trading redditizio.

In pratica dovresti prendere la storia del trading o eseguire l'Expert Advisor nello Strategy Tester e insegnare il modello con i modelli di prezzo come input e le transazioni come output.

Quindi il "profitto" è il ritorno (profittabilità, return), cioè l'aumento del prezzo normalizzato per il suovalore assoluto, e questo è il famigerato indicatore "Momentum", conoscendo il Momentum futuro, sei il dominatore dell'universo.

 
Maxim Dmitrievsky:

E quello che si sta discutendo qui ora è una specie di applicazione da asilo nido dello zigzag o meno, che diavolo di differenza fa se l'approccio previsionale stesso è sbagliato dall'inizio (cioè non porterà al successo) :)

È giusto, la questione è nei dettagli, non essere troppo precipitoso. E questo "infantilismo" non riguarda solo lo zigzag, è una vera trappola...

 
Aliosha:

Non oso farlo, né con il tuo atteggiamento né con quello di nessun altro. Non sei solo nel tuo delirio.

C'è molto senso in quello che hai scritto, l'articolo è grande, lo dico sinceramente, brevemente e concisamente. Ma c'è un piccolo difetto, e l'ho fatto notare, perché io stesso mi sono illuso nello stesso modo per molto tempo.


Lasciatemi provare a spiegare ancora una volta la mia posizione.


L'articolo che hai citato è materiale promozionale per l'apprendimento automatico: mostra che il concetto di apprendimento automatico include non solo i modelli ma anche la preparazione dei dati per il modello e la valutazione del modello. Dimostra anche che chiunque sia interessato all'apprendimento automatico può provare il tutto con il minimo sforzo.


I miei pensieri non sono affatto nell'articolo. È una pubblicità.


Il mio pensiero su questo thread e su altri thread del forum è che la cosa principale, fondamentale nell'apprendimento automatico NON è il modello, la logica che"i predittori sono rilevanti per la variabile obiettivo".

È "rilevante", non l'obiettivo stesso o un insieme specifico di predittori. Detto questo, io metto il mio proprio significato nel significato di "avere una relazione", diverso da quello definito dall'"importanza dei predittori".

Non ho mai pubblicizzato o giustificato l'uso di ZZ da nessuna parte: l'ho semplicemente usato nei miei esempi come il più importante dei predittori. Ho anche indicato che per il mio set di predittori ottengo meno del 30% di errore di predizione - non un cattivo risultato, dovrei dire.

Ma ancora una volta: questo risultato è ottenuto perché sono in grado di filtrare i predittori e lasciare fuori quelli che sono "rilevanti" per la variabile obiettivo. Nel mio esempio, alla ZZ. Ma per il mio metodo l'obiettivo non conta, è l'insieme "obiettivo-predittori" che conta.

 
SanSanych Fomenko:

A parte questo, ho anche sottolineato che per me personalmente, per il set di predittori che ho, ottengo un errore di predizione inferiore al 30% - un ottimo risultato, dovrei dire.

Ma ancora una volta: questo risultato è ottenuto perché sono in grado di filtrare i predittori e lasciare fuori quelli che sono "rilevanti" per la variabile obiettivo. Nel mio esempio, alla ZZ. Ma per il mio metodo l'obiettivo non è importante, lo è l'intero insieme di "target-predittori".

Non è un cattivo risultato, è fantastico, sono sicuro che nemmeno Renaissance ce l'ha, con i suoi terabyte di dati al giorno. Guardate il live-score su numer.ai e pensate perché loro hanno almeno il 45% di errore(logloss~0.69) e voi il 30%.

Ma quello che dici è vero, hai creato la tua funzione target sintetica, che è funzionalmente legata alle caratteristiche in un modo intelligente (ovviamente non ovvio per te) e hai una così bella scansione su Lorn e test e tutto sembra giusto... Ma perché non sei ancora miliardario, anche se potresti facilmente diventarlo in circa un anno se avessi il 30% di errore nel predire il prossimo colore della candela, perché non prevedi il futuro ma il passato mescolato al futuro tramite indicatore. Provate a prevedere un rendimento futuro puro e tutto andrà a posto.

 
Aliosha:

Non è un cattivo risultato, è un risultato fantastico, sono sicuro che nemmeno Renaissance ce l'ha vicino, con i suoi terabyte di dati al giorno. Guardate il live-score su numer.ai e pensate perché loro hanno almeno il 45% di errore(logloss~0.69) e voi il 30%.

Ma quello che dici è vero, hai creato la tua funzione target sintetica, che è funzionalmente legata alle caratteristiche in un modo intelligente (ovviamente non ovvio per te) e hai un così bel gauge su Lorn e test, tutto sembra giusto... Ma non sei ancora un miliardario, anche se potresti facilmente diventarlo in circa un anno se avessi il 30% di errore nel predire il prossimo colore della candela, è perché non prevedi il futuro ma il passato mescolato al futuro tramite indicatore. Provate a prevedere un puro rendimento futuro e tutto andrà a posto.

ZZ è una cattiva variabile bersaglio perché l'inizio e la fine della sua spalla hanno lo stesso peso. Se si prende la variabile target PRIMA dell'inversione e DOPO l'inversione ZZ, non sono stato in grado di trovare predittori per una tale variabile target - tutti i predittori a me noti per una tale variabile target sono solo rumore. Ho collaborato con uno dei forumer su questo, lui ha il suo set di predittori, ed entrambi abbiamo lo stesso risultato.

Non un miliardario per una ragione molto semplice: la stima del modello di apprendimento automatico per il mio modello con un obiettivo a ZZ (quel 30%) è irrilevante per i risultati nel tester, poiché quell'errore è distribuito arbitrariamente lungo la spalla ZZ, cioè i falsi segnali si mescolano con quelli veri. Faccio trading di tendenze, sembra, ma prevedo la prossima candela. Per superare questa contraddizione ho un Expert Advisor che ha negoziato con successo per più di un anno e poi il 7 ottobre è saltato su uno stop che fissava il livello massimo di rischio.

Ma questo è il trading di tendenza.

Continui a suggerire il trading dei DIVERSI, non delle tendenze. Questo è un commercio diverso e ci sono modelli meglio progettati per questo - GARCH. Estremamente ben sviluppato, un sacco di strumenti già pronti, un sacco di esempi per il trading nei mercati finanziari, incluso il forex. È quello che sto facendo ora. Partecipa.


PS.

A proposito di guardare avanti sulla ZZ.

Bisogna scrivere con attenzione. Quando ti alleni, sulla cronologia hai sempre un valore fino all'ultima barra all'estrema destra. Questo non è il caso degli EA: sul lato destro di ZZ c'è sempre una spalla non formata, e inoltre, la spalla precedente può anche essere in eccesso. Pertanto, dobbiamo imparare dalla storia. Poi passate a un nuovo file e riaddestratevi man mano che procedete lungo il grafico, tenendo conto solo dei valori ZZ che sono già stati formati. E si tratta di 100 barre o più di ritardo. E non "sbirciare", ma il contrario del ritardo.

 

Riassumo per rendere chiaro a molti ....

Ci sono effettivamente funzioni obiettivo complesse, o piuttosto il ricercatore decide che il problema è nella variabile di uscita e comincia a complicarlo. Succedeva, lo facevo anch'io. Ma con il tempo ho capito che non c'è bisogno di farlo, è sufficiente prevedere il cambiamento dei prezzi e se non può essere fatto con un livello di qualità adeguato, allora nessun output più complicato non salverà la situazione.

Per quanto riguarda la curva di equilibrio, è una conseguenza della qualità dell'allenamento. È il tipo di questa curva che determina la qualità dell'apprendimento. Due condizioni.

Crescitauniforme della curva di equilibrio con un angolo di 45 gradi

Assenza di forti salti e cadute.

Come questo....

 
SanSanych Fomenko:

ZZ è una cattiva variabile bersaglio perché l'inizio e la fine della sua spalla hanno lo stesso peso. Se prendiamo la variabile target PRIMA dell'inversione e DOPO l'inversione ZZ, non ho potuto trovare predittori per tale variabile target - tutti i predittori a me noti per tale variabile target sono solo rumore. Ho collaborato con uno dei forumer su questo, lui ha il suo set di predittori, ed entrambi abbiamo lo stesso risultato.

Non un miliardario per una ragione molto semplice: la stima del modello di apprendimento automatico per il mio modello con un obiettivo a ZZ (quel 30%) è irrilevante per i risultati nel tester, poiché quell'errore è distribuito arbitrariamente lungo la spalla ZZ, cioè i falsi segnali si mescolano con quelli veri. Faccio trading di tendenze, sembra, ma prevedo la prossima candela. Per superare questa contraddizione ho un Expert Advisor che ha negoziato con successo per più di un anno e poi il 7 ottobre è saltato su uno stop che fissava il livello massimo di rischio.

Ma questo è il trading di tendenza.

Continui a suggerire il trading dei DIVERSI, non delle tendenze. Questo è un commercio diverso e ci sono modelli meglio progettati per questo - GARCH. Estremamente ben sviluppato, un sacco di strumenti già pronti, un sacco di esempi per il trading nei mercati finanziari, incluso il forex. È quello che sto facendo ora. Partecipa.


PS.

A proposito di guardare avanti sulla ZZ.

Bisogna scrivere con attenzione. Quando ti alleni, sulla cronologia hai sempre un valore fino all'ultima barra all'estrema destra. Questo non è il caso degli EA: sul lato destro di ZZ c'è sempre una spalla non formata, e inoltre, la spalla precedente può anche essere sovraccaricata. Pertanto, dobbiamo imparare dalla storia. Poi passate a un nuovo file e riaddestratevi man mano che procedete lungo il grafico, tenendo conto solo dei valori ZZ che sono già stati formati. E si tratta di 100 barre o più di ritardo. E non "sbirciare", ma il contrario del ritardo.


Per quanto riguarda l'incoerenza di "tester" e risultati di previsione che ho scritto sopra, se prevedo i ritorni, tutto si adatta perfettamente, ho pensato a lungo, ma non sono sicuro di avere il tempo di formalizzare matematicamente la funzione di dipendenza della previsione ML in Sharpe ratio, sono sicuro che riflette in modo univoco, perché la relazione empirica è piuttosto univoca. Tecnicamente il risultato del "tester" non è molto diverso da una semplice convoluzione (prodotto scalare) di un certo numero di previsioni sui rendimenti realizzati (perdonatemi gli HFT), di conseguenza più le previsioni sono correlate con i rendimenti migliori sono i risultati del tester, il vero differisce nei costi di trading. Naturalmente tale funzione (predict2Sharp) non sarà di precisione, ma di logloss, poiché il numero di indovinelli di per sé è meno importante che moltiplicato per i ritorni che sono stati indovinati.


A proposito di GARCH per quanto ne so è un modello lineare per prevedere la volatilità, non prevede la direzione del mercato, o mi sbaglio?

 
Aliosha:

Per quanto riguarda l'incoerenza dei risultati "tester" e le previsioni ho scritto sopra perché, se si prevede ritorni, tutto si adatta perfettamente, per un lungo tempo matura idea, ma non riesco a ottenere il tempo, matematicamente formalizzare la funzione di dipendenza previsione ML in Sharpe ratio, sono sicuro che c'è una visualizzazione univoca, perché il rapporto empirico è abbastanza inequivocabile. Tecnicamente il risultato del "tester" non è molto diverso da una semplice convoluzione (prodotto scalare) di un certo numero di previsioni sui rendimenti realizzati (perdonatemi gli HFT), di conseguenza più le previsioni sono correlate con i rendimenti migliori sono i risultati del tester, il vero differisce nei costi di trading. Naturalmente tale funzione (predict2Sharp) non sarà di precisione, ma di logloss, poiché il numero di indovinelli di per sé è meno importante che moltiplicato per i ritorni che sono stati indovinati.


A proposito di GARCH per quanto ne so è un modello lineare per prevedere la volatilità, non prevede la direzione del mercato, o mi sbaglio?


Confesso che ho cercato di usare i coefficienti di Sharpe, Sortino, ecc. per classificare un segnale dalla strategia sottostante e sono arrivato alla conclusione che tutti questi coefficienti sono la conseguenza della strategia sottostante. Cioè il risultato di Sharp è esattamente lo stesso, perché il segnale ha chiuso con tale e tale profitto e non sull'overrun..... Anche se non sono un buon programmatore, quindi potrei aver calcolato questi coefficienti per errore. Ma il mio Sharp era nell'intervallo da -2 a 2. Quindi penso di aver capito bene....

 
Mihail Marchukajtes:

Confesso che ho cercato di usare Sharpe, Sortino, ecc. per classificare il segnale dalla strategia sottostante e sono arrivato alla conclusione che tutti questi coefficienti sono una conseguenza della strategia sottostante. Cioè il risultato di Sharp è esattamente lo stesso, perché il segnale ha chiuso con tale e tale profitto e non sull'overrun..... Anche se non sono un buon programmatore, quindi potrei aver calcolato questi coefficienti per errore. Ma il mio Sharp era nel range da -2 a 2, quindi penso di aver capito bene....

Ci sono molti SR generici là fuori, ma il classico SR è la metrica più semplice e comune per valutare la performance di una strategia/trader/fondo. SR <1,5 è considerato una merda, >=2 è ottimo!

SR è grosso modo il rapporto tra profitto e rischio, in termini quantitativi.
 
Aliosha:

Ci sono molti SR generici, ma il classico SR è la metrica più semplice e più comune per valutare la performance della strategia dei fondi di un trader. SR <1,5 è considerato inquietante, >=2 è ottimo!

SR è grosso modo il rapporto tra profitto e rischio, quantitativamente parlando.

In linea di principio, non ha importanza. C'è zero potere predittivo lì....

Motivazione: