L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1305

 

Cambiamento delle prestazioni in funzione dello spostamento della soglia di "probabilità" per la classificazione 0/1 da 0,45 a 0,65

Essenzialmente la precisione

Gli istogrammi mostrano che l'aumento della precisione di classificazione avviene in modo abbastanza regolare con uno spostamento della soglia di probabilità per la classificazione, cosa che non si può dire per i profitti.

Si scopre che non dobbiamo solo considerare l'efficienza della classificazione, ma anche stimare come i profitti sono distribuiti tra le regole (foglie) e qual è la loro soglia di sensibilità. In altre parole, in qualunque modo la si guardi, bisogna tirare fuori le regole individuali e dare loro una stima.

 
elibrario:
sega)
C'è una confusione generale sulla terminologia.

Che dire della convalida incrociata? tutti i sabbioni sono coinvolti, quindi la convalida è meglio del test.

Comunque, sì, come vuoi. Il mio test è la 2a parte del sottocampione, ma lo chiamerò allora convalida

 
Aleksey Vyazmikin:

Cambiamento delle prestazioni in funzione dello spostamento della soglia di "probabilità" per la classificazione 0/1 da 0,45 a 0,65

Essenzialmente la precisione

Gli istogrammi mostrano che l'aumento della precisione di classificazione avviene in modo abbastanza regolare con uno spostamento della soglia di probabilità per la classificazione, cosa che non si può dire per i profitti.

Si scopre che non dobbiamo solo considerare l'efficienza della classificazione, ma anche stimare come i profitti sono distribuiti tra le regole (foglie) e qual è la loro soglia di sensibilità. Non importa come la tagli, devi estrarre le regole individuali e stimarle.

I profitti sono minori a 0,65 perché ci sono meno scambi. Per esempio, invece di 100, ci saranno 10 scambi. Potete aumentare il lotto

 
Aleksey Vyazmikin:

Cambiamento delle prestazioni in funzione dello spostamento della soglia di "probabilità" per la classificazione 0/1 da 0,45 a 0,65

Essenzialmente la precisione

Gli istogrammi mostrano che l'aumento della precisione di classificazione avviene in modo abbastanza regolare con uno spostamento della soglia di probabilità per la classificazione, cosa che non si può dire per i profitti.

Si scopre che non dobbiamo solo considerare l'efficienza della classificazione, ma anche stimare come i profitti sono distribuiti tra le regole (foglie) e qual è la loro soglia di sensibilità. Quindi, non importa come la giri, devi tirare fuori le regole individuali e dare loro una stima.

Alzare la soglia, quando il modello va male ci saranno sempre meno accordi sui nuovi dati, le probabilità rotoleranno intorno allo zero, è un buon momento per il retraining

per aumentare le soglie, l'errore deve essere basso, altrimenti non ci saranno segnali
 
elibrario:

I profitti sono minori a 0,65 perché ci sono anche meno scambi. Per esempio invece di 100 avremo 10 trade. possiamo aumentare la dimensione del lotto.

Il numero di trade, e di trade redditizi, varia in modo abbastanza regolare (un trade è un trade/2 secondo la logica di MT)

La perdita non è stabile per ogni trade, perché lo stop loss non è fisso.

 
elibrario:
sega)
Nel complesso, la terminologia è confusa

Propongo la mia terminologia (mi atterrò ad essa per ora):

1. Campione di allenamento - quello in cui avviene la creazione del modello

2. campione di prova - utilizzato per controllare la qualità dell'addestramento del modello, compresa l'interruzione dell'addestramento

3. campione d'esame - utilizzato per la stima della qualità del modello, indipendente dalla formazione

 
Maxim Dmitrievsky:

Alzare la soglia, quando il modello si deteriora ci saranno sempre meno scambi sui nuovi dati, le probabilità gireranno intorno allo zero, questo è un buon momento per il retraining

Avete bisogno di un errore basso per alzare le soglie, altrimenti non ci sarà nessun segnale

Sì, è comprensibile. È solo che i segnali scompaiono a causa della mancanza di connessioni di riproduzione nelle foglie, specialmente se il loro grande totale di attivazione ruota intorno a 0,5 e sembra una somma di 0,1+0,05+0,08+0,25+0,03 - una delle somme è caduta e basta, non succede nessuna attivazione.

 
Aleksey Vyazmikin:

Questo è comprensibile. Solo i segnali scompaiono a causa della mancanza di legami di riproduzione nelle foglie, soprattutto se la loro grande parte di attivazione totale ruotata intorno a 0,5, e sembrava la somma di 0,1+0,05+0,08+0,25+0,03 - è caduta una delle somme e tutto, nessuna attivazione si verifica.

Significa che l'algoritmo non si generalizza correttamente ai nuovi dati, è necessario torcerlo ulteriormente) approssimativamente - riqualificato

 
Maxim Dmitrievsky:

10% di errore per test e traccia per ~10k esempi, aumenta dolcemente con l'aumento

a questo errore, i modelli hanno iniziato a lavorare su nuovi dati

sulla convalida in modo diverso, si tratta di passare attraverso le opzioni

Non rivelo più algoritmi, comunico solo

О! Questo è l'accordo! Quasi come il mio! Te l'avevo detto che non c'era bisogno di ascoltare tutti i tipi di birre e maghi :)

 
Maxim Dmitrievsky:

Significa che l'algoritmo non si generalizza bene ai nuovi dati, è necessario torcere-torcere ulteriormente ) approssimativamente - riqualificato

Quindi sto girando e rigirando, non voglio ingannare me stesso :)

Ora aggiungo una nuova dose di predittori...