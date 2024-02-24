L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1305
Cambiamento delle prestazioni in funzione dello spostamento della soglia di "probabilità" per la classificazione 0/1 da 0,45 a 0,65
Essenzialmente la precisione
Gli istogrammi mostrano che l'aumento della precisione di classificazione avviene in modo abbastanza regolare con uno spostamento della soglia di probabilità per la classificazione, cosa che non si può dire per i profitti.
Si scopre che non dobbiamo solo considerare l'efficienza della classificazione, ma anche stimare come i profitti sono distribuiti tra le regole (foglie) e qual è la loro soglia di sensibilità. In altre parole, in qualunque modo la si guardi, bisogna tirare fuori le regole individuali e dare loro una stima.
sega)
C'è una confusione generale sulla terminologia.
Che dire della convalida incrociata? tutti i sabbioni sono coinvolti, quindi la convalida è meglio del test.
Comunque, sì, come vuoi. Il mio test è la 2a parte del sottocampione, ma lo chiamerò allora convalida
I profitti sono minori a 0,65 perché ci sono meno scambi. Per esempio, invece di 100, ci saranno 10 scambi. Potete aumentare il lotto
Alzare la soglia, quando il modello va male ci saranno sempre meno accordi sui nuovi dati, le probabilità rotoleranno intorno allo zero, è un buon momento per il retrainingper aumentare le soglie, l'errore deve essere basso, altrimenti non ci saranno segnali
I profitti sono minori a 0,65 perché ci sono anche meno scambi. Per esempio invece di 100 avremo 10 trade. possiamo aumentare la dimensione del lotto.
Il numero di trade, e di trade redditizi, varia in modo abbastanza regolare (un trade è un trade/2 secondo la logica di MT)
La perdita non è stabile per ogni trade, perché lo stop loss non è fisso.
sega)
Nel complesso, la terminologia è confusa
Propongo la mia terminologia (mi atterrò ad essa per ora):
1. Campione di allenamento - quello in cui avviene la creazione del modello
2. campione di prova - utilizzato per controllare la qualità dell'addestramento del modello, compresa l'interruzione dell'addestramento
3. campione d'esame - utilizzato per la stima della qualità del modello, indipendente dalla formazione
Alzare la soglia, quando il modello si deteriora ci saranno sempre meno scambi sui nuovi dati, le probabilità gireranno intorno allo zero, questo è un buon momento per il retrainingAvete bisogno di un errore basso per alzare le soglie, altrimenti non ci sarà nessun segnale
Sì, è comprensibile. È solo che i segnali scompaiono a causa della mancanza di connessioni di riproduzione nelle foglie, specialmente se il loro grande totale di attivazione ruota intorno a 0,5 e sembra una somma di 0,1+0,05+0,08+0,25+0,03 - una delle somme è caduta e basta, non succede nessuna attivazione.
Questo è comprensibile. Solo i segnali scompaiono a causa della mancanza di legami di riproduzione nelle foglie, soprattutto se la loro grande parte di attivazione totale ruotata intorno a 0,5, e sembrava la somma di 0,1+0,05+0,08+0,25+0,03 - è caduta una delle somme e tutto, nessuna attivazione si verifica.
Significa che l'algoritmo non si generalizza correttamente ai nuovi dati, è necessario torcerlo ulteriormente) approssimativamente - riqualificato
10% di errore per test e traccia per ~10k esempi, aumenta dolcemente con l'aumento
a questo errore, i modelli hanno iniziato a lavorare su nuovi dati
sulla convalida in modo diverso, si tratta di passare attraverso le opzioniNon rivelo più algoritmi, comunico solo
О! Questo è l'accordo! Quasi come il mio! Te l'avevo detto che non c'era bisogno di ascoltare tutti i tipi di birre e maghi :)
Significa che l'algoritmo non si generalizza bene ai nuovi dati, è necessario torcere-torcere ulteriormente ) approssimativamente - riqualificato
Quindi sto girando e rigirando, non voglio ingannare me stesso :)
Ora aggiungo una nuova dose di predittori...