L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2107

 
elibrarius:
È così che dovrebbe essere. Il bilanciamento per classe NS è necessario. Gli alberi si possono gestire così com'è.

Beh, non lo fanno sempre - l'ho scritto prima.

 

Sembra che io abbia bruciato un Expert Advisor redditizio (approccio formativo) nel mio articolo:

Il grafico mostra il risultato finanziario del modello alla fine di ogni mese, se si allena il primo modello su 12 mesi e poi si aggiunge la storia di ogni nuovo mese - incollando il contratto futures Si su USDRUB_TOM.

 
Aleksey Vyazmikin:

Beh, non sempre ce la fanno - l'ho scritto prima.

Penso che aumentare la profondità degli alberi aiuterà tanto quanto il bilanciamento.
 
Aleksey Vyazmikin:

Sì, essenzialmente aggiungendo rumore agli indici predittivi. Questo può influenzare i confini di quantizzazione aumentando la selezione delle aree con uno, ma per idea lo stesso effetto dovrebbe essere con l'aggiunta di duplicati, solo che presumo che i duplicati siano tagliati dall'algoritmo CatBoost prima dell'inizio della formazione (bisogno di verificare), allora sì è un'opzione.

Più probabilmente la quantizzazione annullerà quel rumore. Se una colonna ha 10000 valori diversi, quantizzando a 255 quanti si otterrà una media di 40 valori diversi in un quanto. O un altro esempio - se c'erano originariamente 1000 esempi, aggiungete il rumore ottenendo 10000 esempi, poi quantizzate a 255 diversi quanti/valori - lavoro inutile secondo me con questa aggiunta di rumore.


Hanno guardato il codice di recente - non ho visto nessuna rimozione duplicata. Piuttosto il contrario, i duplicati vengono rimossi da 40 campioni diversi e fusi in 1 quantum.

 
elibrarius:
Penso che aumentare la profondità degli alberi aiuterà tanto quanto il bilanciamento.

Puoi provare anche ad aumentare la profondità. Dovreste anche diminuire il tasso di apprendimento in parallelo - migliora anche i risultati sui campioni sbilanciati.

elibrarius:

Piuttosto la quantizzazione annullerà questo rumore. Se una colonna ha 10000 valori diversi, quantizzando a 255 quanti si ottiene una media di 40 valori diversi in una singola quantizzazione. O un altro esempio - se in origine c'erano 1000 esempi, aggiungete del rumore ottenendo 10000 esempi, poi quantizzate il tutto a 255 diversi quanti/valori - lavoro inutile secondo me con questa aggiunta di rumore.

Ci sono diversi metodi di quantizzazione utilizzati, tra cui la presa in considerazione dell'affollamento degli oggetti nella gamma.

elibrario:

Hanno guardato il codice di recente - non ho visto nessuna rimozione duplicata. Piuttosto l'opposto, da 40 esempi diversi i duplicati sono fatti combinando in 1 quantum.

Se hai trovato il processo di quantizzazione (impostazione dei limiti) nel codice, puoi postare questo codice? Ci devono essere delle funzioni lì?

 

Cosa c'entra il miglioramento della profondità?

avete una grande nuvola di punti di una classe e alcuni campioni dell'altra con fianco a fianco (o forse anche dentro) che non vengono mai eseguiti.

La seconda classe deve essere gonfiata ad una dimensione sana, o usare algoritmi di classificazione di una classe

 
Maxim Dmitrievsky:

Cosa c'entra il miglioramento della profondità?

si ha una grande nuvola di punti di una classe e alcuni campioni di un'altra con lato a lato (o forse anche all'interno) che non si eseguono mai.

La seconda classe deve essere gonfiata ad una dimensione sana

Aumentare la profondità aiuterà a evidenziare le aree con un piccolo numero di campioni nelle foglie, un'altra cosa è che la percentuale di foglie con zeri può rimanere la stessa, e quindi gli alberi successivi oscureranno nuovamente quelle unità. Quando si addestrano tali campioni, si può vedere come il Recall va a zero a metà dell'addestramento, e poi torna di nuovo a piccole percentuali.

Si può gonfiare se do un campione? Se il metodo funziona, allora penserò a come implementarlo in MT5.

 
Aleksey Vyazmikin:

Aumentare la profondità aiuterà a evidenziare le aree con un piccolo numero di campioni nelle foglie, un'altra cosa è che la percentuale di foglie con zeri può rimanere la stessa, e quindi gli alberi successivi oscureranno nuovamente quelle unità. Quando si addestrano tali campioni, si può vedere come il Recall va a zero a metà dell'addestramento, e poi torna di nuovo a piccole percentuali.

Si può gonfiare se do un campione? Se il metodo funziona, allora penserò a come implementarlo in MT5.

Sono tutte stronzate di foglie e cose del genere. Le classi devono essere equilibrate
 
Maxim Dmitrievsky:
Posso. Sono tutte stronzate sulle foglie e cose del genere. Le classi devono essere equilibrate.

Ecco un esempio - diviso in 3 parti, ho capito che solo train.csv deve essere modificato?

Colonna obiettivo "Target_100" - le ultime 4 colonne non sono coinvolte nella formazione (puoi concentrarti sulla colonna della data lì) - ne hai bisogno per costruire il bilancio.

Файл из Облака Mail.ru
Файл из Облака Mail.ru
  • cloud.mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
 
Aleksey Vyazmikin:

Sembra che io abbia bruciato un Expert Advisor redditizio (approccio formativo) nel mio articolo:

Il grafico mostra il risultato finanziario del modello alla fine di ogni mese, se si allena il primo modello su 12 mesi e poi si aggiunge la storia di ogni nuovo mese - incollando il contratto futures Si su USDRUB_TOM.

l'equilibrio redditizio sale con lo stesso angolo

o geometricamente se reinvestito

Motivazione: