L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2107

 
elibrarius:
È così che dovrebbe essere. Il bilanciamento per classe NS è necessario. Gli alberi si possono gestire così com'è.

Beh, non lo fanno sempre - l'ho scritto prima.

 

Sembra che io abbia bruciato un Expert Advisor redditizio (approccio formativo) nel mio articolo:

Il grafico mostra il risultato finanziario del modello alla fine di ogni mese, se si allena il primo modello su 12 mesi e poi si aggiunge la storia di ogni nuovo mese - incollando il contratto futures Si su USDRUB_TOM.

 
Aleksey Vyazmikin:

Beh, non sempre ce la fanno - l'ho scritto prima.

Penso che aumentare la profondità degli alberi aiuterà tanto quanto il bilanciamento.
 
Aleksey Vyazmikin:

Sì, essenzialmente aggiungendo rumore agli indici predittivi. Questo può influenzare i confini di quantizzazione aumentando la selezione delle aree con uno, ma per idea lo stesso effetto dovrebbe essere con l'aggiunta di duplicati, solo che presumo che i duplicati siano tagliati dall'algoritmo CatBoost prima dell'inizio della formazione (bisogno di verificare), allora sì è un'opzione.

Più probabilmente la quantizzazione annullerà quel rumore. Se una colonna ha 10000 valori diversi, quantizzando a 255 quanti si otterrà una media di 40 valori diversi in un quanto. O un altro esempio - se c'erano originariamente 1000 esempi, aggiungete il rumore ottenendo 10000 esempi, poi quantizzate a 255 diversi quanti/valori - lavoro inutile secondo me con questa aggiunta di rumore.


Hanno guardato il codice di recente - non ho visto nessuna rimozione duplicata. Piuttosto il contrario, i duplicati vengono rimossi da 40 campioni diversi e fusi in 1 quantum.

 
elibrarius:
Penso che aumentare la profondità degli alberi aiuterà tanto quanto il bilanciamento.

Puoi provare anche ad aumentare la profondità. Dovreste anche diminuire il tasso di apprendimento in parallelo - migliora anche i risultati sui campioni sbilanciati.

elibrarius:

Piuttosto la quantizzazione annullerà questo rumore. Se una colonna ha 10000 valori diversi, quantizzando a 255 quanti si ottiene una media di 40 valori diversi in una singola quantizzazione. O un altro esempio - se in origine c'erano 1000 esempi, aggiungete del rumore ottenendo 10000 esempi, poi quantizzate il tutto a 255 diversi quanti/valori - lavoro inutile secondo me con questa aggiunta di rumore.

Ci sono diversi metodi di quantizzazione utilizzati, tra cui la presa in considerazione dell'affollamento degli oggetti nella gamma.

elibrario:

Hanno guardato il codice di recente - non ho visto nessuna rimozione duplicata. Piuttosto l'opposto, da 40 esempi diversi i duplicati sono fatti combinando in 1 quantum.

Se hai trovato il processo di quantizzazione (impostazione dei limiti) nel codice, puoi postare questo codice? Ci devono essere delle funzioni lì?

[Eliminato]  

Cosa c'entra il miglioramento della profondità?

avete una grande nuvola di punti di una classe e alcuni campioni dell'altra con fianco a fianco (o forse anche dentro) che non vengono mai eseguiti.

La seconda classe deve essere gonfiata ad una dimensione sana, o usare algoritmi di classificazione di una classe

 
Maxim Dmitrievsky:

Cosa c'entra il miglioramento della profondità?

si ha una grande nuvola di punti di una classe e alcuni campioni di un'altra con lato a lato (o forse anche all'interno) che non si eseguono mai.

La seconda classe deve essere gonfiata ad una dimensione sana

Aumentare la profondità aiuterà a evidenziare le aree con un piccolo numero di campioni nelle foglie, un'altra cosa è che la percentuale di foglie con zeri può rimanere la stessa, e quindi gli alberi successivi oscureranno nuovamente quelle unità. Quando si addestrano tali campioni, si può vedere come il Recall va a zero a metà dell'addestramento, e poi torna di nuovo a piccole percentuali.

Si può gonfiare se do un campione? Se il metodo funziona, allora penserò a come implementarlo in MT5.

[Eliminato]  
Aleksey Vyazmikin:

Aumentare la profondità aiuterà a evidenziare le aree con un piccolo numero di campioni nelle foglie, un'altra cosa è che la percentuale di foglie con zeri può rimanere la stessa, e quindi gli alberi successivi oscureranno nuovamente quelle unità. Quando si addestrano tali campioni, si può vedere come il Recall va a zero a metà dell'addestramento, e poi torna di nuovo a piccole percentuali.

Si può gonfiare se do un campione? Se il metodo funziona, allora penserò a come implementarlo in MT5.

Sono tutte stronzate di foglie e cose del genere. Le classi devono essere equilibrate
 
Maxim Dmitrievsky:
Posso. Sono tutte stronzate sulle foglie e cose del genere. Le classi devono essere equilibrate.

Ecco un esempio - diviso in 3 parti, ho capito che solo train.csv deve essere modificato?

Colonna obiettivo "Target_100" - le ultime 4 colonne non sono coinvolte nella formazione (puoi concentrarti sulla colonna della data lì) - ne hai bisogno per costruire il bilancio.

Файл из Облака Mail.ru
Файл из Облака Mail.ru
  • cloud.mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
 
Aleksey Vyazmikin:

Sembra che io abbia bruciato un Expert Advisor redditizio (approccio formativo) nel mio articolo:

Il grafico mostra il risultato finanziario del modello alla fine di ogni mese, se si allena il primo modello su 12 mesi e poi si aggiunge la storia di ogni nuovo mese - incollando il contratto futures Si su USDRUB_TOM.

l'equilibrio redditizio sale con lo stesso angolo

o geometricamente se reinvestito