L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2215

 

Torniamo alla questione della visualizzazione del modello CatBoost, per analizzare la sua prospettiva.

Questo è l'aspetto del modello sul campione di allenamento:

L'asse x è il valore di probabilità della funzione logistica, e l'asse y è la percentuale su un intervallo di valori di 0,05:

- Razdel(blu) - tutti i valori del campione.

- Target=1(magnete) - valori target 1

- Target=0(aqua) - valori target 0

- Balans+(azzurro) - il risultato finanziario che ha portato al profitto rispetto a tutti i profitti e le perdite, questo valore è scalato per adattarsi al grafico

- Balans-(mattone) - risultato finanziario che ha portato alla perdita riguardante tutti i profitti e le perdite, questo valore è scalato per adattarsi al grafico

- Cerchi - questo è il valore di equilibrio in scala - ci concentriamo su un valore zero dal valore zero della coordinata x - fatto per illustrazione

Linea verticale dell'acqua - valore massimo Target=0

Linea verticale del magnete - valore massimo di Target=1

Linea verticale in rosso - divisione condizionale di 0,5 per la classificazione a 1 e 0 di default in CatBoost - per chiarezza.

Suppongo che più le linee dell'acqua e del magnete sono distanti dalla linea verticale rossa, più il modello è sicuro nel separare le classi. Vale anche la pena di osservare le linee di bilancio, durante l'allenamento sono anche distanziate su entrambi i lati - è particolarmente rilevante per i modelli in cui profitto e perdita possono avere valori diversi, così, per esempio, un modello può filtrare bene le piccole perdite ma perdere sulle grandi perdite, anche se secondo il valore di precisione di classificazione sarà più di 0,5.

Inoltre guardiamo il campione di prova

Possiamo vedere che le linee verticali - rosso e magnetite - sono diventate più vicine, ma la loro posizione relativa non è cambiata, il che è già buono (succede che la magnetite è nella zona di <0,5). Le linee di equilibrio si sono avvicinate, il che è deludente. C'è un'area di perdita dopo la probabilità 0,5, il che suggerisce che il modello è di qualità insufficiente.

Inoltre possiamo guardare i risultati sul campione di prova.

Sul lato destro (probabilità superiore a 0,5) la situazione sembra migliore rispetto al campione di prova, può indicare che il campione di prova è un evento raro e ci sono stati pochi esempi simili ad esso in formazione, o il modello non è completamente addestrato. A favore di quest'ultima ipotesi c'è il fatto che ci sono regioni in cui la linea di equilibrioBalans+, che indica risultati finanziari positivi, interseca la lineaBalans-, che può essere vista anche guardando i cerchi che indicano il delta tra il profitto e la perdita in una certa zona di probabilità, nellazona di probabilità inferiore a 0,5.

Bene, guardiamo il saldo del campione d'esame.

Si può vedere chiaramente che il carattere del mercato è cambiato, che può essere visto su 2/3 del grafico - dovremmo continuare a studiare il modello.

Ed ecco un esempio di un modello chiaramente cattivo

Già sul campione di prova si può vedere un forte spostamento dell'intero corpo verso la parte sinistra, cioè il modello conosce molto poco del campione - la completezza è bassa, e il picco di accumulazione del target 1 è dietro la parte sinistra della probabilità. Vale la pena notare che c'è ancora un guadagno sull'apprendimento.

Diamo un'occhiata al test e al campione d'esame

Già sul campione di prova possiamo vedere che tutte le linee al di fuori della probabilità 0,5 sono molto vicine, e sul campione di prova possiamo vedere come le linee di equilibrio si sono scambiate di posto.

 
mytarmailS:


Fondamentalmente ho una rete vuota (la alleno solo in modo che possa essere inizializzata perché non è auto-scritta, ma da un pacchetto)


Posso pensare a qualsiasi astrazione, qualsiasi obiettivo e scrivere una funzione di fitness.

Poi lasciare che la genetica inizi a cambiare i pesi della rete in modo che al treno e nel test io (rete) riceva qualcosa di simile al mio obiettivo.


E questo è mille volte" più profondo della creazione dei tag e del montaggio della regressione o della classificazione.

sei tornato indietro di 2 anni quando stavamo condannando l'allenamento dei neuroni con l'ottimizzatore mt5

E io stavo scrivendo questi bot. È un'ottimizzazione comune con un mucchio di parametri.

Guarda un po'.

https://www.mql5.com/ru/articles/497

Нейронные сети - от теории к практике
Нейронные сети - от теории к практике
  • www.mql5.com
В наше время, наверное, каждый трейдер слышал о нейронных сетях и знает, как это круто. В представлении большинства те, которые в них разбираются, это какие-то чуть ли не сверхчеловеки. В этой статье я постараюсь рассказать, как устроена нейросеть, что с ней можно делать и покажу практические примеры её использования. Понятие о нейронных сетях...
 
Maxim Dmitrievsky:

sei tornato indietro di 2 anni quando c'era la condanna dell'allenamento dei neuroni attraverso l'ottimizzatore mt5

E io stavo scrivendo questi bot. Questa è un'ottimizzazione comune con molti parametri.

continua a leggere.

https://www.mql5.com/ru/articles/497

L'ho provato con max profit, posso allenarlo con qualcos'altro


Ascolta, se non sei troppo pigro, prova ad allenare catbust su max profit, non sono sicuro di come funziona lì

dovete alimentare i dati X e Y allo stesso tempo

forse tutta questa "personalizzazione" è solo una modifica estetica delle funzioni esistenti

 
Aleksey Vyazmikin:

Torniamo alla questione della visualizzazione del modello CatBoost, per analizzare la sua prospettiva.

Penso che sia meglio pubblicare ricerche così grandi in un blog e una copia qui. Sei mesi dopo non lo troverete qui...
 
elibrarius:
Penso che grandi studi come questo dovrebbero essere bloggati e copiati qui. Non potrai trovarlo qui tra sei mesi...

Forse - è solo che non uso un blog, quindi non mi è venuto in mente.

Sto pensando che posso mettere tutti questi punti del grafico (20 per curva) in un campione e cercare di imparare - forse in questo modo possiamo identificare con una maggiore probabilità i modelli con potenziale stabilità.

 
Aleksey Vyazmikin:

Forse - è solo che non uso il blog, quindi non mi è venuto in mente.

Sto pensando che posso mettere tutti questi punti del grafico (20 per curva) in un campione e cercare di imparare - forse in questo modo saremo in grado di identificare con una maggiore probabilità i modelli con potenziale stabilità.

Quale sarà l'obiettivo? Come segnare ogni esempio? O per autoapprendimento?
 
elibrarius:
Quale sarà l'obiettivo? Come segnare ciascuno degli esempi? O per autoapprendimento?

L'obiettivo sarebbe il risultato finanziario del modello sul campione d'esame.

 
mytarmailS:

Sto solo cercando di massimizzare il profitto, potrei allenarmi per qualcos'altro.


Ascolta, se non sei troppo pigro, prova ad allenare katbust su max profit, non sono sicuro che funzioni lì

dovete alimentare i dati X e Y allo stesso tempo

forse tutta questa "personalizzazione" è solo un cambiamento cosmetico alle funzioni esistenti

troppo pigro per scrivere nuove metriche... e sicuramente non sarà il massimo profitto, ma qualcosa di più significativo

ad esempio la stabilità di Lyapunov ))

 
Maxim Dmitrievsky:

troppo pigro per scrivere nuove metriche ancora... e non sarà sicuramente il massimo profitto allora, ma qualcosa di più significativo

come la stabilità di Lyapunov )))

Non hai bisogno di un campo livellato, o di densità))). Nel nostro mestiere è raro.

 
Aleksey Vyazmikin:

Torniamo alla questione della visualizzazione del modello CatBoost, per analizzare la sua prospettiva.

Sì, le distribuzioni di solito mostrano tutto. Si può semplicemente fare questi per i segni, non ci sono incrementi e vedere immediatamente

Motivazione: