L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1255

 
Maxim Dmitrievsky:

Se il mercato è più o meno stabile, una tendenza o qualcosa del genere, allora questa volta funzionerà, almeno per me... i modelli sono gli stessi, perché no?

Ho semplificato la curva di apprendimento alla pressione di un pulsante e non ho bisogno di alcun predittore )) è una macchina dall'aspetto divertente, potrei venderla come una mostra della follia umana

Beh, non mi sono preoccupato dei predittori per cominciare. Non ho nemmeno provato con un solo pulsante, però. Con un pulsante non ho altro che la stessa ottimizzazione, solo nel profilo. Come lo si aggiri con un solo pulsante è un mistero).

 
Yuriy Asaulenko:

Beh, non mi sono preoccupato dei predittori per cominciare. Ma non ho nemmeno provato con un solo pulsante. Non posso fare nulla con un pulsante, tranne la stessa ottimizzazione, solo nel profilo. Come si fa ad aggirarlo con un solo pulsante è un mistero).

Sto solo cercando di trovare il miglior errore nel mio campione di prova, tutto qui

ottimizzatore ottimizzatore aha
 
Maxim Dmitrievsky:

Monte Carlo e cercando il miglior errore nel campione di prova, questo è tutto.

Non posso fare a meno di Monte Carlo). Ma l'errore migliore non è così semplice. L'ottimalità è una cosa di molti fattori e ambigua, e ciò che è l'optimum è tutt'altro che ovvio.

 
Yuriy Asaulenko:

Non si può fare a meno di Monte Carlo). E non è così semplice con il miglior errore. L'ottimalità è una cosa multifattoriale e ambigua, e ciò che è l'optimum è tutt'altro che ovvio.

Capisco. Prendo qualsiasi equazione periodica in cui l'optimum è evidente e il sistema ci guadagnerà almeno per sempre).

Non c'è un optimum nel mercato, solo quelli locali

 
 

Leggere la teoria sugli alberi.
Sto pensando alla potatura (potatura).

È possibile utilizzare la seguente semplice regola: costruire un albero, tagliare o sostituire con un sottoalbero quei rami che non porteranno ad un aumento dell'errore.

Forse è più facile e veloce costruire un albero senza potare una foglia, a meno che non si trovi una divisione che riduca l'errore di almeno qualche valore, per esempio 0,1-0,5%?
Il risultato dovrebbe essere lo stesso, ma più veloce.

O è possibile che dopo un paio di rami con un miglioramento del modello dello 0,0001% se ne trovi uno che lo migliori dell'1-5% in una volta sola?

 
Maxim Dmitrievsky:

Quanto più veloce? È già molto veloce.

E tu costruirai il tuo boosting, vero?

I metodi bayesiani sono lenti e non per grandi campioni, ma funzionano in modo diverso e non vengono riqualificati fuori dalla scatola. Ogni modello ha le sue specificità. Mi sto appassionando a Bayesian, grande potere di ottimizzare TC senza riqualificazione.

Buona prospettiva - possono essere aggiornati piuttosto che riqualificati

Se hai un milione di stringhe con 200-1000 predittori, probabilmente è molto tempo...
La potatura richiede la costruzione dell'albero fino alla fine e poi la potatura.
E con l'arresto della ramificazione per miglioramento dell'errore minimo, penso che ci sarebbe un risparmio significativo con un risultato simile. In xgboost il parametro si chiama gamma, ma non sembra esserci alcuna potatura. A quanto pare gli sviluppatori hanno anche deciso che queste cose sono intercambiabili.
 
elibrario:
Beh, se un milione di minuti di linee con 200-1000 predittori, è probabilmente molto tempo...
E con la potatura - bisogna costruire l'albero fino alla fine, poi potarlo.
E con l'arresto della ramificazione per miglioramento dell'errore minimo, penso che ci sarà un risparmio significativo con un risultato simile. In xgboost il nome del parametro è gamma, ma non sembra esserci alcuna potatura. A quanto pare gli sviluppatori hanno anche deciso che queste cose sono intercambiabili.

Beh, sanno come farlo, ci sono squadre di specialisti che lavorano sui boost, testano

il catbust sembra funzionare bene, è veloce, gli alberi sono poco profondi per cominciare

milioni di dati in forex... Dubito che sia necessario

 
A proposito, ho trovato una situazione in cui la prima divisione migliora appena l'errore e la seconda divisione lo migliora del 100%.

4 settori con 10 punti ciascuno. 1 divisione o lungo l'asse x o l'asse y. Quasi non migliorerà l'errore, rimarrà intorno al 50%. Per esempio, prima spacca in mezzo verticalmente. Una seconda spaccatura a metà in senso orizzontale porterà a un miglioramento molto forte dell'errore (dal 50% a zero).
Ma questa è una situazione creata artificialmente, non succede nella vita.
 
Le dimensioni del campione non sono mai grandi. Se N è troppo piccolo per ottenere una stima sufficientemente precisa, è necessario ottenere più dati (o fare più ipotesi). Ma una volta che N è "abbastanza grande", si può iniziare a suddividere i dati per saperne di più (per esempio, in un sondaggio d'opinione, una volta che si ha una buona stima per l'intero paese, si può stimare tra uomini e donne, settentrionali e meridionali, diversi gruppi di età, ecc.) N non è mai abbastanza perché se fosse "abbastanza" sareste già al prossimo problema per il quale avete bisogno di più dati.
Motivazione: