L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2564

 
Aleksey Vyazmikin #:

Questo è quello che ho scritto - con l'obiettivo di identificare un modello coerente che dà un vantaggio statistico in un sito particolare. E quantifichiamo i predittori - qualsiasi predittatore.

Ma "come" farlo è una questione aperta - finora solo attraverso l'enumerazione di tabelle preparate, fatte su ipotesi empiriche o partizionamento statistico dell'algoritmo CatBoost.

Nella figura 3 "quanta" - molto probabilmente viene scelta la gamma media, sulla quale c'è qualche vantaggio statistico.

La mia comprensione è che c'è un problema di collinearità (correlazione) di quasi tutti i predittori. C'è anche un problema combinatorio - se ci sono molti predittori, allora ci possono essere troppi quanti. Probabilmente vale la pena di ridurre la dimensionalità prima con PCA o PLS.

 
mytarmailS #:
Qualcuno ha provato a collegare il paradosso di montichol al trading/decisione?

L'intero paradosso è che il problema non è completamente formalizzato matematicamente. La risposta varia a seconda di come viene fatta la formalizzazione completa.

Nel senso di utilità - se non come esempio istruttivo che per lo stesso fenomeno del mondo reale possono esserci diversi modelli matematici che danno risposte diverse.

 
Una cosa divertente. Sto scegliendo i tick sull'herst e sto ottenendo valori sulla scala dello spread molto diversi da 0,5 e più grande è la scala temporale, più l'herst è vicino a 0,5. Ho fatto un sistema primitivo su una maschera e ho sostituito i periodi 10, 100, 1000, 10000. Tutti loro hanno approssimativamente lo stesso payoff atteso. Ecco com'è un mercato efficiente.
 
Aleksey Nikolayev #:

La mia comprensione è che c'è un problema di collinearità (correlazione) di quasi tutti i predittori. C'è anche un problema combinatorio - se ci sono molti predittori, allora ci possono essere troppi quanti. Potrebbe valere la pena di abbassare la dimensionalità tramite PCA o PLS prima.

Ho scritto sopra che escludo i predittori che hanno un segnale simile nel campione, cioè la correlazione tra predittori quantili diminuisce, anche se uso il mio metodo di raggruppare e selezionare il miglior risultato da un gruppo di simili.

Per quanto riguarda il problema combinatorio - dove lo vedi esattamente? Nel campione di allenamento? Se è così, allora teoricamente può essere, e probabilmente ha senso applicare la PCA qui, ma non prima che il campione finale sia pronto. Non ho ancora riscontrato un tale problema; al contrario, ci sono meno predittori che nel campione iniziale.

 
Aleksey Nikolayev #:

Il paradosso è che il problema non è completamente formalizzato matematicamente. La risposta è diversa, a seconda di come viene effettuata la formalizzazione completa.

Nel senso di utilità - se non come esempio istruttivo che per un fenomeno reale possono esserci diversi modelli matematici che danno risposte diverse.

Come?

Ecco un articolo con il codice

Ci sono anche un milione di altre realizzazioni

Tutto formalizzato matematicamente, o mi sfugge il punto?

 
mytarmailS #:

Com'è?

Ecco un articolo con il codice

ci sono anche un milione di altre implementazioni

Tutto è formalizzato matematicamente, o mi sfugge il punto?

È come il problema con 2 fiaschi, le condizioni sono incomplete e si può indovinare il resto delle condizioni e ottenere la risposta.

 
mytarmailS #:

Com'è?

Ecco un articolo con il codice

ci sono anche un milione di altre implementazioni

Tutto è formalizzato matematicamente, o mi sfugge il punto?

Guardate il wiki, dice che la formulazione iniziale non è corretta e non dice chiaramente che può essere resa corretta in diversi modi. L'essenza del paradosso è precisamente che l'intuizione riempie la reticenza iniziale in modi diversi per persone diverse. Un effetto puramente psicologico.

 
Rorschach #:

È come il problema dei due fiaschi, le condizioni sono incomplete, la risposta sarà come si immagina il resto delle condizioni.

Non capisco, ma diamo la colpa al mio analfabetismo...

Quindi, in poche parole, qual è il senso di questa merda?

Ho letto il tuo post, costruire l'heurst e cosa fare con esso?


 
Aleksey Vyazmikin #:

Ho scritto sopra che escludo i predittori che hanno un segnale simile nel campione, cioè la correlazione tra predittori quantili è ridotta, anche se uso il mio metodo di raggruppare e selezionare il miglior risultato da un gruppo di simili.

Per quanto riguarda il problema combinatorio - dove lo vedi esattamente? Nel campione di allenamento? Se è così, allora teoricamente può essere, e probabilmente ha senso applicare la PCA qui, ma non prima che il campione finale sia pronto. Non ho incontrato un tale problema nella realtà - al contrario, ci sono meno predittori che nel campione iniziale.

Bene, se dividiamo ogni predittore in due pezzi e cerchiamo tutte le possibili regole in cui una metà di ogni predittore è inclusa, allora diversi pezzi di questo tipo saranno 2^N, dove N è il numero di predittori. Ora ogni pezzo può essere preso o scartato - otteniamo 2^(2^N) varianti. Questo è un numero enorme anche con una N piccola.

 
Aleksey Nikolayev #:

Bene, se dividiamo ogni predittore in due soli pezzi e guardiamo tutte le possibili regole che includono una metà di ogni predittore, allora ci saranno 2^N pezzi diversi, dove N è il numero di predittori. Ora ogni pezzo può essere preso o scartato - otteniamo 2^(2^N) varianti. Questo è un numero enorme anche con N piccoli.

Prima scartare e poi combinare.