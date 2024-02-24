L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2564
Questo è quello che ho scritto - con l'obiettivo di identificare un modello coerente che dà un vantaggio statistico in un sito particolare. E quantifichiamo i predittori - qualsiasi predittatore.
Ma "come" farlo è una questione aperta - finora solo attraverso l'enumerazione di tabelle preparate, fatte su ipotesi empiriche o partizionamento statistico dell'algoritmo CatBoost.
Nella figura 3 "quanta" - molto probabilmente viene scelta la gamma media, sulla quale c'è qualche vantaggio statistico.
Qualcuno ha provato a collegare il paradosso di montichol al trading/decisione?
La mia comprensione è che c'è un problema di collinearità (correlazione) di quasi tutti i predittori. C'è anche un problema combinatorio - se ci sono molti predittori, allora ci possono essere troppi quanti. Potrebbe valere la pena di abbassare la dimensionalità tramite PCA o PLS prima.
Ho scritto sopra che escludo i predittori che hanno un segnale simile nel campione, cioè la correlazione tra predittori quantili diminuisce, anche se uso il mio metodo di raggruppare e selezionare il miglior risultato da un gruppo di simili.
Per quanto riguarda il problema combinatorio - dove lo vedi esattamente? Nel campione di allenamento? Se è così, allora teoricamente può essere, e probabilmente ha senso applicare la PCA qui, ma non prima che il campione finale sia pronto. Non ho ancora riscontrato un tale problema; al contrario, ci sono meno predittori che nel campione iniziale.
Il paradosso è che il problema non è completamente formalizzato matematicamente. La risposta è diversa, a seconda di come viene effettuata la formalizzazione completa.
Nel senso di utilità - se non come esempio istruttivo che per un fenomeno reale possono esserci diversi modelli matematici che danno risposte diverse.
Come?
Com'è?
È come il problema con 2 fiaschi, le condizioni sono incomplete e si può indovinare il resto delle condizioni e ottenere la risposta.
Com'è?
Guardate il wiki, dice che la formulazione iniziale non è corretta e non dice chiaramente che può essere resa corretta in diversi modi. L'essenza del paradosso è precisamente che l'intuizione riempie la reticenza iniziale in modi diversi per persone diverse. Un effetto puramente psicologico.
È come il problema dei due fiaschi, le condizioni sono incomplete, la risposta sarà come si immagina il resto delle condizioni.
Non capisco, ma diamo la colpa al mio analfabetismo...
Quindi, in poche parole, qual è il senso di questa merda?
Ho letto il tuo post, costruire l'heurst e cosa fare con esso?
Ho scritto sopra che escludo i predittori che hanno un segnale simile nel campione, cioè la correlazione tra predittori quantili è ridotta, anche se uso il mio metodo di raggruppare e selezionare il miglior risultato da un gruppo di simili.
Per quanto riguarda il problema combinatorio - dove lo vedi esattamente? Nel campione di allenamento? Se è così, allora teoricamente può essere, e probabilmente ha senso applicare la PCA qui, ma non prima che il campione finale sia pronto. Non ho incontrato un tale problema nella realtà - al contrario, ci sono meno predittori che nel campione iniziale.
Bene, se dividiamo ogni predittore in due pezzi e cerchiamo tutte le possibili regole in cui una metà di ogni predittore è inclusa, allora diversi pezzi di questo tipo saranno 2^N, dove N è il numero di predittori. Ora ogni pezzo può essere preso o scartato - otteniamo 2^(2^N) varianti. Questo è un numero enorme anche con una N piccola.
Bene, se dividiamo ogni predittore in due soli pezzi e guardiamo tutte le possibili regole che includono una metà di ogni predittore, allora ci saranno 2^N pezzi diversi, dove N è il numero di predittori. Ora ogni pezzo può essere preso o scartato - otteniamo 2^(2^N) varianti. Questo è un numero enorme anche con N piccoli.
Prima scartare e poi combinare.