L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 555

 
Maxim Dmitrievsky:

quindi non so cosa credere in questa vita... tutto deve essere ricontrollato.


I benchmark sono la salvezza)))

Varie conversioni e tagli. Quello in alto è il dato grezzo.

train = campionamento rms con sql leggero. test = OOS. time = tempo rms in sec.


 
Per quanto riguarda le emissioni nei set di dati, il mercato potrebbe usare questo metodo.
 

A volte mi chiedo da questo forum. È tutto tranquillo e noioso. E improvvisamente alcune persone come Vladimir o Vizard_ o il più sospettoso podotr appaiono e cominciano a mostrare le lezioni magistrali. Chi sono? Tutti, per favore, mostrate i passaporti e i diplomi di istruzione! :))))

 
SanSanych Fomenko:

Solo i predittori che hanno una RELAZIONE con la variabile obiettivo dovrebbero essere usati. Non importa se "linearmente" o "non linearmente" non ha niente a che vedere con il precisissimo "hanno una relazione".

questo e tutto il resto del testo è chiaro, ma cosa c'entra la correlazione dell'attributo con l'obiettivo in un modello intrinsecamente non lineare?

Ho scritto sul perché è necessario nel modello di regressione, ma non nella classificazione, perché non è il target ma le classi... approfondisci quello che sto scrivendo :)

 
Maxim Dmitrievsky:

questo e tutto il resto del testo è chiaro, ma cosa c'entra la correlazione dell'attributo con l'obiettivo in un modello intrinsecamente non lineare?

e ho scritto perché è necessario nel modello di regressione, ma non nella classificazione, perché non è il target ma le classi... leggete più profondamente quello che sto scrivendo :)


Non ho bisogno di leggere più a fondo - ti capisco perfettamente, ma tu non mi capisci affatto.

Scrivo di overtraining (overfitting) - questo è il principale nemico di tutti i modelli di classificazione. Il comportamento dei modelli overfitted NON è determinato nel futuro.

Per combattere questo male totale, vedo due strumenti:

1. sbarazzarsi del set di predittori in ingresso dal rumore

2. test accurati.

Tutto questo lo scrivo in base ai miei calcoli, vi assicuro di un volume molto grande, che ho fatto per più di un anno.

Sono troppo pigro per cercare e poi formare un psot leggibile, dato che non ho lo scopo di convincere nessuno di niente.


PS.

Lei continua ad insistere sull'innocuità e persino sull'utilità dei predittori di rumore - lei non è il primo, ce ne sono tanti, si chiamano astrologi.

 
SanSanych Fomenko:

Continui a insistere che i predittori del rumore sono innocui e persino utili - non sei il primo, ci sono un sacco di persone così, si chiamano astrologi.


Dove ho scritto una cosa del genere?

 
Maxim Dmitrievsky:

Dove l'ho scritto?

Rileggi il tuo post.

ну это и все далее по тексту понятно, но причем здесь корреляция признака с целевой в изначально нелинейной модели

а я написал зачем она (корреляция) нужна в случае регрессионной, а в классификации нет, потому что там вообще не целевая а классы



Si scopre che ho speculato e credo che il nostro disaccordo si basi su quanto segue:

Lei è contro la correlazione e io non ho mai scritto della correlazione tra la variabile predittiva e quella obiettivo.

Si chiama parlare.

Ho sempre scritto: il predittore deve essere legato alla variabile obiettivo. Non ho mai inteso la correlazione, la regressione lineare e non lineare nel senso della parola"relazione". Inoltre, tutti gli algoritmi di "importanza" predittiva che danno gli algoritmi di classificazione non sono soddisfacenti per me.


Guardate il mio esempio: target: genere con classi maschio/femmina e predittore: vestiti con valore di gonne/pantaloni.

 
SanSanych Fomenko:

Rileggi il tuo post.



Si scopre che ho speculato e credo che il nostro disaccordo si basi su quanto segue:

Lei è contro la correlazione e io non ho mai scritto della correlazione tra la variabile predittiva e quella obiettivo.

Si chiama parlare.

Ho sempre scritto: il predittore deve essere legato alla variabile obiettivo. Non ho mai inteso la correlazione, la regressione lineare e non lineare nel senso della parola"relazione". Inoltre, tutti gli algoritmi di "importanza" predittiva che danno gli algoritmi di classificazione non sono soddisfacenti per me.


Guardate il mio esempio: target: genere con classi maschio/femmina, e predittore: abbigliamento con valore di gonne/pantaloni.


sì, è solo che a volte è scritto che i tratti con l'obiettivo devono essere esattamente correlati, cioè ci deve essere una dipendenza lineare

e ho scritto che per i modelli di regressione può essere ragionevole che almeno 1 attributo sia linearmente correlato all'obiettivo

sulla "relazione" naturalmente sono d'accordo :)

 
Vizard_:

Salvataggio del benchmarking)))

Varie conversioni e tagli. Quello in alto è un dato grezzo.

train = r.sampling con luce sq. test = OOS. time = r.time in sec.



anche un buon risultato su un forward non è sempre un precursore della successiva uscita di un profitto sulla carta :)

La convalida incrociata è già stata menzionata sopra. Penso che sia il modo migliore per andare

 
Sovrapprendimento - Si verifica in presenza di grandi pesi (~10^18), una conseguenza della multicollinearità, che porta a un modello A(x, w) instabile.


L'apprendimento eccessivo è trattato da: arresto anticipato dell'apprendimento del modello, restrizione della crescita dei pesi (regolarizzazione L1(Lasso) e L2), restrizione delle connessioni nella rete (Dropout), anche possibile applicazione di funzioni di penalità (ElacticNet, Lasso).

E la regolarizzazione L1 porta alla selezione delle caratteristiche, poiché si azzera sui loro coefficienti di peso.

La rimozione delle caratteristiche "rumorose" è la selezione delle caratteristiche. Ci sono metodi per questo. Questo non sempre avvantaggia il modello, quindi a volte si usa la regolarizzazione L2 (aiuta a risolvere il problema della multicollinearità).


SanSanych Fomenko, la sua affermazione sulla relazione tra caratteristiche e obiettivi è un po' presuntuosa. Perché come si può affermare qualcosa che non è stato ancora provato; è per questo che il modello MO è costruito. Un modello costruito e funzionante dà una certa stima che ci sia una relazione con una precisione "così e così".

E l'esempio con i pantaloni e le gonne, mostra la scarsità di conoscenza del ricercatore sull'area di studio, perché in un modello del genere si buttano via caratteristiche preziose sulla posizione, il periodo dell'anno, la latitudine e la longitudine della regione di residenza, e così via.


Prima di costruire un modello si dovrebbe capire l'area in esame, perché il diavolo, come il genio, sta nei dettagli.


PS. Avere discussioni è una buona cosa. Aiutano a lucidare i punti di vista, insegnano a fornire buoni argomenti alle tesi e conducono a una verità comune.

Motivazione: