L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3210

 
mytarmailS #:

L'intero settore dei ricercatori di mercato attivi è seduto qui su R, che è un po' il riassunto...

Attivi chi?) prima di tutto il team di ricerca deve crescere.
 

Il problema di cui sopra è che esiste un modello che ha risultati eccellenti su un file di allenamento e su un file OOS. Capisco che il file di addestramento può essere ottenuto anche con un campionamento casuale per campione e che l'OOS è un residuo del file di addestramento.

Ma quando si esegue il modello su un file esterno, il risultato è catastroficamente negativo.

Mi sono ricordato di aver avuto una simile variante alcuni anni fa.

Sono riuscito a trovare il motivo. Il motivo era il guardare avanti, un motivo estremamente scomodo, perché è molto difficile capire cosa sia il guardare avanti.

Ho quindi creato un modello in cui l'insegnante è costituito dagli incrementi di ZZ, e ci sono molti predittori, nel cui calcolo era coinvolto ZZ. Ad esempio, la differenza tra il prezzo e ZZ. Durante l'addestramento, ho semplicemente tagliato una parte del file che non conteneva i giusti collegamenti di ZZ. E quando si calcolavano i predittori, i valori ZZ mancanti venivano estesi dall'ultimo collegamento.

I tre file (questo è in Rattle) che danno un campione casuale hanno dato un errore di classificazione di circa il 5%. Tuttavia, il quarto file, che non è correlato ai primi tre, ha dato un errore casuale.

Se però rimuoviamo tutti i predittori che ZZ è coinvolto nel calcolo, tutto torna a posto: l'errore di classificazione è più o meno uguale per tutti e quattro i file.

Questo è guardare avanti.

Con il retraining è chiaro: bisogna fare molta attenzione all'ottimizzazione nel tester e in R pulire l'elenco dei predittori dalla spazzatura. Ma come individuare il look ahead?

In base all'esperienza passata, è ovvio quanto segue: se l'errore di classificazione su train, test e validazione è inferiore al 10%, si devono eliminare i predittori uno alla volta finché l'errore non sale al 20% 30% ....

 
Gli ZigZag devono essere costruiti per il momento della barra, non per il futuro.
 
Forester #:
Gli ZigZag dovrebbero essere tracciati al momento della barra, non nel futuro.

Per l'addestramento del modello lo ZZ non è stato esteso, perché non è necessario: il pattern che il modello cerca è una linea - le linee vicine non vengono prese in considerazione, e il campione per l'addestramento è di 1500 barre.

 
Ma da dove viene questa stronzata dello zig-zag, chi l'ha inventata per primo?

Sanych, quando ti ricorderai che un insegnante è un bersaglio + fichi?))) non un solo bersaglio

E la volatilità si scrive senza H.
 
СанСаныч Фоменко #:

In base all'esperienza passata, vale quanto segue: se l'errore di classificazione su train, test e validazione è inferiore al 10%, allora si buttano stupidamente via i predittori uno per uno finché l'errore non sale al 20% 30% ....

Geniale)))))

Come trovare predittori reali con un errore inferiore al 10%?

Non ditemi che non esistono, è una questione di fede....

 
Maxim Dmitrievsky #:
Da dove viene questa stronzata dello zig-zag, chi l'ha inventata per primo?

Lei stesso è interessato o non è affatto interessato a scrivere sulla sostanza del problema, piuttosto che mettere in mostra il suo io preferito?

 
СанСаныч Фоменко #:

Sono riuscito a trovare il motivo. Il motivo è il guardare avanti, un motivo estremamente scomodo, perché è estremamente difficile capire cosa sia il guardare avanti.

Ho quindi utilizzato un modello in cui l'insegnante è costituito dagli incrementi di ZZ, e ci sono molti predittori nel calcolo dei quali ZZ era coinvolto. Ad esempio, la differenza tra il prezzo e ZZ. Durante l'addestramento, ho semplicemente tagliato una parte del file che non conteneva i giusti collegamenti di ZZ. Nel calcolo dei predittori, i valori mancanti di ZZ sono stati estesi dall'ultimo collegamento.

Per evitare di sbirciare Forester dice correttamente che si dovrebbero calcolare i predittori nel ciclo a ogni iterazione senza sbirciare....

Questa è la soluzione.

 
mytarmailS #:

Genio)))))

Come trovare allora dei veri predittori con un errore inferiore al 10%?

Non ditemi che non ce ne sono, è una questione di fede.....

È facile.

Ho scritto sopra come ho fatto con l'esempio di ZZ.

Ma non si tratta di ZZ: mettiamo i canti dell'insegnante nei predittori e otteniamo la felicità prima di correre sul file fuori.

E non si può correre sul file OUT e vivere felici, come fa Maxim con immagini molto belle.

Ma torniamo al problema di guardare avanti. Suggerito blunt overshoot. O forse c'è qualcos'altro?

 
СанСаныч Фоменко #:

Siete interessati o non siete affatto interessati a scrivere sul merito del problema piuttosto che a mettere in mostra il vostro io preferito?

Non è affatto interessante risolvere i problemi mentali degli altri.