L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1778

Aleksey Vyazmikin:

Non hai ancora detto come fare trading su di esso - quindi non so che tipo di TS inventare.

Come? È ovvio)) ZZ su significa comprare, giù significa vendere.

Prevede la direzione delle ZZ, vero?

 
Beh, parlerei a lungo del problema della ridondanza, particolarmente rilevante per NS, ma sono pigro.

Per inciso, è questo problema che spesso diventa la causa della scarsa capacità predittiva del modello

 
mytarmailS:

Come? È ovvio)) ZZ su è un acquisto, giù è una vendita.

Stai prevedendo la direzione di ZZ, vero?

Questo si rivelerebbe un tic, probabilmente.

Hai provato a fare la media/lisciatura dell'indicatore di classificazione con la finestra per eliminare gli outlier?

 
In questo caso, la media è uguale al ritardo. È necessario migliorare la qualità della classificazione, lo smussamento non è un'opzione.

Provalo così com'è!

Ecco perché penso che in questa direzione, i segni possono essere già formati da AMO o da regole di lavoro, questi segni dovrebbero essere informazioni qualitative, compresse e il mio mini esperimento nella pagina precedente lo ha dimostrato.

Ma ancora non capisco come prevedere la correlazione (non lo so).

 
Previsione di nuovo....

Il coefficiente di correlazione aiuta a identificare in anticipo i predittori più significativi - più alta è la correlazione tra la variabile dipendente e il predittatore, più significativa è quella variabile per il modello.

Quindi, nel tuo esempio, ci sono due modi di procedere. Il primo, il tuo, è quello di sostituire un predittore alla volta nel modello e vedere quanto migliora l'accuratezza della previsione. È molto tempo.

Il secondo, usare il coefficiente di correlazione per schermare in anticipo i predittori non importanti che disturbano il modello.


Semplicemente il problema della ridondanza è che si possono aggiungere 100+1 nuovi predittori al modello, ma 100 predittori aggiungeranno lo 0,01% alla qualità della previsione, mentre 1 aggiungerà il 10%. E non ha senso sovraccaricare il modello con quei 100 nuovi predittori - overfitting

 
Beh, la correlazione è solo una delle opzioni di setacciamento e sicuramente non è la migliore... Si può anche usare la cointegrazione, la correlazione incrociata, la correlazione non lineare ecc. e sarà ancora meglio, ma sono tutti gerarchicamente più bassi del semplice errore di classificazione, ecco perché ho scelto i criteri di errore di predizione di un tratto

Sono parzialmente d'accordo, ma in termini più ampi la foresta è la stessa regola, l'unica differenza è la complessità.

C'è un pacchetto in R che può comprimere una foresta di 200 alberi in una o tre regole rimuovendo tutte le regole inutili e superflue, la perdita di qualità della classificazione è dello 0,5-2%, questa è una compressione delle informazioni a cui dovremmo tendere + interpretabilità

 
Non è un'opzione. C'è troppo inceppamento nell'appartamento.

Naturalmente, è possibile spostare la soglia di attivazione 0,65 - comprare, 0,35 - vendere.


 
Mostrami un grafico con gli scambi

