L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2563

 
Maxim Dmitrievsky #:

allora devi essere più specifico.

Sto pensando di scrivere un articolo che spieghi più dettagliatamente quello che sto facendo.

Volevo discutere approcci simili qui, ma è risultato che non c'era interesse.

In breve, ecco cosa faccio a tappe:

1. Per mezzo di CatBoost salvo diversi tipi di tabelle quantiche con diverso numero di "quanti" (pre-split forzati).

2. Analizzo ogni quantum dallo script per la stabilità e la capacità predittiva dell'indicatore.

2.1 Superamento della soglia di completezza e precisione dell'intero campione.

2.2 Valutazione della stabilità della deviazione dell'indicatore target predictor dall'indicatore target nell'area campione - prendo 7 punti e li setaccio per RMS.

3. Seleziono i migliori quanti di tutte le tabelle per ogni predittore tenendo conto della loro non sovrapposizione nello spazio di intervallo per il quale la quantizzazione ha avuto luogo.

4. Creo un nuovo campione (due tipi combinati tra tutti i quanti e nessuno) dove il predittore dei quanti ha un segnale di 0 o 1.

5. Escludo i predittori che hanno un segnale simile nel campione.

6. Insegnare il modello.

Se dopo il punto 5 facciamo anche un controllo di robustezza sul campione di test e d'esame, e selezioniamo solo i predittori che hanno mostrato un risultato soddisfacente, allora i risultati dell'addestramento migliorano notevolmente. Questo è una specie di imbroglio, ma se vale la pena usarlo o meno è una questione di sperimentazione. La mia ipotesi è che più a lungo gli indicatori sono stabili, più è probabile che continuino ad esserlo.

Se avete domande su una fase particolare, chiedete, cercherò di dare più informazioni.

P.S. Si potrebbe anche solo salvare la tabella dei quanti campionati, escludere i predittori inefficienti e allenarsi su un campione regolare - questo migliorerà anche l'apprendimento.
 
Aleksey Vyazmikin #:

Sto pensando di scrivere un articolo che spieghi più dettagliatamente quello che sto facendo.

Volevo discutere approcci simili qui, ma è risultato che non c'era interesse.

In breve, ecco cosa faccio a tappe:

1. Per mezzo di CatBoost salvo diversi tipi di tabelle quantiche con diverso numero di "quanti" (pre-split forzati).

2. Analizzo ogni quantum dallo script per la stabilità e la capacità predittiva dell'indicatore.

2.1 Superamento della soglia di completezza e precisione dell'intero campione.

2.2 Valutazione della stabilità della deviazione dell'indicatore target predictor dall'indicatore target nell'area campione - prendo 7 punti e li setaccio per RMS.

3. Seleziono i migliori quanti di tutte le tabelle per ogni predittore tenendo conto della loro non sovrapposizione nello spazio di intervallo per il quale la quantizzazione ha avuto luogo.

4. Creo un nuovo campione (due tipi combinati tra tutti i quanti e nessuno) dove il predittore dei quanti ha un segnale di 0 o 1.

5. Escludo i predittori che hanno un segnale simile nel campione.

6. Insegnare il modello.

Se dopo il punto 5 facciamo anche un controllo di robustezza sul campione di test e d'esame, e selezioniamo solo i predittori che hanno mostrato un risultato soddisfacente, allora i risultati dell'addestramento migliorano notevolmente. Questo è una specie di imbroglio, ma se vale la pena usarlo o meno è una questione di sperimentazione. La mia ipotesi è che più a lungo gli indicatori sono stabili, più è probabile che continuino ad esserlo.

Se ci sono domande su un particolare passo - chiedete, cercherò di dare maggiori informazioni.

P.S. Si potrebbe anche solo salvare la tabella dei quanti campionati, escludere i predittori inefficienti e allenarsi su un campione regolare - questo migliorerà anche l'apprendimento.

Cosa sono le tabelle quantiche? Tabelle di partizionamento ad albero? Non ho mai fatto una cosa del genere.

meglio un articolo con esempi
 
Maxim Dmitrievsky #:

Cosa sono le tabelle quantistiche? Tabelle di partizionamento ad albero? Non ne ho mai fatte.

articolo migliore con esempi

Le tabelle quantistiche stanno partizionando un predittore in limiti/intervalli, che sono poi coinvolti nell'apprendimento. Sì, ne ho già scritto molte volte.

 
Aleksey Vyazmikin #:

Le tabelle quantistiche sono un partizionamento del predittore in confini/ambiti, che sono poi coinvolti nell'apprendimento. Sì, ne ho già scritto molte volte.

Oh, capisco. Sembra che la quantizzazione dei chip sia usata solo per accelerare l'apprendimento. O è una cosa difficile? Sono solo un sostenitore dell'approccio classico più alcune mie perversioni personali.
 
Vladimir Baskakov #:
Non avete ancora mostrato nulla di utile, solo chiacchiere. Nerds

Continua a guardare.

 
Aleksey Vyazmikin #:

Le tabelle quantistiche sono un partizionamento del predittore in confini/ambiti, che sono poi coinvolti nell'apprendimento. Sì, ho già scritto molte volte su questo.

Il punto è cosa quantizziamo, come e con quale scopo.

 
Aleksey Nikolayev #:

Si tratta di cosa quantizziamo, come lo quantizziamo e per quale scopo.

Una volta ho provato la quantizzazione con i grafici di equità monotonica, quando un predittore è usato al posto del tempo. Non ho visto nulla di particolarmente buono.

 
Qualcuno ha provato a collegare il paradosso di Montichol al trading/decisione?
 
Maxim Dmitrievsky #:
Ah, capito. Sembra che la funzione di quantizzazione sia usata solo per accelerare l'apprendimento. O è una cosa difficile? Sono solo un sostenitore dell'approccio classico, più un po' delle mie perversioni personali.

L'accelerazione dell'apprendimento è uno dei vantaggi, ma c'è anche l'effetto di aggregazione di stati predittori simili. In parole povere, tratto una sezione di partizionamento come un predittore binario separato, che rimuove il rumore dal predittore di base.

Oltre all'effetto di miglioramento dell'apprendimento, ottengo di ridurre il numero di alberi nel modello che danno risultati simili, e quindi ridurre il rumore nel modello.

Sto sperimentando le tabelle rigide, questo è quando il partizionamento non è basato sui dati, ma su determinati criteri, per esempio i livelli di Fibonacci...

 
Aleksey Nikolayev #:

È tutta una questione di quanto, come e per quale scopo.

Questo è quello che ho scritto - che lo scopo è quello di identificare un modello coerente che dia un vantaggio statistico in una particolare area. E quantizziamo i predittori - qualsiasi predittatore.

E "come" farlo è una questione aperta - finora solo una ricerca di tabelle pre-fatte su presupposti empirici o algoritmo di partizionamento statistico CatBoost.

In figura 3 "quanta" - molto probabilmente scelto gamma media, che ha qualche vantaggio statistico.

Motivazione: