L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 656

 
Yuriy Asaulenko:


Bene, e la non stazionarietà. Qualsiasi processo, se suddiviso in pezzi, diventerà instabile, e se non lo è, non sarà casuale.

Non capisco. In GARCH il processo è decomposto in componenti, non suddiviso in pezzi. È nella formula stessa: valore precedente + rumore.

Tra l'altro, a giudicare dalle distribuzioni a diversi intervalli lunghi (diversi oltre 3 mesi) non ho notato alcuna differenza significativa tra loro.

Nelle pubblicazioni su GARCH, è stata dimostrata la necessità di avere più di 5000 osservazioni per calcolare i parametri delle distribuzioni. Meno di 1000 rende il modello instabile.

Sul senso economico - beh, non lo so. Presumo che il mercato sia casuale per l'osservatore. Che sia effettivamente casuale o meno non ha molta importanza. La parola chiave qui èper l'osservatore.

Sul forex, sono completamente d'accordo, perché credo che i tassi di cambio siano la politica.

Per quanto riguarda gli altri tipi di attività. Anche se oggi i prezzi dei beni sono spuri: il prezzo del petrolio è più volte superiore, mentre il consumo è più o meno lo stesso.

 
Maxim Dmitrievsky:


ma non hai eliminato le emissioni.


Certo che no e non puoi farlo. Inoltre, una delle implicazioni dei modelli GARCH è quanto bene si adatta REALMENTE al processo dopo un'emissione.

 
SanSanych Fomenko:

Certo che no e non dovrebbe essere fatto. Inoltre, uno dei significati dei modelli GARCH è quanto bene corrisponde REALMENTE al processo dopo l'outlier.

Voglio dire che se si prendono solo gli incrementi e i logaritmi degli incrementi, i grafici sono equivalenti, ma solo su una scala di prezzi diversa

 
Ildottor Trader:

Anch'io ci ho pensato molto.

Se il modello di regressione predice i guadagni di prezzo per barra e il punteggio R2 è superiore a zero su fronttest e backtest, questo è già un buon inizio. Il problema è che il risultato, anche se stabile, è piccolo, lo spread non può essere battuto.

Analiticamente, il problema è che R2 penalizza il modello più pesantemente per i grandi errori e ignora i piccoli errori e le direzioni sbagliate degli scambi. Se si guarda la distribuzione dei guadagni, la maggior parte dei movimenti di prezzo sono solo un paio di pip. E il modello, invece di prevedere la direzione corretta di questi piccoli movimenti, impara a prevedere le code lunghe della distribuzione per le quali otterrà un R2 più alto. Di conseguenza, il modello può in qualche modo prevedere i grandi movimenti ma su quelli piccoli sbaglia sempre la direzione e perde lo spread.

Conclusione - le stime di regressione standard sono negative per il forex. È necessario creare una funzione di fitness di qualche tipo per prendere in considerazione le direzioni degli accordi, la diffusione e la precisione. Allora anche con una precisione di poco più del 50% c'è una possibilità di guadagno.
La precisione, il rapporto Sharp, il fattore di recupero e altre funzioni che analizzano i grafici commerciali sono troppo discreti, la neuronica con un backprop standard non uscirà dal minimo locale e non può imparare correttamente.

Una conclusione alternativa è quella di ignorare completamente i segnali deboli del neurone. Commercio solo su quelli forti. Il problema è che possiamo sempre definire la soglia che dà buoni risultati sul backtest, ma non darà buoni risultati sul fronttest. Anche qui bisogna pensare a qualcosa.

R2 IMHO così come logloss è una metrica abbastanza scomoda a causa della sua non linearità. Per me una semplice correlazione dei rendimenti con i pronostici è molto più conveniente, è come la radice di R2, moltiplicata per 100 si ottiene la percentuale esatta di cambiamento che si può catturare dal mercato, io ottengo il 3-5%, ma il problema è, come hai detto giustamente, che questi segnali sono troppo frequenti, e il filtraggio o la media uccide quasi completamente l'alfa. Penso che sia qui che devo concentrare i miei sforzi, dato che non posso comunque ottenere più del 5% dai dati normali.

 
SanSanych Fomenko:

Per quanto riguarda il senso economico - beh, non lo so. Presumo che il mercato sia casuale per l'osservatore. Che sia effettivamente casuale o meno non ha molta importanza. La parola chiave qui èper l'osservatore.

Sul forex, sono completamente d'accordo, perché credo che i tassi di cambio siano la politica.

Per quanto riguarda gli altri tipi di attività. Anche se oggi i prezzi degli asset sono fuori scala: il prezzo del petrolio per tempi e consumi è circa lo stesso.

Sì, ovunque. Gioco soprattutto sulla borsa dei futures. Per un osservatore tutto è casuale. Cosa c'è veramente - chi diavolo lo sa. Devi essere un insider).

Che cosa è "non casuale" - è rollback nel movimento e fluttuazioni intorno alla media (da non confondere con Alexander_K2-m). Con questo approccio, piuttosto colpire un movimento può essere chiamato casuale, ma non raro e persino un fenomeno regolare, dato che non sappiamo mai quando e in quale direzione sarà.

 
Yuriy Asaulenko:

Sì, ovunque. Io gioco soprattutto sul mercato dei futures azionari. Per un osservatore, tutto è casuale. Cosa sia veramente, non lo so. Devi essere un insider).

Che cosa è "non accidentale" - è rollback nel movimento e fluttuazioni intorno al valore medio (da non confondere con Alexander_K2-m). Con questo approccio, piuttosto colpire una mossa può essere chiamato casuale, ma non raro e anche un evento regolare, dato che non sappiamo mai quando o in quale direzione sarà.

Questa ipotesi di mercato efficiente non ha senso.

 
Maxim Dmitrievsky:

Voglio dire, se si prendono solo gli incrementi e i logaritmi degli incrementi, i grafici sono equivalenti, ma solo su una scala di prezzi diversa

Stranye hai dei grafici, il logaritmo dovrebbe anche comprimerli. Con quale formula avete calcolato? Un decimale, per esempio, un cambiamento di 10 volte nei dati di input si traduce in un cambiamento di 2 volte. Anche naturale, ma più debole. I vostri grafici non mostrano la compressione verticale.
 
SanSanych Fomenko:

Dopo tutto, non è per niente che i modelli GARCH sono utilizzati per gli incrementi. e sono i più comuni al momento. L'idea di base di sconfiggere la non stazionarietà decomponendo una serie non stazionaria in componenti che hanno un senso economico e statistico abbastanza significativo è molto attraente.

In questo momento Garch è troppo complicato per me. I libri sull'argomento sono scritti principalmente per specialisti in statistica ed econometria, e operano costantemente con cose che non capisco; per capire e assimilare alcune basi devo prima capire un mucchio di altre cose che non sono spiegate nei libri.

Ho giocato con i pacchetti in R, ma non ho ottenuto alcun profitto con le impostazioni predefinite anche per un test; ho bisogno di nuovo di sapere come e cosa modificare nelle impostazioni, e non posso farlo per caso.

Credo che garch possa fare molte cose, ma la quantità di tempo che devo investire per capirle è troppo grande, e non ne ho molto.

 
elibrario:
Stranye hai dei grafici, il logaritmo dovrebbe averli anche compressi. Con quale formula avete calcolato? Decimale, per esempio, un cambiamento di 10 volte nei dati di input risulta in un cambiamento di 2 volte. Anche naturale, ma più debole. I vostri grafici non mostrano la compressione verticale.

log(chiusura[i]/chiusura[i-15])

dove chiudere cosa, perché?

 
Maxim Dmitrievsky:

Cioè, se si prendono solo gli incrementi e i logaritmi degli incrementi, i grafici sono equivalenti, ma solo su una scala di prezzi diversa

Immagino che non sia log(open[0] - open[1]),
ma log(open[0]/open[1])