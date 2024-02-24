L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 388
Ho già dei predittori, per quanto possa sembrare strano. Ho un bot già pronto, che ho costruito in meno di un mese. La cosa più importante sono i predittori, è fuori questione, sì. Beh, è chi ha esperienza in cosa... Per esempio, con la mia immaginazione infiammata i predittori possono essere raccolti in poco tempo, ho lavorato come analista per 5 anni :) Secondo me, la selezione dei predittori non è un compito così difficile come studiare le architetture NS, la cosa principale è sedersi e selezionare, ci vogliono 2-3 settimane :)
E in numeri?
Sul campione di allenamento, sul campione di prova e sul campione di convalida.
Soprattutto: su un nuovo file che era originariamente separato dai tre precedenti.
Tutti questi quattro valori non dovrebbero differire troppo l'uno dall'altro. Se differiscono di più del 10% di errore (30% di deviazione e 35% di deviazione, per esempio), allora scartalo.
E quello che ho sul conto reale non ha alcuna importanza - i segnali muoiono dopo un anno o anche dopo due anni.
Che dire del fatto che gli incrementi non indicano in alcun modo le tendenze?
Sì, lo fanno.
O il modello predice l'incremento o la direzione - è a questo che servono i modelli di classificazione.
Non sono a conoscenza di alcun modello di classificazione che riconosca i movimenti sulle notizie. E per GARCH questo è il punto del modello - per elaborare il movimento avvenuto. Code grasse - questo è il movimento sulle notizie quando le tendenze si rompono e si verificano brusche inversioni.
Bene, potete osservare l'aumento su diversi timeframe.
Ci sono interessanti modelli GARCH per diversi timeframe. Il significato è il seguente.
Supponiamo di prevedere l'incremento su H1. Il modello richiede dati di input che caratterizzano la distribuzione. Come dati di input (di solito la volatilità) non prendiamo l'ora precedente, ma i minuti dell'ora corrente.
Secondo me, è importante dividere l'intera storia in intervalli con lo stesso comportamento. Per esempio, ecco un'immagine del prezzo di chiusura di EURUSD per 5 anni, si può vedere che c'era una tendenza fino a circa 2Q14, poi il resto del 14 e l'inizio del 15 è un'altra, e dopo che la terza è iniziata e sta ancora andando avanti. Cercare di ottenere la temperatura media in ospedale e usarla per diagnosticare le condizioni di un singolo paziente è sbagliato, imho.
Se prendiamo, per esempio, la tendenza attuale da qualche parte dall'inizio del XV secolo a oggi, e almeno isoliamo/estrapoliamo le tendenze, la periodicità, otteniamo un risultato abbastanza credibile, imho. Ecco l'immagine, in verde è la previsione del prezzo di chiusura per le prossime due settimane.
Non ho bisogno di tanti campioni inutili, c'è abbastanza allenamento e test, scelgo i parametri tramite GA, poi scelgo i risultati che sono al massimo simili al back and forward. Non allenerai mai un modello per l'intera storia delle quotazioni, in più offrirai 3 periodi indipendenti, e il trading sul 4° non ha senso in caso di trading sul mercato, poiché il mercato cambia durante questo periodo. Quindi, basta assicurarsi che il modello non sia overfitted, sulla sezione al di fuori del campione di allenamento, e questo è tutto.
Mi alleno ogni settimana, finora la seconda settimana è a +35%. Di cosa si tratta, sono soldi veri )
Per favore, ditemi quali predittori usate?
Vuole seriamente creare un modello di mercato per gli anni a venire...?
No, certo che no.
Sono impegnato a ottenere alcune garanzie per il futuro.
Anch'io ho due trame.
La prima trama: tre campioni sono presi a caso da essa e appresi-controllati-controllati. L'ultima sezione, che segue la prima, è una corsa sequenziale, preferibilmente con un tester.
Completamente dimenticato, anche se l'ho già scritto molte volte.
Il passo descritto sopra è il secondo passo.
Il primo passo è la selezione dei predittori "rilevanti" per la variabile obiettivo. Posso dimostrare che si ottengono ottimi risultati con quegli insiemi di predittori in cui prevalgono predittori che non hanno nulla a che fare con la variabile obiettivo - il rumore. I risultati della formazione sono molto buoni sul rumore. E sono riuscito a ottenere un errore inferiore al 10% su tutte e tre le parti menzionate sopra, fino al 3%! E poi ho avuto un errore completamente casuale sulla seconda parte.
Se iniziate a estirpare i predittori di rumore, l'errore aumenta durante l'addestramento, ma diminuisce nella seconda sezione. Se ci sbarazziamo dei predittori di rumore, otteniamo circa lo stesso valore di errore. Sul mio set di predittori è un po' meno del 30%.