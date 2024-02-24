L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3171
Il risultato cambierà in modo significativo sui campioni di prova/esame se il prezzo viene selezionato in modo casuale alla prima iterazione?
Mi rispondo da solo: sì, cambierà.
Ho selezionato casualmente il primo segmento quantistico per escludere il segnale (stringa) 1000 volte.
Ecco un paio di gif di esempio, di come è andato il processo con diversi otterzki casuali di primo quantum (può essere foglie).
Ed ecco le immagini statiche al momento dell'iterazione intermedia - diverse fasi di selezione e randomizzazione.
Quali conclusioni si possono trarre?
1. Si può essere fortunati e trovare casualmente un modello funzionante :)
2. È difficile costruire un modello senza ridurre il numero di modelli falsi, utilizzando solo il principio dell'avidità.
3. È necessario sviluppare metodi per stimare il modello osservato in un segmento o in un foglio quantistico.
4. La casualità non dimostra che si abbia successo nell'apprendimento automatico.
5. Per avere successo è necessario un modello logicamente valido.
6. Il successo su un campione di prova non sempre significa successo su un campione d'esame, e viceversa.
Quali altre conclusioni si possono trarre?
Ho perso di vista il vostro metodo di quantificazione nel corso del thread, scusate, ricordatemelo.
la quantizzazione delle serie temporali è molto importante, ad esempio, quantizzando un prezzo con il metodo renko otterremo SB (almeno statisticamente rilevante), quindi l'espressione "quantizzalo, non quantizzarlo, otterrai comunque xxx" sembra quantomeno sottostimata, perché se c'è una quantizzazione che distrugge l'informazione, allora probabilmente c'è una quantizzazione che estrae l'informazione. Sempre che ci sia informazione nel flusso di spunta, ovviamente (lo speriamo ardentemente, perché altrimenti l'applicazione del MO non avrebbe senso).
Andrey Dik #:
quantificando il prezzo con il metodo renko, otteniamo il SB (almeno statisticamente rilevante)
Penso che non ci sia più SB rispetto alle semplici barre.
Non credo che ci siano più SB che semplici bar.
Penso che il SB sia molto più grande, poiché le statistiche sulle barre sono molto diverse dalle prestazioni del SB.
Credo che nessuno qui abbia ancora esplorato il tiki con il MO.
ad alta voce forse no, almeno non quantificando le serie.
Sembra promettente agire "con il metodo contrario", cioè cercare non le regolarità, ma gli stati delle serie di prezzi (tick) (non voglio usare "serie temporali"), che non sono mai raggiungibili e non si verificano nella storia.
Ciò consentirà di utilizzare le condizioni al contorno per costruire una strategia favorevole ai trader.
Mi è sfuggito nel corso del thread, scusate, il metodo della vostra quantificazione, per favore ricordatemelo.
Il concetto di "cutoff quantizzato" è semplice: si tratta dell'intervallo del predittore, che ha un valore numerico su ogni riga del campione. Tutto ciò che si trova all'interno dell'intervallo diventa un'unità.
I metodi di suddivisione in intervalli possono essere diversi, e io utilizzo sia le varianti integrate in CatBoost (nel bousting spesso utilizzato sia per ridurre la RAM richiesta sia per ridurre la dimensionalità), sia alcune mie personali, ad esempio diverse sequenze numeriche.
Dopo aver diviso il predittore in intervalli utilizzando la griglia ottenuta in un modo o nell'altro, ogni segmento viene preso a turno e valutato per il valore delle informazioni in esso contenute.
Uno spostamento della probabilità di appartenere a una classe di almeno il 5% rispetto al valore medio del campione è considerato un'informazione preziosa, così come si tiene conto del numero di segnali e della loro distribuzione nel campione.
Se il campione ha un obiettivo binario, si ottengono due gruppi di segmenti quantici, in cui la probabilità di colpire 0 o 1 è spostata di conseguenza.
Creiamo un nuovo campione, in cui ogni segmento quantico ha una propria colonna: se c'è un segnale nell'intervallo - mettiamo "1", se non c'è - "0".
Una variazione della probabilità di appartenenza a una classe pari o superiore al 5% rispetto alla media del campione è considerata un'informazione preziosa, così come il numero di segnali e la loro distribuzione nel campione.
IMHO, sembra un pi-hacking, di cui Maxim ha scritto recentemente. A meno che non si utilizzino alcuni test statistici per determinare la significatività dei quanti assegnati, si tratta sicuramente di lui.
Una volta ho fatto un semplice esempio quando l'ora migliore della settimana per il trading è stata selezionata su SB (quando ovviamente non esiste). C'erano solo 5*24=120 varianti, ma era abbastanza che tale ora fosse sempre trovata (l'intervallo di tempo era di mezzo anno, credo). Anche in questo caso esiste una "stabilità di campionamento".
Sembra promettente agire "con il metodo contrario", cioè cercare non le regolarità, ma gli stati delle serie di prezzi (tick) (non voglio usare "serie temporali"), che non sono mai raggiungibili e non si verificano nella storia.
Ciò consentirà di utilizzare le condizioni al contorno per costruire una strategia favorevole ai trader.