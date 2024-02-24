L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2792
Ho fatto la stessa cosa con il clustering più di un anno fa, poi ho determinato i livelli medi come nelle immagini e ho effettuato gli ordini a partire da questi. Divisi in 3 cluster up, down, mean reversion. Funziona benissimo in allenamento.
Già. A quanto pare non si può ottenere nulla dai prezzi. Non c'è altro. Ci sono anche i volumi in borsa.
A quanto pare, FA è l'unica cosa che può dare qualcosa. E probabilmente è meglio farlo manualmente. Ma anche lì ci si può sbagliare, le fake news lavorano attivamente.
Ho verificato l'informatività degli attributi spostandoli all'indietro. Cioè, non prendiamo gli ultimi valori della storia degli attributi, ma con un rientro nel passato. Ho preso 50 rientri. (da zero a -50 tacche)
Nella colonna di destra l'indentazione in barre, nella colonna di sinistra l'informazione reciproca. L'indentazione è in ordine crescente di informazione reciproca tra chip ed etichette.
È emerso che gli ultimi prezzi non sono sempre migliori di quelli precedenti, ma c'è un aumento a -11 barre rispetto alla barra zero:
indicativo
Cosa intendi per "informazione reciproca"? È interessante l'effetto della fic sul segno. È interessante l'influenza reciproca? Come si calcola la "mutua informazione"?
Le sue domande mi lasciano perplesso
Sembrano cicli diurni. Le ore 22-24 sono le più informative. Quindi oggi sarà uguale a ieri.
mi lasci a bocca aperta con le tue domande
Perché perplesso?
Per me, l'influenza, la connessione, il potere predittivo di una caratteristica, di un chip, di un predittore con un'etichetta può essere spiegato con il seguente esempio.
Sia presente un'etichetta "persona", che assume due valori: maschio e femmina.
Sia presente l'etichetta "abbigliamento", che assume due valori: pantaloni e gonne, e il numero di valori di pantaloni e gonne diversi sia centinaia o migliaia.
Supponiamo che gli uomini indossino solo pantaloni e le donne solo gonne. Allora una scheda di questo tipo determina l'etichetta senza errori, cioè con un errore di predizione = 0%. Possiamo considerare che la scheda influenza, è vincolata, predice l'etichetta al 100%. Se tali condizioni saranno mantenute in futuro, l'errore non cambierà e sarà =- 0%.
Nella società moderna non è così e ci sarà un errore di previsione, la cui entità è sconosciuta e può variare a seconda del riempimento della scheda.
Esiste un gran numero di approcci, implementati sotto forma di pacchetti software, che per il nostro esempio per l'amore di una parte delle donne per i pantaloni e degli uomini per le gonne mostreranno una certa differenza dal 100% di connessione del chip con il marchio.
I grafici lo mostrano molto bene.
Un esempio di funzione inutile:
Un esempio di una scheda abbastanza promettente. L'intersezione è un errore di previsione. Nel grafico precedente, una fiche si è completamente sovrapposta all'altra: l'errore di previsione è del 50%.
Questa misura è la differenza tra i chip nel primo grafico o nel secondo grafico? La differenza di stima è di 2,5 volte. Ma i numeri sono relativi. Tutte le caratteristiche sono spazzatura, alcune o tutte ottime?
È meglio valutare le caratteristiche non con alcuni metodi e pacchetti che non sono correlati al modello, ma con il modello stesso.
2 anni fa ho confrontato i metodi per la valutazione dell'importanza di https://www.mql5.com/ru/blogs/post/737458.
Il modello stesso è stato preso come campione. L'ho addestrato N volte (in base al numero di caratteristiche) rimuovendo una di esse.
Più il risultato peggiorava dopo la rimozione di una caratteristica, più questa era importante. C'erano anche dei chip la cui rimozione migliorava il risultato, cioè si trattava chiaramente di rumore.
Nessuna delle varianti per determinare l'importanza di una caratteristica era simile all'importanza esemplare. Temo che anche l'informazione reciproca e altri pacchetti possano essere incoerenti.
In prima approssimazione, lei ha certamente ragione: si dovrebbe avere un punteggio finale, se si intende valutare un modello in base alle sue misure di performance.
Ma c'è una sfumatura che prevale su tutto.
Valutare un modello in base alle sue prestazioni è una valutazione su dati storici. Ma come si comporterà il modello in futuro?
Se stiamo valutando le caratteristiche stesse, possiamo eseguire una finestra e ottenere statistiche sulla variazione del valore del punteggio di una caratteristica, ciascuna singolarmente. E, a mio parere, è preferibile utilizzare quelle caratteristiche che hanno una piccola fluttuazione nel loro punteggio di importanza, preferibilmente inferiore al 10%. Il mio set di fic ha fluttuazioni di sd dal 10% al 120% a 500 barre (a memoria). Ciò significa che il punteggio fluttua all'interno del canale del 10%, cioè la cifra che vediamo è quella. Ma per il 120%, il valore del punteggio di importanza che vediamo è la fic.