L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2792

 
Maxim Dmitrievsky #:
Ho fatto la stessa cosa con il clustering più di un anno fa, poi ho determinato i livelli medi come nelle immagini e ho effettuato gli ordini a partire da questi. Divisi in 3 cluster up, down, mean reversion. Funziona benissimo in allenamento.
La cosa divertente è che, a prescindere dai mezzi speciali utilizzati, non è possibile ottenere nulla di buono da un'analisi casuale.

Già. A quanto pare non si può ottenere nulla dai prezzi. Non c'è altro. Ci sono anche i volumi in borsa.
A quanto pare, FA è l'unica cosa che può dare qualcosa. E probabilmente è meglio farlo manualmente. Ma anche lì ci si può sbagliare, le fake news lavorano attivamente.

 
Maxim Dmitrievsky #:

Ho verificato l'informatività degli attributi spostandoli all'indietro. Cioè, non prendiamo gli ultimi valori della storia degli attributi, ma con un rientro nel passato. Ho preso 50 rientri. (da zero a -50 tacche)

Nella colonna di destra l'indentazione in barre, nella colonna di sinistra l'informazione reciproca. L'indentazione è in ordine crescente di informazione reciproca tra chip ed etichette.

È emerso che gli ultimi prezzi non sono sempre migliori di quelli precedenti, ma c'è un aumento a -11 barre rispetto alla barra zero:

indicativo

Cosa intendi per "informazione reciproca"? È interessante l'effetto della fic sul segno. È interessante l'influenza reciproca? Come si calcola la "mutua informazione"?

 
СанСаныч Фоменко #:

Cosa si intende per "informazione reciproca"? È interessante l'effetto della scheda sul tag. È interessante l'influenza reciproca? Come si calcola la "mutua informazione"?

Le sue domande mi lasciano perplesso

 
Maxim Dmitrievsky #:

Ho verificato l'informatività degli attributi spostandoli all'indietro. Cioè, non prendiamo gli ultimi valori della storia degli attributi, ma con un rientro nel passato. Ho preso 50 rientri. (da zero a -50 tacche)

Nella colonna di destra l'indentazione in barre, nella colonna di sinistra l'informazione reciproca. L'indentazione è in ordine crescente di informazione reciproca tra chip ed etichette.

È emerso che gli ultimi prezzi non sono sempre migliori di quelli precedenti, ma c'è un aumento a -11 barre rispetto alla barra zero:

indicativo

Correzioni H1?

0   0.001554  23
1   0.001612  22
2   0.001708  15
3   0.001783  24
Sembrano cicli diurni. Le ore 22-24 sono le più informative. Quindi oggi sarà uguale a ieri.
 
Maxim Dmitrievsky #:

mi lasci a bocca aperta con le tue domande

Perché perplesso?

Per me, l'influenza, la connessione, il potere predittivo di una caratteristica, di un chip, di un predittore con un'etichetta può essere spiegato con il seguente esempio.

Sia presente un'etichetta "persona", che assume due valori: maschio e femmina.

Sia presente l'etichetta "abbigliamento", che assume due valori: pantaloni e gonne, e il numero di valori di pantaloni e gonne diversi sia centinaia o migliaia.

Supponiamo che gli uomini indossino solo pantaloni e le donne solo gonne. Allora una scheda di questo tipo determina l'etichetta senza errori, cioè con un errore di predizione = 0%. Possiamo considerare che la scheda influenza, è vincolata, predice l'etichetta al 100%. Se tali condizioni saranno mantenute in futuro, l'errore non cambierà e sarà =- 0%.

Nella società moderna non è così e ci sarà un errore di previsione, la cui entità è sconosciuta e può variare a seconda del riempimento della scheda.

Esiste un gran numero di approcci, implementati sotto forma di pacchetti software, che per il nostro esempio per l'amore di una parte delle donne per i pantaloni e degli uomini per le gonne mostreranno una certa differenza dal 100% di connessione del chip con il marchio.


I grafici lo mostrano molto bene.

Un esempio di funzione inutile:


Un esempio di una scheda abbastanza promettente. L'intersezione è un errore di previsione. Nel grafico precedente, una fiche si è completamente sovrapposta all'altra: l'errore di previsione è del 50%.


Questa misura è la differenza tra i chip nel primo grafico o nel secondo grafico? La differenza di stima è di 2,5 volte. Ma i numeri sono relativi. Tutte le caratteristiche sono spazzatura, alcune o tutte ottime?

 
Beh, cercate su Google, non voglio citare wikipedia. La misura della connessione può essere geometrica, come nel caso della correlazione, e informativa nel caso di Mi.

Non capisco perché devo lottare contro la pigrizia altrui, che tu stesso hai ammesso in precedenza).

Se si dà un buon approccio, non c'è bisogno di un gran numero di pacchetti. Il nome sarà sufficiente.
 
Maxim Dmitrievsky geometrica, come nel caso della correlazione, e informativa nel caso di Mi.

Non vedo perché dovrei lottare contro la pigrizia di qualcun altro, cosa che ammettevo a me stesso).

Sì, beh, ok. Che sia così

 
СанСаныч Фоменко #:

Sì, beh, ok. E così sia

Non solo non fornisci alcun risultato e fai riferimento a un sacco di buoni pacchetti, ma mi fai anche indovinare cosa intendevi esattamente. Se si parla di qualcosa di specifico, scrivi in modo specifico, con risultati specifici.

È un esempio banale sulle distribuzioni estese, mostrami come ottenerle in modo efficiente.
La relazione di informazione è stata nominata da lei. È l'entropia e la mutua informazione sulla sua base. C'è bisogno di scriverlo 500 volte? L'entropia è definita per una serie, la mutua informazione per due.
 

È meglio valutare le caratteristiche non con alcuni metodi e pacchetti che non sono correlati al modello, ma con il modello stesso.
2 anni fa ho confrontato i metodi per la valutazione dell'importanza di https://www.mql5.com/ru/blogs/post/737458.

Il modello stesso è stato preso come campione. L'ho addestrato N volte (in base al numero di caratteristiche) rimuovendo una di esse.
Più il risultato peggiorava dopo la rimozione di una caratteristica, più questa era importante. C'erano anche dei chip la cui rimozione migliorava il risultato, cioè si trattava chiaramente di rumore.

Nessuna delle varianti per determinare l'importanza di una caratteristica era simile all'importanza esemplare. Temo che anche l'informazione reciproca e altri pacchetti possano essere incoerenti.

Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
 
elibrarius #:

È meglio valutare le caratteristiche non con alcuni metodi e pacchetti non correlati al modello, ma con il modello stesso.
2 anni fa ho confrontato i metodi di valutazione dell'importanza https://www.mql5.com/ru/blogs/post/737458

Il modello stesso è stato preso come campione. L'ho addestrato N volte (in base al numero di caratteristiche) rimuovendo una di esse.
Più il risultato peggiorava dopo la rimozione di una caratteristica, più questa era importante. C'erano anche dei chip la cui rimozione migliorava il risultato, cioè si trattava chiaramente di rumore.

Nessuna delle varianti per determinare l'importanza di una caratteristica era simile all'importanza esemplare. Temo che anche l'informazione reciproca e altri pacchetti possano essere incoerenti.

In prima approssimazione, lei ha certamente ragione: si dovrebbe avere un punteggio finale, se si intende valutare un modello in base alle sue misure di performance.

Ma c'è una sfumatura che prevale su tutto.

Valutare un modello in base alle sue prestazioni è una valutazione su dati storici. Ma come si comporterà il modello in futuro?

Se stiamo valutando le caratteristiche stesse, possiamo eseguire una finestra e ottenere statistiche sulla variazione del valore del punteggio di una caratteristica, ciascuna singolarmente. E, a mio parere, è preferibile utilizzare quelle caratteristiche che hanno una piccola fluttuazione nel loro punteggio di importanza, preferibilmente inferiore al 10%. Il mio set di fic ha fluttuazioni di sd dal 10% al 120% a 500 barre (a memoria). Ciò significa che il punteggio fluttua all'interno del canale del 10%, cioè la cifra che vediamo è quella. Ma per il 120%, il valore del punteggio di importanza che vediamo è la fic.