È stato pubblicato l'articolo Misurare l'informatività di un indicatore:
Autore: Francis Dube
Grazie per aver sollevato questo argomento.
La prego di commentare le informazioni un po' contraddittorie, citando due parti dell'articolo:
"
Per applicare l'equazione dell'entropia a variabili continue, dobbiamo discretizzare i valori dell'indicatore. Ciò avviene dividendo l'intervallo di valori in intervalli di uguale dimensione e contando il numero di valori che rientrano in ciascun intervallo. Con questo metodo, l'insieme originale che enumera l'intervallo massimo di tutti i valori dell'indicatore viene sostituito da sottoinsiemi, ciascuno dei quali rappresenta intervalli selezionati.
...
Intervalli - il numero di intervalli da campionare. L'autore di TTMTS specifica 20 intervalli per una dimensione del campione di diverse migliaia, con 2 come valore minimo. Ho aggiunto il mio approccio a un valore adeguato implementando la possibilità di variare il numero di intervalli rispetto alla dimensione del campione, in particolare 51 ogni 1000 campioni. Questa opzione è disponibile se l'utente inserisce un valore qualsiasi inferiore a 2. Quindi, impostando Intervallo su un numero qualsiasi inferiore a 2, il numero di intervalli utilizzati varierà a seconda del numero di barre analizzate.
"
Domanda: si tratta della stessa cosa? Se sì, perché il numero di separatori dell'intervallo di valori dell'indicatore dipende dal numero di barre? Qual è la logica? Finora posso supporre che sia utile solo per gli indicatori che hanno una componente accumulativa.
In caso contrario, a cosa corrisponde il numero di separatori dell'intervallo?
Nell'articolo manca una tabella che mostri chiaramente i vantaggi della trasformazione dei valori degli indicatori.
È stato pubblicato il nuovo articolo Misurare le informazioni sugli indicatori:
Autore: Francis Dube
Ciao Francis
Puoi per favore spiegarmi come testare un indicatore personalizzato per EntrophyAnalysis.
Sto cercando di usare il seguente metodo:
input ENUM_TIMEFRAMES Timeframe=PERIOD_H1;
input ENUM_INDICATOR IndicatorType=IND_CUSTOM;
input string CustomIndicatorName="Indicators\\NKGold\Regression\iNonLinRegress.ex5";
input bool UseDefaults=true;
stringa di input IndicatorParameterTypes="int,CENUM_APPLIED_PRICE";
stringa di input IndicatorParameterValues="34,priceHA_WEIGHTED";
e ottengo l'errore seguente
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) indicatore personalizzato 'Indicators\NKGold\Regression\iNonLinRegress.ex5' non riesce a caricare [4802]
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) Maniglia indicatore non valida, codice errore: 4802
Perché così tante lettere? L'autore ha individuato un indicatore valido? In altre parole, ha trovato qualcosa per il denaro? La domanda è semplice: esiste uno strumento per fare soldi con un'alta probabilità di profitto? Oppure è tutto uguale, come la roulette: o funziona o non funziona.
L'articolo non pretende di aver scoperto un Santo Graal che stampi banconote con certezza. Il suo obiettivo è più modesto: mostrare come misurare la ricchezza di informazioni che un indicatore apporta a un modello di apprendimento.
-
Un punteggio di entropia elevato significa solo che la variabile non è banale (varia in misura sufficiente perché l'algoritmo possa imparare). Non garantisce la direzione, il timing o una gestione vincente del denaro.
-
Anche un indicatore altamente informativo può rivelarsi non predittivo se il mercato è già efficiente nell'orizzonte temporale scelto, se i costi di transazione assorbono il segnale o se il modello è mal progettato.
-
In pratica, si sovrappongono una serie di elementi: selezione di indicatori con una buona entropia, test rigorosi fuori dal campione, gestione del rischio, esecuzione robusta e monitoraggio in tempo reale. Solo combinando tutti questi passaggi si spera di ottenere un piccolo vantaggio, che deve essere costantemente ricontrollato man mano che il mercato si adatta.
-
L'autore fornisce uno strumento diagnostico accademico. Non garantisce il successo. Ognuno è libero di utilizzarlo per affinare le proprie caratteristiche o, al contrario, per rendersi conto che un indicatore preferito non aggiunge nulla di nuovo.
In breve, l'entropia è un termometro, non un elisir. Aiuta a individuare rapidamente le variabili morte o poco sfruttate. Non sostituisce la strategia o il controllo del rischio.
...
Intervalli - il numero di intervalli da campionare. L'autore di TTMTS indica 20 intervalli per un campione di diverse migliaia di persone, mentre 2 sono il minimo assoluto. Ho aggiunto il mio approccio a un valore appropriato, implementando la possibilità di variare il numero di intervalli in relazione alla dimensione del campione, in particolare 51 per 1000 campioni. Questa opzione è disponibile se l'utente immette un valore inferiore a 2. Pertanto, impostando Intervallo su un numero inferiore a 2, il numero di intervalli utilizzati varierà in base al numero di barre analizzate.
"
Domanda: è la stessa cosa? Se sì, perché il numero di separatori nell'intervallo dei valori dell'indicatore dipende dal numero di barre? Qual è la logica che sta dietro a questo? Finora posso solo supporre che sia utile per gli indicatori che hanno una componente accumulativa.
In caso contrario, a cosa corrisponde il numero di divisori nell'intervallo?
Nell'articolo manca una tabella che mostri chiaramente il vantaggio della trasformazione dei valori degli indicatori.
Per stimare l'entropia di una variabile continua, si divide l'intervallo di valori in intervalli uguali e si contano le osservazioni in ciascun intervallo. Lo script consente di scegliere il numero diintervalli. Se si inserisce un valore < 2 (o si lascia il valore predefinito), lo script attiva la propria euristica: 51 intervalli per 1.000 osservazioni, ossia un numero proporzionale alla dimensione del campione. Se si inserisce un valore > 2, lo utilizza così com'è, quindi non si tratta di due metodi in competizione. Uno descrive il concetto, l'altro spiega come il codice sceglie il parametro quando non lo si imposta.
Quando gli intervalli sono troppo pochi, i valori vengono incollati artificialmente. L'entropia viene sottostimata (bias). Quando si hanno troppi intervalli per un campione piccolo, ci sono molti bins vuoti o bins con 1 osservazione. L'entropia è molto rumorosa (varianza). Esistono diverse regole automatiche per gli istogrammi: Sturges, radice quadrata, Freedman-Diaconis, Scott, ecc.) Tutte hanno la stessa idea: aumentare la risoluzione quando si hanno più dati, perché così si possono stimare probabilità più fini senza far esplodere la varianza.
Per 1.000 barre, 51 intervalli => 20 punti per bin se la distribuzione fosse uniforme. Questo rapporto (tra 15 e 30 osservazioni/classe) è un classico compromesso che l'autore ha tratto dalla letteratura. Non ha nulla a che vedere con il fatto che un indicatore sia o meno cumulativo. La logica è puramente statistica. La finezza della griglia si adatta alla quantità di informazioni disponibili.
-
più è visibile la distribuzione fine dell'indicatore,
-
più il calcolo dell'entropia è in grado di cogliere i dettagli (picchi e avvallamenti),
-
ma più dati sono necessari perché queste frequenze siano stabili.
È vero che l'articolo avrebbe tratto vantaggio dal mostrare, ad esempio, l'entropia dello stesso indicatore prima e dopo le trasformazioni, ma la dimostrazione è facile da fare da soli. Basta spuntare ApplyTransform=true nello script e leggere il doppio output: prima / dopo. Il codice ha volutamente lasciato questa parte interattiva in modo che ognuno possa testare i propri asset e orizzonti.
Più barre verticali ci sono nell'istogramma:
-
più si nota la sottigliezza della distribuzione dell'indice,
-
più dettagli (picchi e avvallamenti) il calcolo dell'entropia può cogliere,
-
ma più dati sono necessari per rendere stabili queste frequenze.
A quanto ho capito, la visualizzazione dei punteggi degli indicatori in un campione attraverso un istogramma non ha nulla a che fare con i metodi di trasformazione dei dati dell'autore. Sono corretto?
Sono più interessato alla questione dell'effetto formativo di queste trasformazioni. Posso ipotizzarlo per le reti neurali, ma non per i metodi ad albero.
Se ho capito bene, la visualizzazione dei punteggi degli indicatori in un campione utilizzando un istogramma non ha nulla a che fare con i metodi di trasformazione dei dati dell'autore. Ho ragione?
Sono più interessato alla questione dell'effetto a catena di queste trasformazioni. Posso ipotizzarlo per le reti neurali, ma non per i metodi ad albero.
L'istogramma disegnato dallo script è semplicemente uno strumento di diagnostica visiva. Mostra come i valori di un indicatore sono distribuiti nel campione, prima o dopo la trasformazione. Le funzioni sqrt, log, tanh, ecc. agiscono sui dati. L'istogramma visualizza semplicemente il risultato. Le due fasi sono quindi indipendenti. Prima si trasforma (o meno) la serie, poi si traccia l'istogramma per vedere se l'entropia è cambiata.
La trasformazione di un indicatore che è diventato piuttosto monotono (log, sqrt) spesso non cambia il punteggio. Invece, le trasformazioni non monotone (tanh che satura) cambiano l'ordine di alcuni punti. Ciò significa che alcune trasformazioni preparano meglio il terreno per la creazione di interazioni non lineari.
L'istogramma costruito dallo script è semplicemente uno strumento di diagnostica visiva. Mostra come i valori dell'indicatore sono distribuiti nel campione prima o dopo la trasformazione. Le funzioni sqrt, log, tanh, ecc. influenzano i dati. L'istogramma visualizza semplicemente il risultato. Le due fasi sono quindi indipendenti. Prima si trasforma (o meno) la serie, poi si traccia l'istogramma per vedere se l'entropia è cambiata.
Ok, ora ho capito il punto. Inizialmente pensavo a qualcos'altro.
Trasformare un esponente che è diventato abbastanza monotono (log, sqrt) spesso non cambia il risultato. D'altra parte, le trasformazioni non monotone (tanh, satura) cambiano l'ordine di alcuni punti. Ciò significa che alcune trasformazioni preparano meglio il terreno per la creazione di interazioni non lineari.
Come cambia l'ordine dei punti? Può fare un esempio di tale trasformazione? Finora avevo capito che c'erano punti ABC con autovalori in ordine crescente, e dopo la trasformazione l'ordine crescente è diventato, in alternativa, BAC.
Ok, ora ho capito l'idea. Inizialmente pensavo a qualcos'altro.
Come cambia l'ordine dei punti? Può fare un esempio di tale trasformazione? Finora ho capito che ci sono punti ABC con autovalori in ordine crescente, e che dopo la trasformazione l'ordine crescente è diventato, alternativamente, BAC.
Le funzioni dello script (root, log, tanh, ecc.) sono tutte monotonicamente crescenti. Tutte conservano l'ordine dei punti. La mia frase precedente era ambigua. L'ordine cambia da ABC a BAC solo se si utilizza una trasformazione non monotona. Ad esempio, se non sbaglio, la funzione f(x)=∣x-50∣ non è monotona perché piega l'asse intorno a x=50. Pertanto, l'ordine diventa BAC. Nella sua introduzione l'autore dell'articolo ci indica il libro"Testing and Tuning Market Trading Systems (TTMTS) di Timothy Masters". Per quanto mi riguarda, ho intenzione di metterci le mani sopra perché, come voi, ho ancora qualche domanda. Inoltre, non ho molta familiarità con i modelli di apprendimento e le reti neurali. A quanto pare, è abbastanza facile da trovare sui siti di vendita online. Il suo contenuto dovrebbe esserci di grande aiuto perché l'articolo, per quanto interessante, è senza dubbio incompleto e/o comunque piuttosto sintetico.
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Accetti la politica del sito e le condizioni d’uso
Il nuovo articolo Misurazione delle informazioni degli indicatori è stato pubblicato:
A titolo di esempio, esaminiamo alcune proprietà statistiche di due indicatori analizzati in precedenza.
La distribuzione di Williams’s percent range rivela come quasi tutti i valori siano distribuiti sull'intero intervallo, oltre ad essere multi modale la distribuzione è abbastanza uniforme. Una tale distribuzione è ideale e si riflette nel valore dell'entropia.
Questo è in contrasto con la distribuzione del Market Facilitation Index, che presenta una coda lunga. Un tale indicatore sarebbe problematico per la maggior parte degli algoritmi di apprendimento e richiede la trasformazione dei valori. La trasformazione dei valori dovrebbe portare a un miglioramento dell'entropia relativa dell'indicatore.
Autore: Francis Dube