Confronto di due grafici di quotazione con distorsioni non lineari sull'asse X - pagina 11

 
gpwr:

Il sistema si basa sul presupposto che ci sono modelli ripetitivi nelle citazioni. A pagina 9 di questo thread ho descritto il metodo per trovare questi modelli (unleashed coding). Ci sono altri metodi. Puoi anche confrontare i prezzi usando il metodo del vicino più vicino. Leggete i miei post precedenti. Non voglio ripetermi.
Certo che l'ho letto, è quello che sto dicendo.
 
gpwr:

Per evitare di aprire un thread separato, ho deciso di descrivere qui i risultati della mia ricerca sui modelli. Forse farà risparmiare tempo a qualcuno e darà a qualcuno nuove idee.

Nel 2006, quando mi sono interessato per la prima volta al Forex, la mia prima idea è stata quella di confrontare le ultime N barre (pattern attuale) con tutti i pattern passati della stessa quotazione, utilizzando il coefficiente di correlazione come misura di somiglianza. Questo è lo stesso metodo del nearest neighbour (SN). Il vantaggio del coefficiente di correlazione rispetto alla lunghezza euclidea è che tiene conto della distorsione dell'asse dei prezzi. Ho costruito un Expert Advisor utilizzando questo metodo che ha mostrato una redditività straordinaria per 2-3 mesi di test in avanti (10к in 10М o qualcosa di simile), ma poi perdeva 2-3 mesi. E così la sequenza: un enorme profitto, poi una perdita totale. Sono tornato più volte a questo metodo BS, ho fatto comitati di vicini, ecc, ma il risultato è stato lo stesso. Alla fine sono rimasto deluso e ho messo il codice del metodo BS nella base su 5.

Nel 2007-2008 mi sono interessato a PNN, in particolare a GRNN. L'essenza è la stessa di BS, ma invece di selezionare alcuni (o pochi, come nel comitato) vicini simili, tutti i modelli passati sono selezionati automaticamente e la loro influenza sulla previsione è pesata da una funzione esponenziale come exp(-measure_difference). Così le parti di storia più simili sono pesate esponenzialmente di più. Puoi prendere i prezzi dei modelli (meno la media) e calcolare la distanza euclidea come misura della differenza, oppure puoi prendere la differenza delle letture vettoriali di alcuni indici. L'accuratezza della previsione era leggermente superiore al metodo BS, 52% invece di 50,5% (non ricordo esattamente).

La mia ultima idea era quella di utilizzare i metodi usati dal nostro cervello per trasformare le informazioni. Ho descritto questi metodi in dettaglio il 5. L'essenza di uno di essi è trovare modelli (o funzioni di base) in cui i prezzi correnti possono essere scomposti. Come

Prezzo[i] = somma (a[k]*funzione[i][k], k=1...L) i=1...N

Naturalmente, possiamo prendere le funzioni trigonometriche invece di cercare le basi e usare la trasformata di Fourier. Ma è più probabile trovare le funzioni di base sulla storia usando il metodo della codifica rarefatta. L'essenza di questo metodo consiste nell'adattamento del modello lineare menzionato nei prezzi a vari intervalli storici di lunghezza N da parte di ANC in modo tale che l'errore specificato sia raggiunto al minor numero di coefficienti non nulli a[k], k=1...L. Idealmente, ogni vettore di prezzo storico contiene solo una funzione base (o pattern). Ad ogni passo i coefficienti e le funzioni stesse sono ottimizzati. Ci sono molti parametri che non si conoscono in anticipo. Per esempio, la lunghezza del modello N, il numero di funzioni di base nel dizionario L, il numero di coefficienti non nulli nella nostra decomposizione (io scelgo 3, come ogni segmento di prezzo consiste nella coda del vecchio modello, il modello attuale e l'inizio del nuovo modello). È importante che N*L sia molto inferiore alla lunghezza dell'intera storia, altrimenti l'algoritmo troverà modelli uguali ai prezzi passati stessi e quindi avremo qualcosa come il metodo dei vicini più vicini. Per esempio, il dizionario di 64 pattern lunghi 64 barre ciascuno per EURUSD H1 addestrato tramite codifica disgiunta sulla storia del 1999-2010 (74 barre) sarà come questo

Ho notato la seguente regolarità: più lungo è il modello e maggiore è il numero di essi nel dizionario, maggiore è il profitto nel bactest, che può essere spiegato dal sovrallenamento. Ma in ogni caso, con N e L diversi, il test in avanti sembra chiacchierare intorno al profitto zero. Comincio ad essere frustrato dagli schemi. Apparentemente non sono costanti nel forex, o in altre parole il forex non ha memoria per i modelli - ne vengono creati di nuovi ogni volta.


Hai qualche esperienza con la rete Echo State? http://www.scholarpedia.org/article/Echo_state_network
 
yacoov:

Avete qualche esperienza con la rete Echo State? https://www.mql5.com/go? link=http://www.scholarpedia.org/article/Echo_state_network

Chiedi a TheXpert . Ha esperienza.
 
gpwr: Non ho mai sentito parlare di correlazione tra segnali binari. A proposito, ho provato a codificare i modelli con una sequenza binaria usando uno zigzag. Ha preso le ultime 6 ginocchia in alto e 6 ginocchia in basso.

Ho cercato su Google la correlazione dei segnali binari, sembrava più facile XOR e contare il numero 1 nel risultato

hai preso 6 ginocchia ZZ, questo è il problema: non so quante barre (uso barre con frattali, da 8 a 16) usare per l'analisi

gpwr:Il sistema si basa sul presupposto che ci sono modelli ripetitivi nelle citazioni.

L'ipotesi che il mercato contenga schemi o regolarità è corretta, ma queste regolarità appaiono o meno senza una periodicità apparente. Cioè, l'analisi tecnica funziona, ma nessuno può dire in quale momento nel tempo. Apparentemente, la ricerca e l'analisi dei modelli è simile al compito di ottimizzare gli esperti di indicatori, se è così, si scopre che perdiamo il nostro tempo - è più facile scrivere un esperto di auto-ottimizzazione che sceglierebbe la selezione di indicatori (strategie) secondo la storia attuale

Ho intenzione di fare qualche ricerca per l'euro, ma finora non ne ho trovate - forse le croci hanno più regolarità?

 
sever32:
Certo che l'ho letto, è quello che sto dicendo.


Allora non capisco la sua domanda: "Non ho trovato nessuna giustificazione per cui il vostro sistema dovrebbe funzionare, per me stesso". Giustificazione per cosa:

1. giustificazione dell'ipotesi che ci siano schemi che si ripetono? Oppure

2. la logica dietro il metodo di codifica disgiunta per trovare questi modelli?

3. O una logica per qualcos'altro?

 
IgorM:

Ho cercato su Google la correlazione dei segnali binari, sembrava più facile XOR e contare il numero 1 nel risultato

hai preso 6 ginocchia di ZZ, questo è il problema: non sai quante barre (io uso barre con frattali, da 8 a 16) usare per l'analisi

L'ipotesi che il mercato contenga schemi o regolarità è corretta, ma queste regolarità appaiono o meno senza una periodicità apparente. Cioè, l'analisi tecnica stessa funziona ma nessuno può dire in quale momento nel tempo. Apparentemente, la ricerca e l'analisi dei modelli è simile al compito di ottimizzare gli esperti di indicatori, se è così, si scopre che perdiamo il nostro tempo - è più facile scrivere un esperto di auto-ottimizzazione che sceglierebbe la selezione di indicatori (strategie) in base alla storia attuale

Ho un'idea per cercare l'euro, ma non l'ho mai trovato - forse le croci hanno più regolarità?


6 ginocchia in alto e 6 ginocchia in basso erano abbastanza per il periodo H1. Giudicate voi stessi. Supponiamo che l'ultimo ginocchio zz sia il ginocchio in alto. Numeriamo le ginocchia 1v-6v, 1n-6n. Poi abbiamo questa sequenza di bit:

Bit 1: -1 = 1v < 2v, 1 = 1v > 2v

bit 2: -1 = 1v < 3v, 1 = 1v > 3v

...

Bit 5: -1 = 1v < 6v, 1 = 1v > 6v

bit 6: -1 = 2v < 3v, 1 = 1v > 3v

e così via, per tutte le ginocchia su e giù. Un totale di 30 bit. Il numero di modelli che possono essere descritti da 30 bit = 2^30. Ma non tutti i bit sono importanti. Per esempio, confrontare il ginocchio 1v più recente con il ginocchio 4v, 5v e 6v non è importante nella maggior parte dei casi. Ma non si può determinare in anticipo quali bit sono importanti e quali no. È necessario ottimizzare per storia in modo che ogni schema sia descritto con il minor numero possibile di bit non-zero ("importanti"). Questo è ciò che richiede molto tempo. Aggiungere più ginocchia alla descrizione di un modello porta a un dizionario di modelli troppo istruito e a una mancanza di generalizzazione.

Confrontare i modelli "non rigidamente" e permettere ad alcuni bit di non corrispondere significa che quei bit non sono importanti per quel modello e sono annullati nel mio sistema. I bit zero non erano affatto abbinati. Di nuovo, questo sistema di descrizione del modello basato su zz usando bit binari non ha nulla in comune con il sistema di ricerca del modello basato sulla codifica non caricata, che ho riportato nella pagina precedente. In quel sistema, i campioni-tipo consistevano nei prezzi stessi e si adattavano al modello ISC attuale. La somiglianza del modello attuale con il modello esemplare era giudicata dall'errore ISC (anche se in realtà era più complicato di così).

 
gpwr:

Un totale di 30 bit. Il numero di modelli che possono essere descritti da 30 bit = 2^30. Ma non tutti i bit sono importanti. Per esempio, confrontare il ginocchio 1v più recente con il ginocchio 4v, 5v e 6v non è importante nella maggior parte dei casi.

si è dato da fare di nuovo con la ricerca statistica sui pattern, cercando corrispondenze sulla storia ai "pattern a 8 bit", in pratica non importa come...

Ho notato una caratteristica interessante: ci sono sequenze ripetute (dal mio algoritmo) di barre sulla storia, meno del 30% della storia rientrano nella codifica, il che provoca immediatamente la conclusione precedentemente annunciata che il trading per modelli è difficile da implementare a causa della loro rara occorrenza ....

circa:

numeri del modellonumeromodello ##numeromodello ## no.no.
1 83 11 3 21 2
2 34 12 3 22 2
3 19 13 3 23 2
4 12 14 3 24 2
5 6 15 3 25 1
6 5 16 3 26 1
7 5 17 2 27 1
8 4 18 2 28 1
9 4 19 2 29 1
10 4 20 2 30 1

Ma se non ci sono molti modelli sulla storia secondo il mio algoritmo di codifica, allora più del 60% della storia non contiene affatto le parti ripetibili della storia, e possiamo assumere che questo 60% di informazioni non apparirà in futuro

Per ora è un po' caotico, ci penserò ancora un po'.

 
IgorM: Finora è un po' sconclusionato, ci penserò ancora un po'.

All'inizio ho pensato che sarebbe stato più logico usare i modelli risultanti per analogia con le azioni di mercato sulla storia, ma ho deciso di visualizzare i modelli semplicemente con i numeri:

L'altezza della barra dell'indicatore è il numero del modello, i vuoti sono l'assenza di combinazioni simili sulla storia, finora sono arrivato a quanto segue - sembra che i modelli siano i cosiddetti attrattori, da Wiki si adattano alla descrizione: ".... e dispari (irregolare - spesso frattale e / o in qualche sezione organizzata come un insieme cantor; la dinamica su di loro è di solito caotica)". Infatti, nella fase iniziale della progettazione di un algoritmo di ricerca di modelli, ho usato gli insiemi di Cantor

SZZ: finora così caotico, ci penserò ancora un po' :)

 
wmlab:

Qualcuno di voi ha notato che spesso due grafici intraday EURUSD o GBPUSD sono simili? Non sempre, naturalmente, ma spesso il modello di ieri si ripete sorprendentemente oggi, su cui si può cercare di trarre profitto. Ma...

I picchi e le depressioni, pur ripetendo il modello, non coincidono nel tempo. Per esempio, il tuffo di metà giornata di ieri è iniziato alle 14:15 e quello di oggi alle 13:00. Ci sono molti criteri di somiglianza - Spearman, Pearson, minimi quadrati, ma non ne conosco nessuno che confronti grafici soggetti a piccole distorsioni sull'asse X. Nessuno conosce metodi simili?



Non siete soli in questo mondo.
File:
 
IgorM:

All'inizio ho pensato che sarebbe stato più logico usare i modelli ottenuti per analogia con le azioni di mercato sulla storia, ma ho deciso di disegnare semplicemente i modelli con i numeri ed è venuto fuori così:

L'altezza della barra dell'indicatore è il numero del modello, i vuoti sono l'assenza di combinazioni simili sulla storia, finora sono arrivato a quanto segue - sembra che i modelli siano i cosiddetti attrattori, da Wiki si adattano alla descrizione: ".... e dispari (irregolare - spesso frattale e / o in qualche sezione organizzata come un insieme cantor; la dinamica su di loro è di solito caotica)". In effetti, nella fase iniziale della progettazione di un algoritmo di ricerca di modelli, ho usato gli insiemi di Cantor

ZS: è un po' caotico finora, ci penserò ancora un po' :)


Modelli basati su DTW?
Motivazione: