Distribuzione degli incrementi di prezzo - pagina 15

 
nahdi:

In realtà, questo è quello che volevo chiedere - perché un fisico esperto, uno statistico (o qualunque cosa tu sia) dovrebbe essere interessato a questo argomento? Le finanze non sarebbero meglio gestite dai finanzieri? Ognuno dovrebbe farsi gli affari suoi. E se non c'è, fa pensare.

O il fisico è una vocazione, come diceva il signor Medvedev... Se vuoi soldi, mettiti in affari. Se vuoi perdere soldi, entra nei mercati finanziari...


Sono d'accordo. Dal punto di vista dei concetti e dei valori della vita comune - non ho niente da fare nel Forex (come fisico), perché ho bisogno di una chiara comprensione del processo espresso in formule analitiche. Ma comunque, a volte vengo nel forum con alcuni risultati teorici. Ora è come un hobby per me - non per bere vodka nel mio tempo libero, davvero:))))

 
Alexander_K:

Sono d'accordo. In termini di concetti e valori della vita ordinaria - non ho niente da fare nel forex (come fisico), poiché ho bisogno di una chiara comprensione del processo espresso in formule analitiche. Ma comunque, a volte vengo nel forum con alcuni risultati teorici. Ora è come un hobby per me - non bevo vodka nel mio tempo libero, davvero:))))

Se il mercato avesse una formula non sarebbe il mercato!!! È tutta una banale questione di domanda e offerta. Se volete delle formule, leggete i modelli di prezzo. Ma questi non sono altro che modi per limitare il rischio.

E chissà - forse è meglio bere una vodka che scervellarsi con numeri incomprensibili.

 
Alexander_K:

Ecco cosa pensavo.

Se l'affermazione che lo skew non parametrico per la distribuzione Forex è invariante ed è uguale a +-0.185 è vera, può significare (senza misticismo:))))) solo una cosa.

Si noti che per una distribuzione normale, la sua metà (la cosiddettadistribuzione seminormale) ha uno skew non parametrico = 0,36279.

In questo caso abbiamo in media unadistribuzione semisconosciuta che ha skew non parametrico=0,185, e se la guardiamo da entrambi i lati vedremo una distribuzione simmetrica di tipo normale.

Ancora domande:

1. Dato che lei usa ripetutamente la parola "invariante", le chiedo di nuovo: cosa intende in questo caso, per il rapporto k = (mediana - media)/(deviazione standard)?

2. Ero interessato a quali dati sono stati selezionati per l'analisi. La mia ipotesi è che i passi di salita siano stati analizzati separatamente dai passi di discesa, altrimenti sia la mediana che la media in campioni di 10 mila o più sarebbero centinaia di volte più piccole della deviazione standard, e il modulo k=0,185 non si troverebbe da nessuna parte. È vero?

3. Se sì, come può la mediana essere inferiore alla media in presenza di code pesanti (outlier)? https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D0%B4%D0%B8%D0%B0%D0%BD%D0%B0_(%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0):

"Supponiamo che ci siano 19 poveri e un milionario nella stessa stanza. Ogni povero ha 5 dollari e il milionario ha 1 milione di dollari(106). Il totale è di 1.000.095 dollari. Se dividiamo il denaro in parti uguali tra le 20 persone, otteniamo 50.004,75 dollari. Questa sarà la media aritmetica della quantità di denaro che tutte le 20 persone in quella stanza avevano.

La mediana in questo caso sarebbe 5 dollari (la semisomma del decimo e dell'undicesimo, i valori medi della serie classificata). Possiamo interpretare questo come segue. Dividendo la nostra società in due gruppi uguali di 10 persone, possiamo dire che tutti nel primo gruppo non hanno più di 5 dollari, mentre tutti nel secondo gruppo non hanno meno di 5 dollari. In generale, possiamo dire che la mediana è quanto ha portato la persona "media". Al contrario, la media aritmetica è una caratteristica inappropriata, poiché è significativamente più alta della quantità di denaro che la persona media possiede".


e una richiesta: potreste per favore in accordo con il vostro suggerimento https://www.mql5.com/ru/forum/218475/page14#comment_6040781

"4. Non ci sono grafici - gli array sono generati dinamicamente e sono di dimensioni gigantesche - ho salvato solo i risultati. In linea di principio, chi è interessato può ripetere i miei esperimenti in VisSim o MathLab (in questo sistema - non sono sicuro, perché non ci ho lavorato)".

Pubblica qui l'intero milione (uno e mezzo) di zecche analizzate. Penso che Excel possa gestire il calcolo di k per un milione di linee.

Распределение ценовых приращений
Распределение ценовых приращений
  • 2017.11.10
  • www.mql5.com
Уважаемые трейдеры...
 
Vladimir:

... Quindi, analizzando i ticks non analizziamo affatto il Forex, ma le proprietà degli algoritmi di generazione delle quotazioni da parte di questa società di brokeraggio per la coppia data sul tipo di conto dato nel periodo di tempo selezionato. E qui possiamo rilevare molti miracoli. Per esempio, servire quotazioni arruffate (grossomodo, non filtrate) o anche volutamente violate (per esempio, per "sovraregolamentazione") su conti demo come un modo per attirare i clienti verso conti reali. O tali segni di "giovinezza" di un'azienda quando permette un sacco di arbitraggio (che probabilmente hai notato quando parlavi di 7 sigma outliers) già su conti reali.

Buon punto! A proposito, anche questo è un problema risolvibile. Basta prendere diverse società di brokeraggio e confrontare la distribuzione dei tick per la stessa coppia di valute. Se sono diversi, allora lo sciamanesimo ha luogo...
 
Dennis Kirichenko:
Buon punto! A proposito, anche questo è un problema risolvibile. Basta prendere diverse società di brokeraggio e confrontare le distribuzioni di tick per la stessa coppia di valute. Se sono diversi, significa che lo sciamanesimo ha luogo...
Sono d'accordo. Sono necessari semplici filtri. Ricontrollato di nuovo. Ha preso la media tra due tick consecutivi. La distribuzione diventa più compressa e "liscia", cioè cambia il fattore di scala - diventa più conveniente lavorare, e l'invarianza non cambia. E questo è buono!
 

In breve, non sono ancora riuscito a trovareskew=0,185. L'ho controllato su EURUSD bid ticks. Forse perché c'erano anche degli zeri? Li ho presi senza e ho ottenuto qualcosa come 0,3.

 

Sì, in effetti è quello su cui sto lavorando al momento.

Se abbiamo a che fare con un'unica distribuzione, che "in media" è presente in ogni TF, cioè in qualsiasi dimensione del campione - allora l'algoritmo per risolvere il problema in prima approssimazione è il seguente:

1. La varianza media su un ampio periodo di tempo è calcolata per un particolare volume di campione. La varianza in questo caso cambia quando si passa da un campione all'altro, cioè non è invariante ed è il suo valore medio che deve essere conosciuto.

2. Le linee di supporto/resistenza sono tracciate rispetto a una media mobile ponderata (dove il peso è il valore della densità di probabilità per un dato valore dell'incremento) per una data dimensione del campione, tenendo conto della varianza media calcolata e dei quantili della distribuzione t2. Questa è la cosa fondamentale necessaria che descrive l'effetto "memoria" di un processo non markoviano.

3. Quando il prezzo va oltre queste linee, si analizzano quei coefficienti che sono invarianti nella media, ma che in questa fase hanno un valore diverso da quello di riferimento.

Per esempio, se lo skew non parametrico è ora =0,4, confrontandolo con 0,185 concludiamo che la distribuzione è notevolmente skewed e il prezzo deve tornare alla media ponderata - facciamo un accordo contro la tendenza. E viceversa.

Tuttavia, suppongo che un coefficiente invariante non sia sufficiente - dobbiamo trovarne almeno un altro...

 
Dennis Kirichenko:

Finora non sono riuscito a trovareskew=0,185. L'ho controllato su EURUSD bid ticks. Forse perché c'erano anche degli zeri? Li ho presi senza e ho ottenuto qualcosa come 0,3.

Ben fatto, Denis! Cosa hai usato? In Matlab? Lo 0,3 rimane lo stesso per tutti i campioni?
 
Alexander_K:

1. Per una data dimensione del campione, si calcola la varianza media su un ampio periodo di tempo. La varianza in questo caso cambia quando si passa da un campione all'altro, cioè non è invariante ed è la media che deve essere conosciuta.

2. Le linee di supporto/resistenza sono tracciate rispetto a una media mobile ponderata (dove il peso è il valore della densità di probabilità per un dato valore dell'incremento) per una data dimensione del campione, tenendo conto della varianza media calcolata e dei quantili della distribuzione t2. Questa è la cosa fondamentale necessaria che descrive l'effetto "memoria" di un processo non markoviano.

3. Quando il prezzo va oltre queste linee, si analizzano quei coefficienti che sono invarianti nella media, ma che hanno un valore diverso da quello di riferimento in questa fase.

Per esempio, se lo skew non parametrico è ora =0,4, confrontandolo con 0,185 concludiamo che la distribuzione è notevolmente skewed e il prezzo deve tornare alla media ponderata - facciamo un accordo contro la tendenza. E viceversa.

Non torniamo a qualche parametro che deve essere ottimizzato - nel nostro caso "un certo volume di campione"? E questo porta con sé tutto il "fascino" dell'ottimizzazione, livellando l'approccio probabilistico.

 
Stanislav Korotky:

Questo non porta di nuovo a qualche parametro che deve essere ottimizzato - in questo caso "una particolare dimensione del campione"? E questo trascina con sé tutto il "fascino" dell'ottimizzazione, livellando l'approccio probabilistico.

Attualmente, il quadro è il seguente: i punti di entrata in un trade hanno successo quando la dimensione del campione "copre" la maggior parte dei valori della distribuzione t2, cioè da 1000 in su. Ma i punti di uscita no. In qualche modo dipendono da altri parametri - cioè non si può dire che il prezzo raggiungerà necessariamente la media mobile ponderata quando si fa trading in controtendenza. A volte mancano solo 100 tick, e il prezzo inizia a muoversi verso l'alto, senza raggiungere la media mobile. Qualcosa su cui riflettere. Ma per i punti di uscita - hai ragione, il volume del campione deve essere ottimizzato...
Motivazione: