Распределение ценовых приращений - страница 15

 
nahdi:

Вообще-то как раз об этом я и хотел спросить - для чего интересоваться данной темой опытному физику, статисту(ну и кем там вы еще являетесь)? Не лучше ли финансами заняться финансистам? Каждый должен заниматься своим делом. А если таковое отсутствует это заставляет задуматься.

Или физик - это призвание, как говаривал господин Медведев... хочешь денег - иди в бизнес. Хочешь потерять деньги - иди на финансовые рынки...


Согласен. С точки зрения обычных жизненных понятий и ценностей - мне на форексе делать нечего (как физику), т.к. мне нужны ясное представление о процессе, выраженное в аналитических формулах. Но, все-таки иногда я буду приходить на форум с какими-либо теоретическими результатами. Теперь это у меня как хобби - не водку же пить в свободное время, в самом деле:))))

 
Alexander_K:

Согласен. С точки зрения обычных жизненных понятий и ценностей - мне на форексе делать нечего (как физику), т.к. мне нужны ясное представление о процессе, выраженное в аналитических формулах. Но, все-таки иногда я буду приходить на форум с какими-либо теоретическими результатами. Теперь это у меня как хобби - не водку же пить в свободное время, в самом деле:))))

Если бы у рынка была формула это бы был не рынок!!! Всё кроется в банальном спросе и предложении. Если хотите формул - почитайте про модели ценообразования. Но это не что иное, как способы ограничения рисков.

И кто знает - может лучше выпить водки, чем насиловать мозг непонятными цифрами

 
Alexander_K:

Я вот о чем подумал.

Если верно утверждение о том, что nonparametric skew для форекс-распределения инвариантен и равен +-0.185, то это может означать (без мистики:)))) только одно.

Обратите внимание, что для нормального распределения,  его половина (т.н. Half-normal distribution) имеет nonparametric skew=0.36279.

В данном случае мы имеем в среднем некое Half-unknow distribution которое имеет nonparametric skew=0.185, а если посмотреть с двух сторон - то увидим симметричное нормально-подобное распределение.

Опять вопросы:

1. Раз уж Вы повторно используете слово "инвариантен", повторно спрошу: что Вы под этим подразумеваете в данном случае, для отношения k = (медиана - среднее)/(стандартное отклонение)?

2. Меня заинтересовало, какие данные были подобраны для анализа. Догадываюсь, что шаги курса вверх анализировались отдельно от шагов курса вниз, иначе и медиана, и среднее при выборках объемом в 10 и более тысяч были бы в сотни раз меньше стандартного отклонения, и модуль k=0.185 нигде бы не был. Это так?

3. Если так, то как может быть медиана меньше среднего при наличии тяжелых хвостов (выбросов)? https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D0%B4%D0%B8%D0%B0%D0%BD%D0%B0_(%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0):

"Предположим, что в одной комнате оказалось 19 бедняков и один миллионер. У каждого бедняка есть $5, а у миллионера — $1 млн (106). В сумме получается $1 000 095. Если мы разделим деньги равными долями на 20 человек, то получим $50 004,75. Это будет среднее арифметическое значение суммы денег, которая была у всех 20 человек в этой комнате.

Медиана в этом случае будет равна $5 (полусумма десятого и одиннадцатого, срединных значений ранжированного ряда). Можно интерпретировать это следующим образом. Разделив нашу компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе у каждого не больше $5, во второй же не меньше $5. В общем случае можно сказать, что медиана это то, сколько принёс с собой «средний» человек. Наоборот, среднее арифметическое — неподходящая характеристика, так как оно значительно превышает сумму наличных, имеющуюся у среднего человека."


и просьба: не могли бы Вы в соответствии с Вашим предложением https://www.mql5.com/ru/forum/218475/page14#comment_6040781:

"4. Графиков нет - массивы формируются динамически и они гигантские по размеру - я сохранял только результаты. В принципе, интересующиеся могут повторить мои эксперименты в VisSim или MathLab (в этой системе - не уверен, т.к. не работал с ней)." 

опубликовать здесь весь миллион (полтора) анализируемых тиков. Думаю, Excel справится с подсчетом k для миллиона строк.

Распределение ценовых приращений
Распределение ценовых приращений
  • 2017.11.10
  • www.mql5.com
Уважаемые трейдеры...
 
Vladimir:

... Так что, анализируя тики, мы анализируем совсем не Форекс, а свойства алгоритмов генерации котировок данным ДЦ по данной паре на данном типе счета в выбранный период времени. И здесь можно обнаружить много чудес. Например, подачу лохматых (грубо говоря, нефильтрованных) или даже специально взлохмаченных (например, путем "перерегулирования") котировок на демосчета как способ завлечения клиентов на реальные счета. Или такие признаки "молодости" компании, когда она допускает много арбитражных ситуаций (которые Вы, вероятно, заметили, когда говорили о выбросах за 7 сигм) уже на реальных счетах.

Отличное замечание! Кстати, тоже решаемая задача. Достаточно взять несколько ДЦ и сравнить распределния тиков по одной и то же валютной паре. Если отличаются, значит шаманство имеет место...
 
Dennis Kirichenko:
Отличное замечание! Кстати, тоже решаемая задача. Достаточно взять несколько ДЦ и сравнить распределния тиков по одной и то же валютной паре. Если отличаются, значит шаманство имеет место...
Согласен. Простейшие фильтры нужны. Еще раз перепроверил. Брал среднее между двумя пришедшими подряд тиками. Распределение становится более сжатым и "гладким", т.е. меняется коэффициент масштаба - работать становится удобнее, а инвариантность не меняется. И это хорошо!
 

Короче не получилось у меня пока найти skew=0.185. Проверял на bid-тиках EURUSD. Может потому что были и нули? Взял без них и получил что-то около 0,3.

 

Да, собственно над чем я сейчас работаю.

Если мы имеем дело с единым распределением, которое "в среднем" присутствует на каждом ТФ, т.е. при любом объеме выборки - то алгоритм решения задачи в первом приближении таков:

1. Для конкретного объема выборки рассчитывается средняя дисперсия на большом периоде времени. Дисперсия в данном случае меняется при переходе от одной выборки к другой, т.е. не является инвариантной и нужно знать именно ее среднее значение.

2. Строятся линии поддержки/сопротивления относительно взвешенной скользящей средней (где вес - это значение плотности вероятности для данного значения приращения) при данном объеме выборки с учетом вычисленной средней дисперсии и квантилей t2-распределения. Это - необходимая базовая вещь, которая и описывает эффект "памяти" немарковского процесса.

3. При выходе цены за эти линии, анализируются те коэффициенты, которые в среднем инвариантны, но на данном этапе имеют значение отличное от эталонного значения.

К примеру, если nonparametric skew сейчас равен =0.4, то сравнивая с 0.185 делаем вывод, что распределение скошено значительно и в среднем цена просто обязана вернуться к взвешенному среднему  - заключаем сделку против тренда. И наоборот.

Однако, полагаю, что одного инвариантного коэффициента маловато - надо найти еще один хотя бы...

 
Dennis Kirichenko:

Короче не получилось у меня пока найти skew=0.185. Проверял на bid-тиках EURUSD. Может потому что были и нули? Взял без них и получил что-то около 0,3.

Отлично, Денис!!! В чем делали? В Матлабе? 0.3 остается одинаковым для любых выборок???
 
Alexander_K:

1. Для конкретного объема выборки рассчитывается средняя дисперсия на большом периоде времени. Дисперсия в данном случае меняется при переходе от одной выборки к другой, т.е. не является инвариантной и нужно знать именно ее среднее значение.

2. Строятся линии поддержки/сопротивления относительно взвешенной скользящей средней (где вес - это значение плотности вероятности для данного значения приращения) при данном объеме выборки с учетом вычисленной средней дисперсии и квантилей t2-распределения. Это - необходимая базовая вещь, которая и описывает эффект "памяти" немарковского процесса.

3. При выходе цены за эти линии, анализируются те коэффициенты, которые в среднем инвариантны, но на данном этапе имеют значение отличное от эталонного значения.

К примеру, если nonparametric skew сейчас равен =0.4, то сравнивая с 0.185 делаем вывод, что распределение скошено значительно и в среднем цена просто обязана вернуться к взвешенному среднему  - заключаем сделку против тренда. И наоборот.

Не получается ли в результате, что приходим опять к некоему параметру, требующему оптимизации - в данном случае "конкретному объему выборки"? И это тянет за собой все "прелести" оптимизации, нивелируя вероятностный подход.

 
Stanislav Korotky:

Не получается ли в результате, что приходим опять к некоему параметру, требующему оптимизации - в данном случае "конкретному объему выборки"? И это тянет за собой все "прелести" оптимизации, нивелируя вероятностный подход.

На данный момент картина следующая - точки входа в сделку получаются отлично при объеме выборки "покрывающем" большинство значений t2-распределения, т.е. от 1000 и более. А вот точки выхода - нет. Каким-то образом зависят от других параметров - т.е. нельзя утверждать, что цена при контртрендовой торговле обязательно достигнет скользящей взвешенной средней. Иногда не хватает буквально 100 тиков, а цена начинает идти вверх, не достигая средней. Есть над чем подумать... Вот для точек выхода - Вы правы объем выборки  требует оптимизации...
Причина обращения: