Распределение ценовых приращений

 

Уважаемые трейдеры!

На досуге перечитал много тем на данном форуме - во многих из них обсуждается проблема определения вида распределения случайной величины returns (т.н. ценовых приращений). Для себя понял, что эта задача не решена и, имея, некоторым образом :) :) :), соответствующее образование и навыки, решил поучаствовать в решении этой задачи.

Итак, постановка задачи:

Определить по тиковым данным определенной валютной пары распределение вероятностей последовательных ценовых приращений Bid и Ask (т.е. анализировался набор данных, состоящий из разности между текущим и предыдущим значениями цены Ask и такой же набор для цены Bid). Должны быть представлены в аналитическом виде формулы плотности вероятности, функции распределения и квантильной функции данного распределения.

Задача оказалась, безусловно, непростой. Сражу скажу, что это распределение не является ни одним из широко обсуждаемых - ни нормальным, ни логистическим, ни Лапласа, ни Коши, и т.д. и т.п.

Перед тем как назвать Вам это распределение (точнее говоря, это - семейство распределений, т.к. разные валютные пары имеют разные значения коэффициента масштаба, который, в общем случае, не совпадает со стандартным отклонением), ответьте мне, пожалуйста, на пару вопросов - а что, собственно, дает знание этого распределения? Каким образом это поможет в торговле на рынке Forex?

С уважением,

случайно проходивший мимо и заинтересовавшийся рынком Forex

Alexander_K :) :)

 
Alexander_K:

Уважаемые трейдеры!

На досуге перечитал много тем на данном форуме - во многих из них обсуждается проблема определения вида распределения случайной величины returns (т.н. ценовых приращений). Для себя понял, что эта задача не решена и, имея, некоторым образом :) :) :), соответствующее образование и навыки, решил поучаствовать в решении этой задачи.

Итак, постановка задачи:

Определить по тиковым данным определенной валютной пары распределение вероятностей последовательных ценовых приращений Bid и Ask (т.е. анализировался набор данных, состоящий из разности между текущим и предыдущим значениями цены Ask и такой же набор для цены Bid). Должны быть представлены в аналитическом виде формулы плотности вероятности, функции распределения и квантильной функции данного распределения.

Задача оказалась, безусловно, непростой. Сражу скажу, что это распределение не является ни одним из широко обсуждаемых - ни нормальным, ни логистическим, ни Лапласа, ни Коши, и т.д. и т.п.

Перед тем как назвать Вам это распределение (точнее говоря, это - семейство распределений, т.к. разные валютные пары имеют разные значения коэффициента масштаба, который, в общем случае, не совпадает со стандартным отклонением), ответьте мне, пожалуйста, на пару вопросов - а что, собственно, дает знание этого распределения? Каким образом это поможет в торговле на рынке Forex?

С уважением,

случайно проходивший мимо и заинтересовавшийся рынком Forex

Alexander_K :) :)

Зная распределение, будет известна закономерность, которая приводит к тому, что распределение именно такое. Эту закономерность можно торговать. Но если было бы так просто, математики ограбили весь рынок. 
На рынке все меняется и если узнать тип распределения, то завтра он будет другим. Задача не в этом вовсе, а в том, как стабильно зарабатывать, зная что абсолютно все параметры, которые можно измерить - нестабильны.
Есть еще одна проблема) тиковые бид и аск на форексе не настоящие. Каждый брокер свои тики делает. И соответственно распределение разное получится. 
Но выход есть!
 
Alexander_K:

Уважаемые трейдеры!

На досуге перечитал много тем на данном форуме - во многих из них обсуждается проблема определения вида распределения случайной величины returns (т.н. ценовых приращений). Для себя понял, что эта задача не решена и, имея, некоторым образом :) :) :), соответствующее образование и навыки, решил поучаствовать в решении этой задачи.

Итак, постановка задачи:

Определить по тиковым данным определенной валютной пары распределение вероятностей последовательных ценовых приращений Bid и Ask (т.е. анализировался набор данных, состоящий из разности между текущим и предыдущим значениями цены Ask и такой же набор для цены Bid). Должны быть представлены в аналитическом виде формулы плотности вероятности, функции распределения и квантильной функции данного распределения.

Задача оказалась, безусловно, непростой. Сражу скажу, что это распределение не является ни одним из широко обсуждаемых - ни нормальным, ни логистическим, ни Лапласа, ни Коши, и т.д. и т.п.

Перед тем как назвать Вам это распределение (точнее говоря, это - семейство распределений, т.к. разные валютные пары имеют разные значения коэффициента масштаба, который, в общем случае, не совпадает со стандартным отклонением), ответьте мне, пожалуйста, на пару вопросов - а что, собственно, дает знание этого распределения? Каким образом это поможет в торговле на рынке Forex?

С уважением,

случайно проходивший мимо и заинтересовавшийся рынком Forex

Alexander_K :) :)


На самом деле (ИМХО) нет ни какой зависимости текущей цены от предыдущей. Те кто ищет это распределения просто хотят выявить существующую на текущий момент времени и на выбранном временном интервале, тенденцию на рынке (тренд вверх, тренд вниз или флет). После того как тенденция определена трейдер ищет возможность получить из этого профит.

 
Vitalii Ananev:

На самом деле (ИМХО) нет ни какой зависимости текущей цены от предыдущей. Те кто ищет это распределения просто хотят выявить существующую на текущий момент времени и на выбранном временном интервале, тенденцию на рынке (тренд вверх, тренд вниз или флет). После того как тенденция определена трейдер ищет возможность получить из этого профит.

На самом деле зависимость есть. На рынке присутствует память, по тому что каждая сделка это деньги и если сделка была открыта, ее рано или поздно закроют.
 
Alexander_K:

 - а что, собственно, дает знание этого распределения? Каким образом это поможет в торговле на рынке Forex?

Модели GARCH, имеющие на входе логарифм приращений, состоят из трех частей: модели тренда, модели волантильности и модели распределения приращений. Существует огромная литература об этих распределениях, их влиянии на алгоритмы, отличия валютных пар по типам распределений и прочая.... Поднятый Вами вопрос с 30-ти летней бородой. Основным математическим инструментом на финансовых рынках являются GARCH, которых очень много. В ветке по машинному обучению я давал подбор литературы - цепляю повторно.

На сегодняшний день наиболее широко используется скошенное t-распределение. Но повторяю, что полная модель состоит из трех компонентов.

Имеется готовые пакеты программ, которые широко используются в реальной торговле. Результаты имеются в открытых публикациях. Из R можно назвать: fgarch, rugarch, но они не единственные.  

Файлы:
 
Maxim Romanov:
На самом деле зависимость есть. На рынке присутствует память, по тому что каждая сделка это деньги и если сделка была открыта, ее рано или поздно закроют.

Спорить не буду у каждого есть на этот счет свое мнение, но если бы такая зависимость была то можно было бы путем экстраполяции предсказывать будущее движение цены с гораздо большей точностью чем 50 на 50. 

 
СанСаныч Фоменко:

Модели GARCH, имеющие на входе логарифм приращений, состоят из трех частей: модели тренда, модели волантильности и модели распределения приращений. Существует огромная литература об этих распределениях, их влиянии на алгоритмы, отличия валютных пар по типам распределений и прочая.... Поднятый Вами вопрос с 30-ти летней бородой. Основным математическим инструментом на финансовых рынках являются GARCH, которых очень много. В ветке по машинному обучению я давал подбор литературы - цепляю повторно.

На сегодняшний день наиболее широко используется скошенное t-распределение. Но повторяю, что полная модель состоит из трех компонентов.

Имеется готовые пакеты программ, которые широко используются в реальной торговле. Результаты имеются в открытых публикациях. Из R можно назвать: fgarch, rugarch, но они не единственные.  


Да, Вы указали очень близкое приближение - скошенное t-распределение.

На самом деле, мои расчеты дали так называемое нестандартизованное t-распределение Стьюдента с числом степеней свободы = 2. Коэффициент масштаба не равен стандартному отклонению и для каждой валютной пары вычисляется отдельно.

Однако, это верно именно для ценовых приращений. Реальные цены образуют некую смесь этих t-распределений и знание распределения приращений мне лично понимания процесса в целом не дает.

Тем не менее, прошу данную тему не закрывать - может какая-то светлая голова скажет. как из знания частного получить знание общего, это было бы невероятно круто.

Со своей стороны обещаю выкладывать свои математические упражнения в этой области и внимательно читать отзывы и комментарии.

С уважением.

Alexander_K

 
Vitalii Ananev:

Спорить не буду у каждого есть на этот счет свое мнение, но если бы такая зависимость была то можно было бы путем экстраполяции предсказывать будущее движение цены с гораздо большей точностью чем 50 на 50. 


При помощи экстраполяции нельзя предсказать по нескольким причинам. Во первых нужно чтобы была правильная частота дискретизации, Если дискретизировать синусоиду с рандомным временем, то даже синусоиду нельзя предсказать будет. А во вторых, по чему это можно будет предсказать ,если не известно, когда каждый участник закроет сделку? Известно что все участники открывшие сделки, закроют их, но когда, тут уже неопределенность. Или вы не согласны с тем, что все открытые сделки будут закрыты? 

 

Это дает то, что существует больше больших отклонений от среднего чем в нормальном распределении и чем меньше выборка тем шанс получить большую ошибку увеличивается.. Это просто распределение с толстыми хвостами, всем давно известно что котировки не распределены нормально. Обычно связывают с наличием памяти или инерции, т.е. за большими изменениями следуют большие изменения котировок, за небольшими изменениями следуют небольшие (в среднем), но небольших изменений все равно больше чем больших.

Если так, то предсказать котировки в одной временной системе не представляется возможным, т.е. момент перехода от больших изменений к небольшим и обратно угадать невозможно статистически. Поэтому приходится смотреть котировки в разных временных масштабах и сопоставлять вероятности. В итоге все равно упираемся в историю котировок и максимальный масштаб, когда уже сложно или невозможно определить какие на рынке приращения на данный момент - маленькие или большие. 

Но для каких-то приемлемых горизонтов событий и при определенных ситуациях, вероятно, можно предсказывать + поиск неэффективностей, которые отчасти и формируют толстые хвосты

 
Maxim Dmitrievsky:

Это дает то, что существует больше больших отклонений от среднего чем в нормальном распределении и чем меньше выборка тем шанс получить большую ошибку увеличивается.. Это просто распределение с толстыми хвостами, всем давно известно что котировки не распределены нормально. Обычно связывают с наличием памяти, т.е. за большими изменениями следуют большие изменения котировок, за небольшими изменениями следуют небольшие (в среднем), но небольших изменений все равно больше чем больших.


Приведу конкретный пример из моих расчетов.

Для валютной пары EURJPY распределение ценовых приращений является нестандартизованным t-распределением Стьюдента с 2 степенями свободы и коэффициентом масштаба (сигма) = 1.43 пункта (прошу извинить за излишнюю математическую дотошность). 95% значений ценовых приращений находятся в толерантном интервале +-6.19 сигма. Означает ли это, что для определенной выборки, при выходе цены за указанный интервал можно заключать сделку? Имеет ли смысл точность моих расчетов вплоть до тысячных долей процента?

 
Alexander_K:

Приведу конкретный пример из моих расчетов.

Для валютной пары EURJPY распределение ценовых приращений является нестандартизованным t-распределением Стьюдента с 2 степенями свободы и коэффициентом масштаба (сигма) = 1.43 пункта (прошу извинить за излишнюю математическую дотошность). 95% значений ценовых приращений находятся в толерантном интервале +-6.19 сигма. Означает ли это, что для определенной выборки, при выходе цены за указанный интервал можно заключать сделку? Имеет ли смысл точность моих расчетов вплоть до тысячных долей процента?


Стесняюсь спросить, а толерантном для кого? Вроде как обычно берут 3 сигмы...

СанСаныч дал много интересной инфы и её источников в этой сфере. Насколько помню, только упомянутые GARCH-модели имеют дело не с тиками, а с приращениями close на дневках.
Причина обращения: