От теории к практике - страница 117

 
СанСаныч Фоменко:

Возраст имеет значение ТОЛЬКО при личном общении, в остальном возраст не подлежит учету - ТОЛЬКО суть.

Все, что Вы тут пытаетесь изложить в наивном виде, уже разработано, используется и имеется обобщение практики. Причем все это чрезвычайно развито.

1. Ваш учет плотности вероятности - сегодня это фишка под названием  Realized GARCH

2. Ваш учет типа распределения - t-распределение - имеются доказательства, что среди целого ряда скошенных распределений более всего подходит именно  t-распределение

3. Ваш интерес к моделированию длинной памяти - это обязательная часть модели. Причем есть доказательства, что имеет смысл возиться с нею, если показатель Херста отличается от 0.5 хотя бы 10%: менее 0.45 - боковик, более 0.55 - трендовая модель.

С размером окна проблемы, но с ними чисто технические трудности: Ваши 12000 наблюдений - чисто технически сложно динамически поддерживать.

Берите, читайте.... Без учета физики и возраста.

Спасибо, СанСаныч Фоменко, за эти сведения о показателе Херста. Оказалось, интересная штука, этот показатель, да еще и крепко связан с методами Aleksander_K2, для иллюстрации этого привожу картинку из приложенной статьи "Кириллов Д.С., Короб О.В., Митин Н.А., Орлов Ю.Н., Плешаков Р.В. Распределения показателя Херста нестационарного маркированного временного ряда // Препринты ИПМ им. М.В.Келдыша. 2013. № 11. 16 с. URL: http://library.keldysh.ru/preprint.asp?id=2013-11"


Как тут не вспомнить обычные для гистограмм Александра логотипы Олимпиады-80. Как мне кажется, многое в статье оказывается близким к тому, что Александр выделяет как этапы, или основные положения своей работы. Вот фрагменты:

Что  касается  потока  событий,  то  он  имеет  четкую  суточную периодичность.  Средневзвешенная  минутная  интенсивность  w(m),
определяемая  формулой (18), показана  на  рис. 3. Этот  профиль  фактически является параметром потока  (m,1)  в течение единицы агрегирования (1 мин).
Для рассматриваемого примера число тиков в сутках варьируется от 38 тыс. до 93 тыс., среднесуточное значение – примерно 70 тыс. тиков. Из предыдущего
анализа  тогда  следует,  что  характерный  временной  промежуток,  на  котором тиковый  ряд  ведет  себя  квазистационарно,  составляет  около  полутора  суток.
Поэтому  на  промежутке  менее  суток  можно  строить  торговые  системы, использующие индикаторы нестационарных разладок,  а на промежутке более
двух  суток  выборка  будет  содержать  разнородные  данные,  что  приведет  к большому проценту ошибочных выводов статистики.

...

Что  касается  детерминации  показателя  Херста  как  коэффициента  в регрессионном соотношении (7), то в целом она оказывается не очень высокой
для окна малой длины N и возрастает с его увеличением. Для окна в 10 тыс. тиков детерминация в среднем составляет 0,35, но для окна в 100 тыс. тиков она
становится  равной 0,85. Распределение  значений  детерминации  унимодально, но не нормально, и имеет вид, более похожий на гамма-распределение.

Со своей стороны, мне здорово помог взгляд на показатель Херста в статье как на показатель степени:

   Для каждого  временного  ряда  можно  вычислить  его  показатель  Херста  как коэффициент  регрессии  логарифма  нормированного  накопленного  размаха  к
логарифму  длины  выборки
.  Детерминация  такой  регрессии  покажет,  с  какой точностью исследуемый процесс можно аппроксимировать процессом Херста.
   Традиционная трактовка показателя Херста  H  заключается в том, что при превышении  значения  H = 0,5  накопленный  размах  растет  быстрее,  чем  для
случайного блуждания, т.е. ряд с большей вероятностью сохраняет тенденцию своего  изменения  по  выборке  той  длины,  для  которой  подсчитывался  этот
показатель, а если  H < 0,5, то с большей вероятностью тенденция переменится. Поэтому  показатель  Херста  часто  используется  при  анализе  финансовых
рынков для оценки длительности трендов или для оценки длины выборки, по которой следует вычислять скользящие средние [3-4]. 

   В моих исследованиях (например, https://www.mql5.com/ru/forum/221552/page73#comment_6203173) часто применяется закон квадратного корня, а объяснить столь широкую его применимость мне до сих пор не удавалось, дилетантские догадки https://www.mql5.com/ru/forum/221552/page77#comment_6208896 можно не учитывать. Теперь, зная о роли показателя степени 0.5 в форексе, я могу дать обоснование, почему так часто оказывается справедлив закон квадратного корня. Напомню, это пропорциональность характеристики размаха корню квадратному из промежутка времени.

   Наш розничный форекс никак не влияет на настоящий межбанковский рынок обмена валют. Среди причин, приводящих к такому выводу, достаточно указать одну - на настоящем Форекс нет такого понятия "закрыть сделку". Розничный форекс чисто спекулятивный, и никаких поставок валюты на нем не бывает. Поэтому для своих нужд он воплощает в жизнь свои законы. Косвенно об этом писал hrenfx(getch), рассказывая, как можно было бы котировать, чтобы выигрывать (у клиентов). Как известно, уже имеются десятки или сотни тысяч советников, одна часть из которых выигрывает на флете, вторая на трендах. Чтобы в целом не дать выиграть ни тем, ни другим, на розничном форекс автоматически поддерживается чередование тренда и флета, то есть показатель Херста колеблется около 0.5. Тем самым поддерживается выполнение закона квадратного корня.

Файлы:
Orlov_2013_3.zip  391 kb
 

Vladimir вернулся!!! Безумно радуюсь этому событию! Приветствую Вас в Новом Году и также рекомендую почитать Шелепиных (см. прикрепленный файл). В данных статьях старый Шелепин абсолютно ясно и понятно описал матаппарат немарковских процессов, а молодой Шелепин, не вкурив в то, о чем пишет папа, подсунул оному дурацкие числа Фибоначчи вместо квантильной функции, на чем и дело закончилось.

Файлы:
Alex.zip  2749 kb
 
Vladimir:


Что  касается  детерминации  показателя  Херста  как  коэффициента  в регрессионном соотношении (7), то в целом она оказывается не очень высокой
для окна малой длины N и возрастает с его увеличением. Для окна в 10 тыс. тиков детерминация в среднем составляет 0,35, но для окна в 100 тыс. тиков она
становится  равной 0,85. 

Из Вашего примера следует, что сначала Херста мерили на боковике, а потом расширили окно и в нем оказался тренд.

Ну и что?

Дело в том, что любой анализ  (ТА, статистика или еще что-либо)- это чушь собачья, это как монета: на одной стороне решка, а переворачиваешь - пусто. и куда с такой монетой?

Несколько лет я проталкиваю на форме одну казалось бы очевидную мысль: анализ интересен исключительно только в том случае, если мы из него можем сделать прогноз, если анализ обладает прогнозными возможностями, если выявленные закономерности можно экстраполировать в будущее.

Обладает Херст прогнозирующими способностями? Мне это не известно, но мне известно, что модели, построенные на моделях ARFIMA, позволяющие дробное дифференцирование временного ряда (Херст) не работают. Такое косвенное доказательство, что Херст не обладает прогнозирующими способностями.

У монеты должно быть две стороны:  решка (анализ) и орел (предсказание). Только в этом случае она представляет ценность.

 
СанСаныч Фоменко:

Из Вашего примера следует, что сначала Херста мерили на боковике, а потом расширили окно и в нем оказался тренд.

Ну и что?

Дело в том, что любой анализ  (ТА, статистика или еще что-либо)- это чушь собачья, это как монета: на одной стороне решка, а переворачиваешь - пусто. и куда с такой монетой?

Несколько лет я проталкиваю на форме одну казалось бы очевидную мысль: анализ интересен исключительно только в том случае, если мы из него можем сделать прогноз, если анализ обладает прогнозными возможностями, если выявленные закономерности можно экстраполировать в будущее.

Обладает Херст прогнозирующими способностями? Мне это не известно, но мне известно, что модели, построенные на моделях ARFIMA, позволяющие дробное дифференцирование временного ряда (Херст) не работают. Такое косвенное доказательство, что Херст не обладает прогнозирующими способностями.

У монеты должно быть две стороны:  решка (анализ) и орел (предсказание). Только в этом случае она представляет ценность.

Я недостаточно точно отделил свои слова от цитируемой части, извините. Пример не мой, это из статьи.

А вот "куда с такой монетой", я надеюсь узнать из результатов, которые получит Александр. 

 
Vladimir:

Я недостаточно точно отделил свои слова от цитируемой части, извините. Пример не мой, это из статьи.

А вот "куда с такой монетой", я надеюсь узнать из результатов, которые получит Александр. 

Это не важно, отделили или нет - я просто высказал свои мысли.


Почему Вы считаете, что результаты, полученные здесь, могут быть доказательством чего бы ни было?

В этом вся проблема!

Более того, доказательства будущего не находятся в тестере, не находятся на демо и реале - все эти результаты говорят: вот так было. И из этого "было" ВООБЩЕ не следует будущее, и это будущее основано только на вере и надежде: в будущем будет также как в прошлом. А на каком основании?

Если мы по каким-либо причинам не используем имеющиеся наработки (очень обширные), то первый вопрос по отношению к своей любимой идее: обладает ли эта идея прогностической способностью? Если обладает, то почему?

 
СанСаныч Фоменко:
 

Почему Вы считаете, что результаты, полученные здесь, могут быть доказательством чего бы ни было?

В этом вся проблема!

Я сказал "куда идти с такой монетой", о доказательствах почему-то начали беспокоиться именно Вы. Чего бы то ни было.

Если Вам действительно нужны именно доказательства, я бы согласился с Вами - это действительно проблема. Поэтому доказыванием не занимаюсь. Мне хватает проверки на историях. Естественно, своими, адекватными средствами. Других доказательств не ищу. Хорошо, если найдется хотя бы вразумительное объяснение наблюдаемых закономерностей.

 
СанСаныч Фоменко:

...В этом вся проблема!

Более того, доказательства будущего не находятся в тестере, не находятся на демо и реале - все эти результаты говорят: вот так было. И из этого "было" ВООБЩЕ не следует будущее, и это будущее основано только на вере и надежде: в будущем будет также как в прошлом. А на каком основании?

Если мы по каким-либо причинам не используем имеющиеся наработки (очень обширные), то первый вопрос по отношению к своей любимой идее: обладает ли эта идея прогностической способностью? Если обладает, то почему?

Тут с СанСанычем абсолютно соглашусь. Это краеугольная проблема. Даже если [эконометрическая] модель подобрана правильно и прошла все тесты и проверки, то нет гарантии, что рынок её не сломает в будущем.
 
Dennis Kirichenko:
Тут с СанСанычем абсолютно соглашусь. Это краеугольная проблема. Даже если [эконометрическая] модель подобрана правильно и прошла все тесты и проверки, то нет гарантии, что рынок её не сломает в будущем.

Например, запретом трансграничных переводов средств, банкротством ДЦ и прочая и прочая. Гарантий от этого-то никто не дает. Или здесь люди не пережили исчезновение десятков ДЦ в 2015 вместе с деньгами клиентов?

Зачем нужно добиваться от одной из составляющих сложной системы большей надежности, чем у остальных составляющих?

 
Vladimir:

Я сказал "куда идти с такой монетой", о доказательствах почему-то начали беспокоиться именно Вы. Чего бы то ни было.

Если Вам действительно нужны именно доказательства, я бы согласился с Вами - это действительно проблема. Поэтому доказыванием не занимаюсь. Мне хватает проверки на историях. Естественно, своими, адекватными средствами. Других доказательств не ищу. Хорошо, если найдется хотя бы вразумительное объяснение наблюдаемых закономерностей.

Вот пока суть да дело и сделок нет, начну поучать уважаемого мной Владимира, ибо он ухватился за корень из t и отступать не хочет.

Я ему говорю - статьи Шелепина читайте, кроме вставок о числах Фибоначчи (очевидно, навязанных ему его неразумным дитятей) - не читает.

Вот смотрите на стр.9 части 1.

Для псевдомарковских процессов:

Дисперсия S^2=c*t*l, где:

l - средняя величина скачков

t - время наблюдения

с - частота скачков за время t (количество тиков)

Под скачками подразумеваются тиковые приращения цены.

Имеем:

S^2 = (N/t)*t*mean(|Ask(t)-Ask(t-1)|) = N*mean(|Ask(t)-Ask(t-1)|)

S = sqrt(N*mean(|Ask(t)-Ask(t-1)|)), где N - количество тиков за время наблюдения t.

Теперь-то, Владимир, понимаете разницу с Вашим корень из t???

Кстати, я только что описал один из моих алгоритмов, который пока находится в разработке.

 
Vladimir:

Например, запретом трансграничных переводов средств, банкротством ДЦ и прочая и прочая. Гарантий от этого-то никто не дает. Или здесь люди не пережили исчезновение десятков ДЦ в 2015 вместе с деньгами клиентов?

Зачем нужно добиваться от одной из составляющих сложной системы большей надежности, чем у остальных составляющих?

Не надо выбирать островные ДЦ. Надо брать ТОЛЬКО на основе банков-брокеров и имеющих европейские лицензии. И этим риском можно будет пренебречь. 

Кроме этого есть другие риски.

Но о рисках нестабильности самой модели - это в наших руках. Просто всегда надо об этом помнить и направлять усилия на решение этой проблемы.

Вот автор ветки носится с распределением и параметр распределения пытается использовать в торговле.

А какая статистика распределения является стабильной? Причем речь идет о  t-распределении.

Буквально сегодня попалась статья про куртосис.

Вот график куртосиса при движении окна



Все меняется, и величина и направление скоса. 

Это для распределения


Очень похожие графики для других статистик распределения.

А если взять обычную линейную регрессию, то значения ее коэффициентов будут иметь примерно такой же график, да еще в доверительном интервале с шириной кратно превышающей значение коэффициента.

Аналогичная картина для ARMA, ARIMA,  GARCH

Эти надо заниматься, а не мается ....

Причина обращения: