Примеры: Заблуждения, Часть 2: Статистика - лженаука, или Хроника пикирующего бутерброда

 

New article Заблуждения, Часть 2: Статистика - лженаука, или Хроника пикирующего бутерброда has been published:

Многочисленные попытки применения методов статистики к объективной реальности, т.е. к финансовым рядам, разбиваются о скалы нестационарности процессов, «толстохвостости» сопутствующих вероятностных распределений и недостаточного объема финансовых данных. В данной публикации я попытаюсь обратиться не к финансовым рядам как таковым, а к их субъективному отражению – в данном случае к тому, как эти ряды пытается оседлать трейдер, т.е. к торговой системе. Выявление статистических закономерностей процесса, описывающего результаты сделок, оказывается довольно увлекательным занятием. В некоторых случаях возможно даже сделать вполне достоверные выводы о модели этого процесса и применить эти выводы к торговой системе.

В данной публикации я попытаюсь обратиться не к финансовым рядам как таковым, а к их субъективному отражению – в данном случае к тому, как эти ряды пытается оседлать трейдер, т.е. к торговой системе. Выявление статистических закономерностей процесса, описывающего результаты сделок, оказывается довольно увлекательным занятием. В некоторых случаях возможно даже сделать вполне достоверные выводы о модели этого процесса и применить эти выводы к торговой системе.

Приношу извинения за уровень изложения тем читателям, которые далеки от математики, но, вероятно, это – неизбежное следствие самого содержимого статьи. Похоже на то, что обещание, данное в конце предыдущей статьи, мне не удалось выполнить. Итак, начнем наше исследование.

В предыдущей статье серии «Заблуждения» нам удалось сконструировать искусственный пример, наглядно показывающий, каким образом можно превратить стратегию, явно прибыльную при ММ «lot=0.1», в убыточную при геометрическом ММ. В примере использовалась очень регулярная последовательность прибыльных и убыточных сделок, которая «в природе» вряд ли встречается: П У П У П У П У П У П У… Самый первый вопрос таков: почему я рассматриваю именно такие «регулярные» последовательности?

Author: Sceptic Philozoff

 

Класс - давно ждал. Но пипсовчики никогда не остановятся. Мне кажется - потому что им нужна зарплата - твердый процент каждый месяць. А Талеб действительно нужно прочитать!

 

Автор очень убедительно агитирует изучить математические основания пипсовки.  Cкептически в корень зрящему да воздасться!

 
Вместе с тем, никогда нельзя сказать наперёд как будут распределены убыточные ордера среди прибыльных. Это распределение в значительной степени носит случайный характер.

А. Идеальным случаем последовательности Прибылей и Убытков является равномерное их распределение на протяжении всей торговой истории:

П П П У П П П У П П П У П П П У П П П У П П П У П П П У ...

Однако, нет никакой гарантии, что в реальной торговле распределение всегда будет идеальным. Как раз наоборот, существует большая вероятность, что рано или поздно встретится случай с длинной серией последовательных убытков.

В.
Один из вероятных случаев неравномерного распределения прибыльных и убыточных торговых операций в реальной торговле:

П П П П П П П П П П П П П П П УУУУУ П П П У П П П У ...

Здесь показана серия из 5 последовательных убытков, хотя не исключена возможность и более длинной серии потерь. (обратите внимание, что в данном случае отношение прибыльных и убыточных ордеров сохраняется в пределах 3 : 1 ).

 

 

вот давно думаю как сделать чтобы в отчетах тестера видно было всю эту равномерность - надеюсь в новых версиях тестера увидеть что нибудь

 
+5 :) Надеюсь, что не последняя.
 

Что сходу режет глаз...

Статистические механизмы давно и успешно применяются к объективной реальности, в том числе и финансовым рядам. Вспомним, например, нобелевских лауреатов Black and Scholes с их мат.моделью определение цены опционов. Считается всё. В противном случае была бы невозможна работа старховых компаний, банков и пенсионных фондов. Другой вопрос, что не существет волшебной формулы, которая бы позволяла делать деньги из ничего. Вернее эта формула известна арбитражерам - когда вдруг нарушаются математические модели расчета цен, возникает возможность срубить много, быстро и без риска.

Дальше, много всего правильно и не очень. Например, почему сразу постулируется, что распределение должно быть нормальным? Вся финансовая дата всегда перекошена вправо. Давайте забудем про нормальное распределение и начнём сразу с бета распределения.

Стимулирующее, возможно, чтение. Но для тех кто этого не знает, оно слишком сложно, а для тех кто знает, не интересно.

 
timbo:

Дальше, много всего правильно и не очень. Например, почему сразу постулируется, что распределение должно быть нормальным? Вся финансовая дата всегда перекошена вправо. Давайте забудем про нормальное распределение и начнём сразу с бета распределения.

Там как раз фактически и проверяется на нормальность.

По сути это проверка ряда на стационарность. Просто автар тест придумал сам и применил его только для серий подряд идущих убытков или выигрышей (кластеров), что конечно весьма ограничено. Ведь "ненормальная" серия может состоять из вполне нормальных калстеров :) Короче, для этих целей существуют проверенные и математически обоснованные тесты на стационарность для всех случаев жизни и ничего придумывать не надо.

А когда уже гипотеза о стационарности подтверждена, то моделировать испытаниями Бернулли (фактически Монте-Карлить) для нахождения вероятностей "черного лебедя" и т.д. не нужно. Достаточно аналитически рассчитать МО и СКО соответсвующего норм. распр. (для нужной длины ряда) и из него получить искомые вероятности. 

 

Здесь, имхо, самое тёмное место - оценка p и q по отношению прибыльных и убыточных сделок. Насколько я понимаю, никто не станет возиться с убыточной по результатам тестирования системой. То есть, находя "прибыльную" ТС, игрок изначально залезает в хвост распределений для p и q (в предположении бернуллиевости системы) . В терминах статьи это будет означать, что p и q будут оцениваться по красной кривой этой картинки.


Другими словами, скорее всего "прибыльность" будет означать, что p и q будут находиться в районе благоприятной границы доверительного интервала. Ну а каким может быть этот интервал можно предположить по этой же картинке.


P.S. Автор слегка касается этого момента, но вывод о том что для любой бернуллиевой "прибыльной" ТС оценка частот удач/неудач будет смещённой не делается.
 

Хорошая статья, спасибо. Есть спорные моменты, но в целом очень интересная тема.

                               

 
Уважаемый автор статьи! Ее получил по рассылке. Разделяю мнение одного из ответивших вам строкой "Есть спорные моменты ...". Хочу присоединиться к нему и добавить. «…Приношу извинения за уровень изложения тем читателям, которые далеки от математики» – в первую очередь, это надо было сделать тем прикладным математикам, которые близки и в совершенстве владеют вопросами практического применения не только такой дисциплины как статистика, но и цифровая фильтрация, идентификация динамических объектов, контроль и диагностика систем …. Что касается спорных моментов – «Вероятность исхода события не зависит от истории событий, предшествовавших ему» – абсолютно не верно ! Пример. В некотором интервале времени открывается последовательность ордеров, например, наращивается объем общей позиции. В итоге все они оказываются связанными. P.S. Рекомендация. Излагайте строже содержание статьи, возьмите за образец написания серьезный научный журнал из этой области, а так складывается впечатление, что автор упомянутой статьи из «кулинарного техникума». «Серии убытков: краткое касание вопроса» – так не пишут! В.М.
 

Большое спасибо за критику. Попробую ответить:

smoothWave писал(а): "Есть спорные моменты ...".

... 

«Вероятность исхода события не зависит от истории событий, предшествовавших ему» – абсолютно не верно !

... Рекомендация. Излагайте строже содержание статьи

Главная цель статьи - привлечь внимание к теме и подходу; я сам же и говорю в статье, что подход совсем не идеален с математической точки зрения (особенно эвристический "решающий критерий"). Если у Вас есть возможность изложить тему строже и одновременно так, чтобы она была понятна не только дюжине выпускников мехмата, а еще и трейдерам без универовского образования по статистике, - публикуйте.

Касательно выделенного мной: наверно, Вы не заметили, что я намеренно исключил из оригинального Lucky зависимости, убрав "фактор мультипликации"? Понятно, что не все системы бернуллиевы, кто спорит. Но их исследование намного сложнее, и это не предмет этой статьи. Мне было интересно рассмотреть совсем не редкий случай, который является схемой Бернулли, а не самый общий.

2 Candid:

P.S. Автор слегка касается этого момента, но вывод о том что для любой бернуллиевой "прибыльной" ТС оценка частот удач/неудач будет смещённой не делается.

Пожалуй, не делается, здесь ты прав. Но попытка была, в Подходе к снаряду № 1. Я там специально выбрал самый хороший участок системы (Б) и попытался оценить вероятность дрейфа удачи, и она оказалась очень низкой, порядка 0.003. Вывод был, правда, не такой, о котором ты говоришь, но я явно указал, что при таких вероятностях говорить о надежности оценок неразумно. И дальше я попробовал оценить вероятности, которые находятся уже не в хвосте распределения (сверхкороткие серии), - и здесь результат получился вполне конструктивным и, главное, устойчивым.

2 Avals:

Короче, для этих целей существуют проверенные и математически обоснованные тесты на стационарность для всех случаев жизни и ничего придумывать не надо.

Был бы рад увидеть здесь то, что я выделил. Но, вообще говоря, в контексте схемы Бернулли вопрос о стационарности и не стоит.

моделировать испытаниями Бернулли (фактически Монте-Карлить) для нахождения вероятностей "черного лебедя" и т.д. не нужно

Я - дилетант в тервере/статистике; мне гораздо проще "смонтекарлить", чем вычислить вероятность аналитически, - тем более при оценке частоты экстремальных по длине кластеров.

2 timbo:

Например, почему сразу постулируется, что распределение должно быть нормальным? Вся финансовая дата всегда перекошена вправо.

Нет тут никакого постулирования по отношению к финансовым данным. Предмет статьи - не стат. свойства финансовых данных, а свойства последовательности сделок, и об этом я говорю в аннотации к статье. Мерзких финансовых данных я здесь не касался. Я просто попытался привести аргументы против первой части названия статьи ("Статистика - лженаука") и показать, что ее все-таки можно применять, сменив точку зрения.

Причина обращения: