Уменьшаем выборку - увеличиваем стат. значимость?

27 января 2022, 23:08
fxsaber
3
233

Торговый робот должен (условно) удовлетворять следующим условиям:

  • Совершать достаточно много сделок на интервале настройки (оптимизации).
  • Показывать столь же стабильный результат вне интервала оптимизации.


Безусловно, эти требования ничего не гарантируют, хоть и несколько увеличивают доверие к потенциальным возможностям робота.


Критерий оптимизации.


По поводу важности количества сделок можно наблюдать единодушие. Вроде, чем больше, тем лучше (одна из причин, почему алготрейдинг и скальпинг ходят рядом).

Поэтому при настройке ТС стараются задавать либо абсолютное минимальное количество сделок, либо удельное (на единицу времени). Это позволяет сразу выкидывать из рассмотрения пусть и неплохие на неискушенный взгляд, но менее стат. значимые результаты. Заодно уводя эвристические алгоритмы оптимизации в нужном направлении.


Анализ сделок.

Казалось бы, много сделок - неплохо. Проходит OOS - хорошо. Запускать на реал? Большинство так и поступает.


Однако, можно наделить сделки некими свойствами (числовые значения) и посмотреть, сколь близки они друг к другу. Если окажется, что несущественная часть сделок сильно отличается по свойствам от остальных, то на такие сделки налагается ярлык неблагонадежности. И несмотря на их хороший положительный вклад в общий результат, ищется фильтр для их отсева.


Свойства.

Что же может служить свойством сделки? Это могут быть любые числовые показатели на момент открытия сделки. Любые - все, что можете придумать и посчитать. Да, это странно звучит, но при наличии только сделок другой подход исключен. Может быть заранее подготовленный набор таких свойств для создания на их основе проверки гипотезы стат. значимости.


Правда, авторам роботов, как правило, значительно легче, если робот основывается не на машинному обучении. Т.е. тогда, когда робот не представляет из себя BlackBox.


Индикаторы.

Сигнал на совершение сделки - это некая алгоритмическая комбинация значений индикаторов. Индикаторы - более общее понятие, чем нарисованные на графике линии. Главное, что автор торгового алгоритма в курсе, какие индикаторы он использует и какова логика их комбинирования для конечного решения.


Поэтому свойствами сделок могут выступать значения (с или без нормализации) самих этих индикаторов.


Пространство.

Каждая сделка обладает набором свойств, что геометрически представимо в виде точки многомерного пространства. Представьте сферу минимального радиуса, которая включает в себя все такие точки. Так вот сделки-изгои - это такие точки, при выбросе которых радиус такой сферы значительно уменьшается.


Пример.

500 сделок. Общая картина великолепна. Зададим каждой сделке свойство в виде значения средней - EMA. Получаем, что для 90% сделок EMA находится в интервале [5; 7], а для 10% - [12; 20]. Общая сфера [5; 20] - диаметр 15. Но если выкинуть 10%, то сфера сужается до [5; 7] - диаметр 2.


Это существенное изменение размера сферы, поэтому пытаемся избавляться от подобных сделок: если на момент принятия решения о совершении сделки EMA выходит за пределы узкой сферы, не совершаем сделку. Т.е. создаем фильтр.


Черный лебедь.

Именно отсутствие учета таких залетных сделок заметно увеличивает вероятность поймать существенные убытки в реальной торговле. Заметьте, что они могут показывать очень хорошие результаты на бэктестах, проходить OOS, но от этого их рисковая составляющая не уменьшается.


Кирпичи ТС.

Может оказаться, что сделки можно разделить на несколько узких сфер - задача классификации. В таком случае ТС представляется, как случайно получившийся портфель из более простых ТС. И каждый такой кирпич рассматривается далее отдельно.

Сделки-отщепенцы бэктестов - это не кирпичи ТС.


Оптимизация.

В критерий оптимизации желательно добавлять фильтр подобной стат. значимости сделок, который выдавал бы результат только на основе сделок после фильтра. Т.е. фильтрация встраивается в сам критерий, а не задается отдельно, как часть ТС.


Велосипед.

Безусловно, тема уменьшения выборки ради повышения стат. значимости должна быть давно изъезжена в статьях соответствующей тематики. Поэтому дефицита в алгоритмах отбора "близких по духу" точек в пространстве не должно наблюдаться.


Поделитесь с друзьями: