Трейдерский самообман: недоверие к форвардам. - страница 12

 
Vasiliy Sokolov:

Еще немного про R^2.

Для меня это очень мощный показатель, но недостаточный. На практике я сталкивался с тем, что некоторые ТС, могут выдать очень хорошую и плавную equity вверх. R^2 у них очень высокий, и их набор параметров взломает любой даже самый изощренный форвард. Вот например equity одной из такой ТС:


Ее equity заставляет делать стойку на рынок, но не все так просто. У подогнанных ТС есть одно замечательное свойство: их набор параметров практически всегда является нестабильным, и любое, незначительное смещение величин эти параметров часто кардинально меняет результат. Например, незначительное изменение правил закрытия у этой ТС приводит к следующим результатам:

 

Видно, что небольшое изменение привело к катастрофическим последствиям. Поэтому после того, как определен оптимальный набор параметров, необходимо произвести смещение параметров на некоторую величину, и посмотреть результаты прогонов в окрестностях оптимальной точки:

 

Оптимизационное пространство может быть многомерным, но количество измерений здесь не играет роли. Если мы находимся в устойчивом пятне параметров, их смещение кардинально не изменит поведение ТС. Важно понимать, что в реальной торговле это самое смещение и произойдет. На истории мы вокруг статичного рынка передвигаем параметры ТС. На реале рынок будет двигать свои характеристики вокруг найденных и зафиксированных нами ранее параметров.

нельзя рассматривать систему без понимания сути её работы. Чувствительность опта тоже через это понимание. Какие-то опты могут быть чувствительными, какие-то "толстыми". Например, у вас закономерность работает в небольшом диапазоне времени открытии Лондона, а ширина этой зоны опт. Нефиг ему работать при изменении этого опта даже незначительном.

Да и шкала изменений условна.

 
Слава:
нельзя рассматривать систему без понимания сути её работы. Чувствительность опта тоже через это понимание. Какие-то опты могут быть чувствительными, какие-то "толстыми". Например, у вас закономерность работает в небольшом диапазоне времени открытии Лондона, а ширина этой зоны опт. Нефиг ему работать при изменении этого опта даже незначительном.
Здесь да. Никто и не говорит, что диапазоны могут быть выбраны от балды или хотя бы автоматизировано. В том и профессионализм алготрейдера, что бы искать осмысленные параметры и их диапазоны. 
 
Vasiliy Sokolov:
Здесь да. Никто и не говорит, что диапазоны могут быть выбраны от балды или хотя бы автоматизировано. В том и профессионализм алготрейдера, что бы искать осмысленные параметры и их диапазоны. 

agree))

 
Vasiliy Sokolov:
 

 Мы торгуем следствие причины, которая практически всегда остается за кулисами.

В апреле 2013г. из-за "утки " о смерти Барака Обамы индекс DJ в момент обвалился на 13%. Пишут что сработали роботы читающие новости. Тогда, эти роботы, сами стали той самой закулисной причиной.

ИМХО Цель тестирования - это не получения набора параметров, а попытка ответить на 3 вопроса :

  Что? - Какой фин. инструмент выбрать для советника.

  Где? - На каком рынке торговать. (Трендовом, флетовом, волатильном.....)

  Когда ? - В какое время с учетом отличительных особенностей рынка в разные интервалы времени и сезоны.

 
Avals:

так я с этим согласен и об этом писал) Советник работает определённое время - благоприятная фаза для него если грубо. Поэтому брать слишком большую историю или вообще на обум - бессмысленно. А ваш способ требует в разы больше статистики  и периода тестирования. Т.е. задача как можно быстрее найти работающие темы и вместе с этим исключить подгонку, а дробление истории на отдельные фрагменты по которым принимаются решения приводит к тому, что история на которой система уже работала д.б. весьма продолжительной (аргументы о стат.достоверности в предыдущем посте).


Подхожу иначе) Никакие пропорции не беру и форвард-тестом не пользуюсь. Качество системы анализирую по качеству эквити.


А что значит "СЛИШКОМ" большую историю? Вы даже не знаете какой отрезок истории наиболее оптимален для вашей системы. Без форварда, какой бы вы отрезок истории не взяли вы никогда по кривой эквити не поймете нашли вы "работающую тему" или произошла подгонка.
 
Youri Tarshecki:
А что значит "СЛИШКОМ" большую историю? Вы даже не знаете какой отрезок истории наиболее оптимален для вашей системы.

Есть такое понятие, как статистическая достоверность. Применительно к трейдингу - какое минимальное кол-во сделок нужно, чтобы доверять полученным на бэк тесте результатам. Это кол-во много от чего зависит. Например, от соотношения средней прибыльной сделки к средней убыточной. Упрощенно от соотношения tp/sl. Минимальное число сделок нужно когда оно равно 1. Чем сильнее отличается от 1 тем больше сделок необходимо. Но даже при tp/sl=1 сделок нужно минимум 100 (это можно проверить с пом.монтекарло). При вашем подходе на каждом из 12 бэктестов стат.достоверность должна сохраняться. Значит нужно минимум 1200 сделок только для бэктеста + еще для форварда столько же (его резалты тоже д.б. стат.достоверны). Это и выливается в то, что даже для интрадея при подобном подходе нужно тестить со времён царя Гороха))


Youri Tarshecki:

Без форварда, какой бы вы отрезок истории не взяли вы никогда по кривой эквити не поймете нашли вы "работающую тему" или произошла подгонка.

Ну надо смотреть не на одну эквити)) Как выше писали, важна ширина оптимальных зон и равномерность улучшения качества системы для некоторых параметров. Например, в системе используется ширина диапазона предыдущего дня, а система пробойная. Берём её как опт. Т.е. фильтр - торгуем при Ширина_диапазона<=X. Чем меньше значение опта X, тем меньше сделок (так как таких дней меньше). Но если при этом последовательно улучшается качество системы (такие показатели как ПФ и другие), то это подтверждает робастность как всей системы так и этого фильтра. Есть и другие стат. способы проверки робастности, например мультиинструментальность.

 
Avals:

Есть такое понятие, как статистическая достоверность. Применительно к трейдингу - какое минимальное кол-во сделок нужно, чтобы доверять полученным на бэк тесте результатам. Это кол-во много от чего зависит. Например, от соотношения средней прибыльной сделки к средней убыточной. Упрощенно от соотношения tp/sl. Минимальное число сделок нужно когда оно равно 1. Чем сильнее отличается от 1 тем больше сделок необходимо. Но даже при tp/sl=1 сделок нужно минимум 100 (это можно проверить с пом.монтекарло). При вашем подходе на каждом из 12 бэктестов стат.достоверность должна сохраняться. Значит нужно минимум 1200 сделок только для бэктеста + еще для форварда столько же (его резалты тоже д.б. стат.достоверны). Это и выливается в то, что даже для интрадея при подобном подходе нужно тестить со времён царя Гороха))


Ну надо смотреть не на одну эквити)) Как выше писали, важна ширина оптимальных зон и равномерность улучшения качества системы для некоторых параметров. Например, в системе используется ширина диапазона предыдущего дня, а система пробойная. Берём её как опт. Т.е. фильтр - торгуем при Ширина_диапазона<=X. Чем меньше значение опта X, тем меньше сделок (так как таких дней меньше). Но если при этом последовательно улучшается качество системы (такие показатели как ПФ и другие), то это подтверждает робастность как всей системы так и этого фильтра. Есть и другие стат. способы проверки робастности, например мультиинструментальность.

Добавлю что длительная история нужна не только из-за требования статистической значимости полученных результатов, но и для тестирования ТС для разных состояний рынка. Например, EURUSD более полугода находился в большом даунтренде. Даже 10 000 сделок покажут что на этом участке короткие позиции зарабатывают. Что бы понять, что мы не подстроились под определенный редкий режим рынка, нам и нужна длительная история.

Замечу, что форвардами Вы только и будете перескакивать с одного режима на другой, искренне не понимая, почему ваша ТС зарабатывает на тесте и сливает на форварде. А ответ прост, вместо того, что бы создавать ТС для одного из режимов рынка, создавайте ТС, результаты которой не зависят от текущего выбранного отрезка времени. Иными словами торгуйте не рынок, а его неэффективность.

 
Avals:

Есть такое понятие, как статистическая достоверность.

Нет такого понятия в статистике.
 
Yury Reshetov:
Нет такого понятия в статистике.
чаще переводят как "статистическая значимость"
 
Vasiliy Sokolov:

Добавлю что длительная история нужна не только из-за требования статистической значимости полученных результатов, но и для тестирования ТС для разных состояний рынка. 

Предположим, минимум вы определили с помощью "монтекарла". А НАСКОЛЬКО ДЛИТЕЛЬНАЯ должна быть ваша история? СКОЛЬКО ВЕШАТь В ГРАММАХ? Пока вы не покажете реальный способ вычисления отрезка оптимизации -все сказанное - как раз способ САМООБМАНА и лирика на общеизвестные темы. Эквити, я уже говорил, не спасают от подгонки. Вся ваша логика приводит только к одному решению - тестируй на ВСЕЙ истории. Тем не менее, вы все-таки ограничиваете себя в этом. Зачем? Если вам форварды ни к чему - тестируйте на всей доступной истории и ваша "стат достоверность" будет максимальной.

Мой способ простой, я сравниваю сумму форвардов, полученных на одном участке, но с разным шагом. Лучший результат дает лучший шаг тестирования. Поскольку мне не нужны абстрактные рассуждения, а нужна максимальная прибыль,  я и сравниваю  прибыль, которую показывают форварды.  А вы что сравниваете с чем?

Причина обращения: