Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 426

 
Ivan Negreshniy:

Вы правы, прогнозирование индикатора - это лишнее звено. Но и прогнозирование цены, по сути, тоже лишнее звено, т.к. цель торговой стратегии не цена, а прибыль.

Следуя этой логике, моделировать нужно не индикаторы и не ценовые графики, а поведение трейдера, при этом наилучшей целевой функцией м.б. показатели его прибыльной торговли.

А практически, берем историю торговли или прогоняем советник в тестере и обучаем модель - на входе ценовые паттерны, а на выходе сделки из отчета о торговле.

Так "прибыль" это и есть return(доходность, возврат), то есть приращение цены нормированное её абсолютным значением, а это пресловутый индикатор "моментум", зная будущий моментум, Вы - властелин вселенной.

 
Maxim Dmitrievsky:

 А то что здесь обсуждается сейчас это какой-то детсад применять зигзаг или нет, какая вообще нафиг разница если сам подход с прогнозированием изначально не правильный (т.е. не приведет к успеху) :) 

Правильный, вопрос в деталях, не нужно сразу рубить с плеча. А "детсад" этот не только зигзага касается, это ловушка ещё та...

 
Алёша:

Не смею этого делать, не в в Вашем отношении ни в чьём либо другом. Вы не одиноки в своём заблуждении

Смысла много, в написанном Вами, статья великолепна, это я говорю абсолютно искренне, кратко и емко. Но есть небольшой изъян, на него я и указал, так как сам долгое время заблуждался таким же образом.


Попробую еще раз пояснить свою позицию.


Упомянутая вами статья - это рекламный материал машинного обучения: показано, что в понятие машинного обучения кроме моделей также входит подготовка данных для модели и оценка модели. Кроме этого показано, что все это может попробовать с минимальными затратами  любой, интересующийся машинным обучением.


Моих мыслей в статье ВООБЩЕ нет. Это реклама.


Моей мыслью на этой ветке и других ветках форума является то, что главным, базовым в машинном обесчении является НЕ модель, обоснование того, что "предикторы имеют отношение к целевой переменной".

Именно "имеют отношение", а не сама целевая и не конкретный набор предикторов. При этом я вкладываю свой смысл в значение слов "имеют отношение", отличный от того, что определяется "важностью предикторов".

Я нигде и никогда не рекламировал и никогда не обосновывал применение ЗЗ: просто использовал в своих примерах как наиболее известный из предикторов. Кроме этого указывал, что у меня лично, для имеющемуся у меня набора предикторов, я получаю ошибку предсказания менее 30% - очень не плохой результат, замечу.

Но еще раз: этот результат получен потому, что я умею фильтровать предкторы и оставлять те, которые "имеют отношение" к целевой переменно. В моей примере к ЗЗ. Но для моего метода целевая не имеет значения, а имеет значение весь комплект "целевая-предикторы".

 
СанСаныч Фоменко:

 Кроме этого указывал, что у меня лично, для имеющемуся у меня набора предикторов, я получаю ошибку предсказания менее 30% - очень не плохой результат, замечу.

Но еще раз: этот результат получен потому, что я умею фильтровать предкторы и оставлять те, которые "имеют отношение" к целевой переменно. В моей примере к ЗЗ. Но для моего метода целевая не имеет значения, а имеет значение весь комплект "целевая-предикторы".

Это не не плохой результат, а просто фантастический результат, уверен даже на Ренесансе такого нет и близко, с их терабайтами данных в сутки. Посмотрите на live-score на numer.ai и задумайтесь почему у них не менее 45% ошибки(logloss~0.69), а у Вас 30%.

Но то что Вы говорите верно,  Вы создали свою синтетическую целевую функцию, которая хитрым образом(для Вас видимо не очевидным) функционально связанны с фичами, и на лёрне и тесте у Вас такой замечательный скор и всё верно, как будто бы… Однако почему то Вы ещё не миллиардер, хотя легко бы им стали примерно за год, если бы имели 30% ошибки предсказания цвета следующей свечи, а всё потому что Вы предсказываете не будущее, а прошлое которое смешалось с будущим, через индикатор. Попробуйте предсказать чистый будущий ретурн и всё станет на свои места.

 
Алёша:

Это не не плохой результат, а просто фантастический результат, уверен даже на Ренесансе такого нет и близко, с их терабайтами данных в сутки. Посмотрите на live-score на numer.ai и задумайтесь почему у них не менее 45% ошибки(logloss~0.69), а у Вас 30%.

Но то что Вы говорите верно,  Вы создали свою синтетическую целевую функцию, которая хитрым образом(для Вас видимо не очевидным) функционально связанны с фичами, и на лёрне и тесте у Вас такой замечательный скор и всё верно, как будто бы… Однако почему то Вы ещё не миллиардер, хотя легко бы им стали примерно за год, если бы имели 30% ошибки предсказания цвета следующей свечи, а всё потому что Вы предсказываете не будущее, а прошлое которое смешалось с будущим, через индикатор. Попробуйте предсказать чистый будущий ретурн и всё станет на свои места.

ЗЗ плохая целевая переменная, потому, что у его плеча начало плеча и конец имеют одинаковый вес. Если взять целевую переменную  ДО разворота и ПОСЛЕ разворота ЗЗ, то для такой целевой мне не удалось найти предикторов - все известные для меня предикторы для такой целевой переменной просто шум. По этому вопросу я сотрудничал с одним из форумян, у него свой набор предикторов, а результат у нас обоих одинаков.

Не миллиардер по очень простой причине: оценка модели машинного обучения для моей модели с целевой на ЗЗ (эти 30%) не имеют отношения к результатам в тестере, так как эта ошибка произвольным образом распределена вдоль плеча ЗЗ, т.е. ложные сигналы перемешены с реальными. Я торгую тренды, вроде бы, а предсказываю следующую свечу. Для преодоления этого противоречия у меня есть советник, который успешно торговал более года, а потом 7 октября выскочил по стопу, фиксирующем максимальный уровень риска.

Но это торговля трендов.

Вы же все время предлагаете торговать ОТКЛОНЕНИЯ, а не тренды. Это другая торговля и для нее есть более предназначенные модели - GARCH. Чрезвычайно хорошо проработано, полно готового инструментария, куча примеров для торговли на финансовых рынков, включая форекс. Ими я сейчас и занимаюсь.  Присоединяйтесь.


ПС.

На счет заглядывания вперед по ЗЗ.

Писать надо аккуратно. При обучении, на истории у Вас всегда имеется значение до последнего, крайне правого бара. В советнике это совершенно не так: справа у ЗЗ всегда имеется не сформировавшееся плечо, более того, предшествующее плечо также может перерисоваться. Поэтому надо учить на истории. Потом переходить на новый файл и там переучивать по мере продвижения по графику, учитывая только уже сформировавшиеся значения ЗЗ. А это 100 бар и более отставания.  И никакого "заглядывания", а наоборот отставание.

 

Подитожу чтоб многим стало ясно....

Действительно существую сложные целевые функции, вернее исследователь решает что проблема в выходной переменной и начинает её усложнять. Такое было, раньше и я так делал. Но со временем понял что этого делать не нужно, достаточно прогнозировать изменение цены и если этого не удаётся сделать с должным уровнем качества, то никакой выход столь более сложный не спасёт ситуацию.

А что касается кривой баланса, то она является следствием качества обучения. Именно по виду этой кривой определяется насколько качественно обучилась модель. Два условия.

Равномерный рост кривой баланса под углом 45 градусов

Отсутствие сильных скачков и падений.

Как то так....

 
СанСаныч Фоменко:

ЗЗ плохая целевая переменная, потому, что у его плеча начало плеча и конец имеют одинаковый вес. Если взять целевую переменную  ДО разворота и ПОСЛЕ разворота ЗЗ, то для такой целевой мне не удалось найти предикторов - все известные для меня предикторы для такой целевой переменной просто шум. По этому вопросу я сотрудничал с одним из форумян, у него свой набор предикторов, а результат у нас обоих одинаков.

Не миллиардер по очень простой причине: оценка модели машинного обучения для моей модели с целевой на ЗЗ (эти 30%) не имеют отношения к результатам в тестере, так как эта ошибка произвольным образом распределена вдоль плеча ЗЗ, т.е. ложные сигналы перемешены с реальными. Я торгую тренды, вроде бы, а предсказываю следующую свечу. Для преодоления этого противоречия у меня есть советник, который успешно торговал более года, а потом 7 октября выскочил по стопу, фиксирующем максимальный уровень риска.

Но это торговля трендов.

Вы же все время предлагаете торговать ОТКЛОНЕНИЯ, а не тренды. Это другая торговля и для нее есть более предназначенные модели - GARCH. Чрезвычайно хорошо проработано, полно готового инструментария, куча примеров для торговли на финансовых рынков, включая форекс. Ими я сейчас и занимаюсь.  Присоединяйтесь.


ПС.

На счет заглядывания вперед по ЗЗ.

Писать надо аккуратно. При обучении, на истории у Вас всегда имеется значение до последнего, крайне правого бара. В советнике это совершенно не так: справа у ЗЗ всегда имеется не сформировавшееся плечо, более того, предшествующее плечо также может перерисоваться. Поэтому надо учить на истории. Потом переходить на новый файл и там переучивать по мере продвижения по графику, учитывая только уже сформировавшиеся значения ЗЗ. А это 100 бар и более отставания.  И никакого "заглядывания", а наоборот отставание.


По поводу рассогласованности результатов “тестера” и прогнозирования я писал выше почему так, если предсказывать ретурны, то всё идеально сходится, давненько уже зреет мысль, всё руки не дойдут, математически формализовать функцию зависимости прогноза ML в  коэффициент Шарпа, уверен есть однозначное отображение, так как эмпирическая связь довольно однозначная. Технически, результат “тестера” не многим отличается от просто свертки(скалярное произведение) ряда прогнозов на реализованные ретурны(да простят меня ХФТшники), соответственно чем прогнозы скоррелированей с ретурнами тем круче результаты тестера, реал отличается на торговые издержки. Конечно такая функция(predict2Sharp) будет не от accuracy а наверно от logloss так как само по себе число угадываний менее важно чем помноженное на ретурны которые угаданы были.


По поводу GARCH на сколько я знаю это линейная модель для прогнозирования волатильности, направление рынка она не прогнозирует, или я не прав?

 
Алёша:

По поводу рассогласованности результатов “тестера” и прогнозирования я писал выше почему так, если предсказывать ретурны, то всё идеально сходится, давненько уже зреет мысль, всё руки не дойдут, математически формализовать функцию зависимости прогноза ML в  коэффициент Шарпа, уверен есть однозначное отображение, так как эмпирическая связь довольно однозначная. Технически, результат “тестера” не многим отличается от просто свертки(скалярное произведение) ряда прогнозов на реализованные ретурны(да простят меня ХФТшники), соответственно чем прогнозы скоррелированей с ретурнами тем круче результаты тестера, реал отличается на торговые издержки. Конечно такая функция(predict2Sharp) будет не от accuracy а наверно от logloss так как само по себе число угадываний менее важно чем помноженное на ретурны которые угаданы были.


По поводу GARCH на сколько я знаю это линейная модель для прогнозирования волатильности, направление рынка она не прогнозирует, или я не прав?


Признаюсь пробовал использовать коэфицент Шарпа, Сортино и т.д. для классификации сигнала от базовой стратегии и пришёл к выводу, что все эти коэфиценты являются следствием работы базовой стратегии. Тоесть результат Шарпа получился именно такой, потому что сигнал закрыл с такой то прибылью, а не на обород..... Правда из меня програмист ещё тот, так что мог эти коэфиценты расчитать  и с ошибкой. Но Шарп у меня был в диапазоне от -2 до 2. Так что думаю правильно....

 
Mihail Marchukajtes:

Признаюсь пробовал использовать коэфицент Шарпа, Сортино и т.д. для классификации сигнала от базовой стратегии и пришёл к выводу, что все эти коэфиценты являются следствием работы базовой стратегии. Тоесть результат Шарпа получился именно такой, потому что сигнал закрыл с такой то прибылью, а не на обород..... Правда из меня програмист ещё тот, так что мог эти коэфиценты расчитать  и с ошибкой. Но Шарп у меня был в диапазоне от -2 до 2. Так что думаю правильно....

Дженериков SR много есть, но классический SR самая простая и распространеная метрика оценки производительности стратегии\трейдера\фонда. Считается что SR <1.5 - стрёмно, >=2 - замечательно!

SR это грубо говоря отношение прибыли к риску, в количественной форме.
 
Алёша:

Дженериков SR много есть, но классический SR самая простая и распространеная метрика оценки производительности стратегии\трейдера\фонда. Считается что SR <1.5 - стрёмно, >=2 - замечательно!

SR это грубо говоря отношение прибыли к риску, в количественной форме.

В принципе не важно. Прогностической способности там ноль....

Причина обращения: