Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 422

 
Alexander Ivanov:

Уважаемые профессоры и доцены программирования, вы код закончили? 

Можно мне попробовать? Хоть триалку.



 

Алёша:


Ещё раз повторяю перепроверьте результаты на рандомном источнике, на случайном блуждании арифмитическом или геометрическом. С ZZ и прочими фэйковыми таргетами получится предсказание далеко за 50%, можно легко 90% получить. Вам придется доказать что можно предсказывать рандом, что не разумно.

Вероятно, Вам самому понятно о чем Вы толкуете, но увы изъясняетесь Вы туманно. Присоединяюсь к просьбе, что бы Вы, на конкретном датасете, на конкретных алгоритмах, продемонстрировали, что имеете в виду, что не так и как должно быть по Вашему

 
Женя:

Вероятно, Вам самому понятно о чем Вы толкуете, но увы изъясняетесь Вы туманно. Присоединяюсь к просьбе, что бы Вы, на конкретном датасете, на конкретных алгоритмах, продемонстрировали, что имеете в виду, что не так и как должно быть по Вашему

Все Алеша понятно объяснил. Ваше личное дело - соглашаться с его мнением  или не соглашаться.
 
Yuriy Asaulenko:
Все Алеша понятно объяснил. Ваше личное дело - соглашаться с его мнением  или не соглашаться.

А, ну если речь о том, чтобы принять\не принять точку зрения, то проехали, я думал речь о чем то объективном, как например то что квадрат гипотенузы равен сумме квадратов катетов, тогда "доказать", а у вас "убедить".

 

Подмешивание входных данных к выходу, это обманывать самого себя. Результаты обучения будут заоблачно хороши, работа на реале заоблачно провальна. Я уже не раз говорил что использование зигзага вполне возможно, для определения рыночной тенденции, но у него нет последнего значения отсюда и все проблемы при работе с реал таймом. Есть классические выходные функции и если с ними у вас получается результат ниже 50% значит Ваш вход в принципе плохой и а данном случае следует перебирать именно вход, но уж ни как не выход.

Первый класический таргет это прогнозирование изменения Close на один бар вперёд (поверьте этого достаточно). Делается он просто: Lead((Close[0]-Close[1]),1) используется в апроксимирующих или прогнозирующих сетях, где откликом сети является значение прогнозируемой величины. В таких сетях таргет используется ТОЛЬКО в процессе обучения. В работе сети он не участвует, потому как сеть сама выдаёт значение.

Второй классический таргет это классификация цвета следующей свечи для сетей распознования или классификации. Но и он должен заглядывать в будущее иначе толку от него никакого. Для этого помечаем свечку вверх 1, а свечку вниз -1 и далее при подготовке обучающей выборки смещаем на один бар назад. Соотвественно последнее значение нам не известно, пока не закроется нулевой бар. Обучаем сеть и ждём от неё отклика о будущей свече.

А теперь сама суть. Если ваши входные данные не могут поднятся выше 50% при обучении к любому из выше перечесленных таргетов, то это говорит что вход гавно, а не выход слишком сложный. Тоесть нужно искать такой набор входных данных, который бы смог это сделать. Поднять выше 50%. Ответ кроется в простом понимании причино следственной связ по отношению к цене. Что является причиной для цены, а что является следствием от цены. И есть однап ростая формула, о которой я говорил не раз и выглядет она так.

Ожидания рынка (торговля опционами является причиной для объёма) - Объём торгов (торгуется либо в соотвествии с ожиданиями либо нет, но является причиной для изменения цены)- Цена (изменяется в соотвествии с проторгованным объёмом)-Индикатор (изменяется в соотвествии с изменением цены)

Ну что??? Вы всё ещё используете индикаторы???? Ну тогда вы в конце паровоза, потому как индикаторы являются следствием изменения цены, но уж ни как не причиной. Значение индикатора стало таким, потому что цена стала такой. А теперь вникнитесь в следующую фразу........

Цена стала такой, потому что объём был проторгован такой. Чувствуете разницу????? Вот и подумайте........

И не нужно лохматить бабушку :-)

 

При правильном подходе причинно следственной модели, то есть когда входные данные являются причиной для цены, вы сможете построить ЛЮБУЮ стратегию. Сколь угодно сложную или простую, но она будет рабочей, потому какявляется причиной для Close. Приведу пример.

Задумался я как то следующим вопросом, который звучит следующим образом. "При появлении сигнала будет или не будет откат?" Вроде бы задача не связанная с прямым прогнозированием цены, ОДНАКО!!!!!!

У меня есть набор данных для генеральной классификации базовой стратегии на предмет истинный сигнал или ложный. И что я сделал, я для тех же самых входных данных поменял таргет по откату и получил вполне сносную модель выше 50%. Тут главное чтобы таргет был чистым, без ошибок. В итоге к одному и тому же набору входных данных я могу применить любой таргет со смысловым значением и получить вполне адекватную модель, потому как входные данные являются причиной для цены и этого вполне достаточно чтобы по одному и томуже входному набору ответить на такие вопросы как истина или лож сигнала, будет ли откат, какой будет следующая свеча после сигнала, дойдёт ли цена до моего тейкпрофита и т.д.

А по поводу подмешивания я удивлён что вообще этот вопрос поднялся здесь.... Это как пилить сук на котором сидишь. Обманывать самого себя......

 
Mihail Marchukajtes:

Подмешивание входных данных к выходу, это обманывать самого себя.

Имеете в виду выходных данных ко входу?

 
Mihail Marchukajtes:

Цена стала такой, потому что объём был проторгован такой. Чувствуете разницу????? Вот и подумайте........

Это из разряда споров о курице и яйце )  Имхо, у вас ошибка в понимании причинно-следственной связи.  Цена закрытия нам известна в конце дня, так?  Проторгованный объём тоже. Так каким образом одно может являться определяющим для другого?  Оба этих параметра мы получаем одновременно - постфактум.
 
Alexey Navoykov:
Это из разряда споров о курице и яйце )  Имхо, у вас ошибка в понимании причинно-следственной связи.  Цена закрытия нам известна в конце дня, так?  Проторгованный объём тоже. Так каким образом одно может являться определяющим для другого?  Оба этих параметра мы получаем одновременно - постфактум.

Ладно, проведу ликбез. Или как говорят в таких случаях учите мат часть. Объёмы поступают в режиме реального времени. Для каждого бара известен проторгованный объём, дельта, максимальный объём в баре по определённой цене и т.д. Вы путаете с объёмом в конце дня, который используется для определения контекста рынка.

 
elibrarius:

Имеете в виду выходных данных ко входу?


Ну да. Тут типа подняли тему что если выход подглядывает во вход, то получаются нереально красивые цифры на обучении, но не в реальной торговле.

Причина обращения: