Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3048

 
Интересная статья про РЛ. https://habr.com/ru/articles/349800/
Также интересная беседа в кометариях,  создателя ЭТОЙ ветки с другим учасником
 
mytarmailS #:
Интересная статья про РЛ. https://habr.com/ru/articles/349800/
Также интересная беседа в кометариях,  создателя ЭТОЙ ветки с другим учасником

Не избыточна ли концепция RL для задач трейдинга? Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

Две (или три) идеи из стать совсем не лишни для нас - это что функция потерь должна отражать именно то, что нам нужно и должна быть гладкой (и монотонной). В нашем случае это должна быть прибыль и она должна зависеть гладко и монотонно от параметров модели.

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

 
Aleksey Nikolayev #:

Не избыточна ли концепция RL для задач трейдинга? Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

Две (или три) идеи из стать совсем не лишни для нас - это что функция потерь должна отражать именно то, что нам нужно и должна быть гладкой (и монотонной). В нашем случае это должна быть прибыль и она должна зависеть гладко и монотонно от параметров модели.

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

Базой финансового результата трейдинга является движение цены - нестационарный случайный процесс. 

За счет неких ухищрений пытаемся превратить нестационарный случайный процесс  в гладкий да еще монотонный? Может широко шагаем? Особенно если учесть, что ошибку классификации менее 20%(!) вне набора обучения добиться крайне сложно. Может для начала поработать над уменьшением ошибки классификации?

 

Полистал статью.

Какой нам прок о этой статьи?

Для совершенно сомнителен.

И причина в следующем.

Сейчас не могу вспомнить какие-либо публикации по ИИ (МО) которые бы ПРЕДСКАЗЫВАЛИ будущее. Вот учат модель рукописным буквам. Потом пытаются распознать эти рукописные буквы. Но модель  В ПРИНЦИПЕ не учат предсказанию того, какая буква будет написана следующей.

В этом вся наша проблема.

Мы же пытаемся с помощью МО (та же работа, что и со свечным комбинациями) найти некие паттерны в предикторах, которые дадут правильной предсказание. Но нет никакой гарантии, что найденные паттерны будут давать правильные предсказания в будущем. "Правильные" паттерны будут давать ошибку, а "неправильные" предсказывать нужное. Причина кроется в самих алгоритмах классификации, которые дают ВЕРОЯТНОСТЬ класса, а не его значение. Мы же используем самую примитивную регуляризацию в 0.5 для деления на классы. А если при обучении вероятность "правильного" паттерна = 0.5000001, то почему такую вероятность принимаем за значение класса?

Чтобы уйти от этого начинаем городить огород, но значения предикторов, среди которых ищем паттерны, сами либо НЕ стационарны, либо псевдо стационарны, имеют отдаленное отношение к цене.!

 
Aleksey Nikolayev #:

 Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

все зависит от поставленой задачи.

Если прогнозировать готовый таргет как это делает подавляющее большиство , то мы никак не влияем на среду , да и самого РЛ там не надо..

А если например задача  управления позицией, стопами , тейками ..

Те управление активом это среда , которой мы (агент) как раз таки и упрвляет..


Агент решает поставить ордер или не поставить и

по какой цене ,

и когда снять или переставить ,

а что он будет делать когда текущий убыток по текущей позиции перевалит за n пунктов,

а что он будет делать если получил 5 убытков подряд..


Те понимаете , это совсем другой уровень задачи, с кучей состояний (выходов)  , а не примитийный вверх/вниз на классификации


Если еще проще - мы не пожем управлять рынком , но мы можем управлять позицией и риском, ведь можем же!


Aleksey Nikolayev #:

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Может тут можно применить многокритеальную оптимизацию для поиска 

 
mytarmailS #:

все зависит от поставленой задачи.

Если прогнозировать готовый таргет как это делает подавляющее большиство , то мы никак не влияем на среду , да и самого РЛ там не надо..

А если например задача  управления позицией, стопами , тейками ..

Те управление активом это среда , которой мы (агент) как раз таки и упрвляет..


Агент решает поставить ордер или не поставить и

по какой цене ,

и когда снять или переставить ,

а что он будет делать когда текущий убыток по текущей позиции перевалит за n пунктов,

а что он будет делать если получил 5 убытков подряд..


Те понимаете , это совсем другой уровень задачи, с кучей состояний (выходов)  , а не примитийный вверх/вниз на классификации


Если еще проще - мы не пожем управлять рынком , но мы можем управлять позицией и риском, ведь можем же!


не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Может тут можно применить многокритеальную оптимизацию для поиска 

Можно агента усреднить.
 
Valeriy Yastremskiy #:
Можно агента усреднить.
https://www.mql5.com/ru/code/22915
 
СанСаныч Фоменко #:

Базой финансового результата трейдинга является движение цены - нестационарный случайный процесс. 

За счет неких ухищрений пытаемся превратить нестационарный случайный процесс  в гладкий да еще монотонный? Может широко шагаем? Особенно если учесть, что ошибку классификации менее 20%(!) вне набора обучения добиться крайне сложно. Может для начала поработать над уменьшением ошибки классификации?

Речь была о свойствах функции потерь, минимизируемой при обучении модели. Точнее говоря, об её идеальном виде.

 
mytarmailS #:

не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Это же азы оптимизации. Гладкость даёт возможность оптимизировать посредством градиента. В противном случае, остаются только переборные алгоритмы.

 
Aleksey Nikolayev #:

Это же азы оптимизации

да это я знаю , но тут совсем недавно говорили про гладкость самой кривой капитала , я особо не вникал в ети разговоры потому и переспрашиваю о чем вы

Причина обращения: