Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2812

 
Valeriy Yastremskiy #:

Согласен, бай селл не торговать это не состояния. Состояний ряда хулиард.)))

Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.
 
Maxim Dmitrievsky #:
Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.
Если я хочу штрафовать агента за убыточные сделки.. 
Те целевая - "торгуй как хочешь но чтобы ниодной убыточной сделки,  и чтобы был в рынке" 

Как ты это метками опишешь? 
 
mytarmailS #:
Если я хочу штрафовать агента за убыточные сделки.. 
Те целевая - "торгуй как хочешь но чтобы ниодной убыточной сделки,  и чтобы был в рынке" 

Как ты это метками опишешь? 
Серия безубыточных меток на истории, не? ) Проставить их
Rl это про поиск оптимального пути, если угодно, или оптимизация. Ты можешь сам сделать или через него. Это не про поиск каких-то там супер-пупер закономерностей.

Почитай Саттон, Барто “обучение с подкреплением”, есть на русском. Там начиная с примитивов и заканчивая остальным. Потом доберёшься до DQN

Там как раз приводятся аналогии с генетической оптимизацией и программированием, насколько помню.
 
Maxim Dmitrievsky #:
Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.
Туплю пока над описанием состояния ряда вручную.)))
 
Valeriy Yastremskiy #:
Туплю пока над описанием состояния ряда вручную.)))
Бесперспективняк 
 
Maxim Dmitrievsky #:
Бесперспективняк 
Не спорю, но увлекательно)))
 
Valeriy Yastremskiy #:
Не спорю, но увлекательно)))
Там 2 состояния - смещение среднего приращений вверх или вниз
 
дата сет мой никто так и несмотрел?
 
Valeriy Yastremskiy #:
Туплю пока над описанием состояния ряда вручную.)))

Недавно наткнулся на видос, поясняющий Марковсий подход перехода состояний.
Не говорю, что именно эти состояния следует использовать.
Просто показалось, что можно применить эту концепцию к любым состояниям которые считаешь нужными.
Может натолкнёт на какие свои другие мысли.



Maxim не прикалывайся, что снова индус )) 
Другого не встретил ) 

 
Roman #:

Недавно наткнулся на видос, поясняющий Марковсий подход перехода состояний.
Не говорю, что именно эти состояния следует использовать.
Просто показалось, что можно применить эту концепцию к любым состояниям которые считаешь нужными.
Может натолкнёт на какие свои другие мысли.



Maxim не прикалывайся, что снова индус )) 
Другого не встретил ) 

Можно для сегментации временных рядов найти тоже статьи.  Можно кластеризацией заменить. Наверное есть смысл обучать разные модели для каждого из состояний, потому что там будут разные характеристики. В основном это смещение среднего приращений, при смене которого модели ломаются.
Причина обращения: