Если у тебя среда статичная, то не меняется от действий агента - Общее обсуждение

Maxim Dmitrievsky 2022.11.03 09:04 #28111

Valeriy Yastremskiy #:

Согласен, бай селл не торговать это не состояния. Состояний ряда хулиард.)))

Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.

Поясните на пальцах, как Представление объекта в программировании. Мы запускаем облачный сервис

mytarmailS 2022.11.03 10:38 #28112

Maxim Dmitrievsky #:
Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.

Если я хочу штрафовать агента за убыточные сделки..

Те целевая - "торгуй как хочешь но чтобы ниодной убыточной сделки, и чтобы был в рынке"

Как ты это метками опишешь?

Maxim Dmitrievsky 2022.11.03 10:44 #28113

mytarmailS #:

Если я хочу штрафовать агента за убыточные сделки..

Те целевая - "торгуй как хочешь но чтобы ниодной убыточной сделки, и чтобы был в рынке"

Как ты это метками опишешь?

Серия безубыточных меток на истории, не? ) Проставить их

Rl это про поиск оптимального пути, если угодно, или оптимизация. Ты можешь сам сделать или через него. Это не про поиск каких-то там супер-пупер закономерностей.

Почитай Саттон, Барто “обучение с подкреплением”, есть на русском. Там начиная с примитивов и заканчивая остальным. Потом доберёшься до DQN

Там как раз приводятся аналогии с генетической оптимизацией и программированием, насколько помню.

FAQ по сервису Сигналы Чемпионат Алгоритмов Оптимизации. Обсуждение статьи "Секвента ДеМарка

Valeriy Yastremskiy 2022.11.03 12:51 #28114

Maxim Dmitrievsky #:
Состояния агента, или действия. Предлагаю самостоятельно потупить над книжками пару месяцев, чтобы понять о чем написал, и придти к тем же выводам ) без реакции среды на действия агента оптимизировать там нечего, за один проход делается.

Есть состояния среды, состояния агента, матрицы переходов (политики) агента из состояния в состояние, с учётом изменения среды. У тебя среда статичная, не меняется от действий агента. То есть надо всего лишь определить матрицу действий агента в статичной среде, то есть целевые. Разметка целевых делается за один проход.

Туплю пока над описанием состояния ряда вручную.)))

Maxim Dmitrievsky 2022.11.03 13:31 #28115

Valeriy Yastremskiy #:
Туплю пока над описанием состояния ряда вручную.)))

Бесперспективняк

Valeriy Yastremskiy 2022.11.03 13:57 #28116

Maxim Dmitrievsky #:
Бесперспективняк

Не спорю, но увлекательно)))

Maxim Dmitrievsky 2022.11.03 14:58 #28117

Valeriy Yastremskiy #:
Не спорю, но увлекательно)))

Там 2 состояния - смещение среднего приращений вверх или вниз

mytarmailS 2022.11.04 11:32 #28118

дата сет мой никто так и несмотрел?

Roman 2022.11.04 22:04 #28119

Valeriy Yastremskiy #:
Туплю пока над описанием состояния ряда вручную.)))

Недавно наткнулся на видос, поясняющий Марковсий подход перехода состояний.
Не говорю, что именно эти состояния следует использовать.
Просто показалось, что можно применить эту концепцию к любым состояниям которые считаешь нужными.
Может натолкнёт на какие свои другие мысли.

Maxim не прикалывайся, что снова индус ))
Другого не встретил )

Вы верите в теорию Любой вопрос новичка, чтоб Элитные показатели :)

Maxim Dmitrievsky 2022.11.05 08:42 #28120

Roman #:

Недавно наткнулся на видос, поясняющий Марковсий подход перехода состояний.
Не говорю, что именно эти состояния следует использовать.
Просто показалось, что можно применить эту концепцию к любым состояниям которые считаешь нужными.
Может натолкнёт на какие свои другие мысли.

Maxim не прикалывайся, что снова индус ))
Другого не встретил )

Можно для сегментации временных рядов найти тоже статьи. Можно кластеризацией заменить. Наверное есть смысл обучать разные модели для каждого из состояний, потому что там будут разные характеристики. В основном это смещение среднего приращений, при смене которого модели ломаются.

Поясните на пальцах, как нейронная сеть и входы Bayesian regression - Делал

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2812