Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1145

 
FxTrader562:

May be the equation of the individual trades profits and losses using "Q" learning and "Bellman equation"

It means that it should be taken in the future considering the profits in each trades.

I don't know :)

 
FxTrader562:

"Q" learning and "Bellman equation"

It means that it should not be taken into account the individual profits and losses in each trade.

q-learning it's a table method, so individual profits corrected with Bellman

I approximate policy directly, same thing but faster

 
Maxim Dmitrievsky:

нет разницы, обсуждалось.

есть разница, обсуждалось. просто кто-то пропустил мимо ушей.
 
Maxim Dmitrievsky:

нет разницы, обсуждалось. Нет подглядывания в историю

покажите хоть один форум где идет нормалаьное обсуждение МО к рынку

Тут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS  повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))

Форумов не так и много вилмот, квантнет, элит и... больше не приходит в голову, mql5 да самый ликвидный, но и дезы тут через пост, на западных форумах не встретишь "доказательств" как "выгодно" торгануть мартин или СБ, наверно потому что там только квалифицированные инвесторы торгуют, которые никогда  "депозит не разгоняли", тупые салаги...

 
TheXpert:
есть разница, обсуждалось. просто кто-то пропустил мимо ушей.

нет совершенно никакой разницы

toxic недавно пытался объяснить, но сам забыл почему он так думает ))

 
Maxim Dmitrievsky:

Если политика аппроксимируется какой-то моделью (допустим, линейной) то затем просто получаем решение на новых данных и все, подставляя их в модель

то что вы описали это процесс поиска наибольшего вознаграждения

основная проблема с нестационарностью, когда на новых данных это перестает работать. Там описаны нестационарные бандиты, но до них я еще не дошел. Признаться, там по ходу нет ничего такого что я еще не знаю, как оказывается :) Но нужны какие-то идеи\решения как правильно давать вознаграждение

Вы меня переоцениваете) Дальше введения я пока не продвинулся)

Как они и сами пишут - это некий подкласс игр с природой (средой). Уверен, что практически все наши модели лежат в рамках игры с природой, но не знаю насколько подходят эти "бандиты".

Мне больше нравятся скрытые марковские процессы. Там нестационарность может быть следствием того, что мы наблюдаем не все переменные. Грубо говоря, процесс нестационарный для нас, будет производным от процесса стационарного но известного лишь маркет-мейкеру.

 
Грааль:

Тут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS  повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))

Форумов не так и много вилмот, квантнет, элит и... больше не приходит в голову, mql5 да самый ликвидный, но и дезы тут через пост, на западных форумах не встретишь "доказательств" как "выгодно" торгануть мартин или СБ, наверно потому что там только квалифицированные инвесторы торгуют, которые никогда  "депозит не разгоняли", тупые салаги...

да это фигня, я просто тестирую что сделал (обобщающую способность), не торгую же этим

 
Maxim Dmitrievsky:

да это фигня, я просто тестирую что сделал (обобщающую способность), не торгую же этим

понял, фигня так фигня))

 
Aleksey Nikolayev:

Вы меня переоцениваете) Дальше введения я пока не продвинулся)

Как они и сами пишут - это некий подкласс игр с природой (средой). Уверен, что практически все наши модели лежат в рамках игры с природой, но не знаю насколько подходят эти "бандиты".

Мне больше нравятся скрытые марковские процессы. Там нестационарность может быть следствием того, что мы наблюдаем не все переменные. Грубо говоря, процесс нестационарный для нас, будет производным от процесса стационарного но известного лишь маркет-мейкеру.

я могу скинуть код, но не уверен что в нем кто-то будет разбираться и предлагать что-то новое :)

 
Грааль:

понял, фигня так фигня))

Тут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS  повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))

Вы сами пишите абсурд, т.к. рынок может поменяться как в прошлом так и будущем, по отношению к лерну. Более того, чем ближе лерн к настоящему, тем меньше вероятность что рынок изменится завтра. А я просто смотрю насколько алгоритм способен обобщать на любом OOS

Вам просто кто-то сказал что так должно быть, а почему вы не знаете толком, одни догадки

Причина обращения: