Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1145
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
May be the equation of the individual trades profits and losses using "Q" learning and "Bellman equation"
It means that it should be taken in the future considering the profits in each trades.
I don't know :)
"Q" learning and "Bellman equation"
It means that it should not be taken into account the individual profits and losses in each trade.
q-learning it's a table method, so individual profits corrected with Bellman
I approximate policy directly, same thing but faster
нет разницы, обсуждалось.
нет разницы, обсуждалось. Нет подглядывания в историю
покажите хоть один форум где идет нормалаьное обсуждение МО к рынкуТут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))
Форумов не так и много вилмот, квантнет, элит и... больше не приходит в голову, mql5 да самый ликвидный, но и дезы тут через пост, на западных форумах не встретишь "доказательств" как "выгодно" торгануть мартин или СБ, наверно потому что там только квалифицированные инвесторы торгуют, которые никогда "депозит не разгоняли", тупые салаги...
есть разница, обсуждалось. просто кто-то пропустил мимо ушей.
нет совершенно никакой разницы
toxic недавно пытался объяснить, но сам забыл почему он так думает ))
Если политика аппроксимируется какой-то моделью (допустим, линейной) то затем просто получаем решение на новых данных и все, подставляя их в модель
то что вы описали это процесс поиска наибольшего вознаграждения
основная проблема с нестационарностью, когда на новых данных это перестает работать. Там описаны нестационарные бандиты, но до них я еще не дошел. Признаться, там по ходу нет ничего такого что я еще не знаю, как оказывается :) Но нужны какие-то идеи\решения как правильно давать вознаграждениеВы меня переоцениваете) Дальше введения я пока не продвинулся)
Как они и сами пишут - это некий подкласс игр с природой (средой). Уверен, что практически все наши модели лежат в рамках игры с природой, но не знаю насколько подходят эти "бандиты".
Мне больше нравятся скрытые марковские процессы. Там нестационарность может быть следствием того, что мы наблюдаем не все переменные. Грубо говоря, процесс нестационарный для нас, будет производным от процесса стационарного но известного лишь маркет-мейкеру.
Тут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))
Форумов не так и много вилмот, квантнет, элит и... больше не приходит в голову, mql5 да самый ликвидный, но и дезы тут через пост, на западных форумах не встретишь "доказательств" как "выгодно" торгануть мартин или СБ, наверно потому что там только квалифицированные инвесторы торгуют, которые никогда "депозит не разгоняли", тупые салаги...
да это фигня, я просто тестирую что сделал (обобщающую способность), не торгую же этим
да это фигня, я просто тестирую что сделал (обобщающую способность), не торгую же этим
понял, фигня так фигня))
Вы меня переоцениваете) Дальше введения я пока не продвинулся)
Как они и сами пишут - это некий подкласс игр с природой (средой). Уверен, что практически все наши модели лежат в рамках игры с природой, но не знаю насколько подходят эти "бандиты".
Мне больше нравятся скрытые марковские процессы. Там нестационарность может быть следствием того, что мы наблюдаем не все переменные. Грубо говоря, процесс нестационарный для нас, будет производным от процесса стационарного но известного лишь маркет-мейкеру.
я могу скинуть код, но не уверен что в нем кто-то будет разбираться и предлагать что-то новое :)
понял, фигня так фигня))
Тут дело не в подглядывании, хотя и оно также может иметь место быть при некоторых условиях, а в том что OOS должен быть максимально приближен к реалу, так как вы хотите чтобы результат OOS повторился +- на реале, а если тестировать на более далёком прошлом, то он будет близок к прошлому, а рынок за это время может и поменяться более или менее. Ваш метод можно привести совсем к абсурду например если разнести OOS и реал на годы)))
Вы сами пишите абсурд, т.к. рынок может поменяться как в прошлом так и будущем, по отношению к лерну. Более того, чем ближе лерн к настоящему, тем меньше вероятность что рынок изменится завтра. А я просто смотрю насколько алгоритм способен обобщать на любом OOS
Вам просто кто-то сказал что так должно быть, а почему вы не знаете толком, одни догадки