Обсуждение статьи "Random Decision Forest в обучении с подкреплением" - страница 2

 
Извини Максим, отвлекли, имя твое не правильно написал.
 
Забыл добавить. Решением, в стратегически играх, является комбинаторика (поиск повторяющихся комбинаций), вероятностный анализ, определение психотипа противника и создание модели поведения.
[Удален]  
Vasily Belozerov:
Забыл добавить. Решением, в стратегически играх, является комбинаторика (поиск повторяющихся комбинаций), вероятностный анализ, определение психотипа противника и создание модели поведения.

Приветствую, насчет психотипа - к рынку конечно же неприменимо. В остальном, RL - это во многом наследие теории игр. Например, можно представить нескольких RL агентов как конкурирующих игроков, каждый будет пытаться обыграть остальных. Или же, сделать их взаимоподкрепляющими.

По сути, составляется платежная матрица между рынком и агентом. И если стратегия рынка не меняется, то агент начинает его обыгрывать, в том случае, когда это возможно.
 
Я просто предположил, что может быть в правильную машину нужно добавить что-то не правильное, похожее на действия человека. Например, первый ход е2 - е4, потом второй ход е4 - е2, третий опять е2 - е4. В общем, что-то такое.
[Удален]  
Vasily Belozerov:
Я просто предположил, что может быть в правильную машину нужно добавить что-то не правильное, похожее на действия человека. Например, первый ход е2 - е4, потом второй ход е4 - е2, третий опять е2 - е4. В общем, что-то такое.

Задача не сделать что бы торговля была похожа на торговлю человека (и как это узнать, бот должен пройти тест Тьюринга?) и с чего вы решили что человек вообще способен торговать хорошо или лучше чем советник, все зависит от стратегии. Задача в том, что бы машина сама искала какие-нибудь закономерности и торговала их.

 
Vasily Belozerov:
Я просто предположил, что может быть в правильную машину нужно добавить что-то не правильное, похожее на действия человека. Например, первый ход е2 - е4, потом второй ход е4 - е2, третий опять е2 - е4. В общем, что-то такое.

Это же Random forest, его главный смысл: что он сам формирует дебютную книгу.

 
Максим, а имеет ли эффект пробовать генерировать новые рандомные деревья? Например, первый раз у нас сгенерировались одни деревья.. второй раз у нас сгенерировались уже другие деревья, которые более эффективно обучаются. Или это не влияет совсем на конечный результат обучения?
[Удален]  
Ivan Gurov:
Максим, а имеет ли эффект пробовать генерировать новые рандомные деревья? Например, первый раз у нас сгенерировались одни деревья.. второй раз у нас сгенерировались уже другие деревья, которые более эффективно обучаются. Или это не влияет совсем на конечный результат обучения?
Тут скорее не деревья а обучать несколько лесов на тех же данных  да, имеет. Потому что процесс построения рандомизирован и результаты могут отличаться. Удивило, что ансамбль из лесов даёт заметное улучшение, т.е. обучить несколько лесов на одинаковых данных а результат осреднить. (5-15 штук) Можно делать разные настройки тоже. Ещё лучше результаты должны быть в случае бустинга, но пока не добрался.
 
Статья понравилась. Еще бы кто переделал лес в  alglib, чтобы можно было регулировать глубину деревьев.
 

Спасибо, что поделились этой очень полезной статьей.

Я пытался внедрить в код дополнительные индикаторы, но я не опытный программист и не имею хорошего опыта использования функций членства, и поэтому я не мог понять, как добавить дополнительные индикаторы для использования вместе с правилами внутри функции OnInit(). Код содержит только индикатор RSI и создает из него правила BUY и SELL. Не могли бы вы предоставить еще несколько примеров кодов индикаторов, таких как Moving average или MACD или stochastic OR SAR для использования в коде?

Особенно я хочу знать, как создавать правила и добавлять условия входа, сравнивая их с текущей ценой. Основная проблема текущего кода в том, что иногда он долго держит убыточные сделки, а прибыльные закрывает быстро, поэтому любой совет по этому поводу будет оценен по достоинству. Я думаю, что необходимо сделать больше фильтров в логике выхода.

Также у меня есть один вопрос, если вы можете ответить, пожалуйста:

Обновляется ли файл OPT постоянно, чтобы улучшить входы и выходы с течением времени после длительной работы путем тонкой настройки самой политики?

Или советник просто использует тестер стратегий для оптимизации значений советника и использует те же значения входа и выхода, которые были прибыльными в последнее время, как обычный оптимизированный советник?

Я имею в виду, как и другие нейросетевые советники, настраивает ли он общую политику входа и выхода из сделки в процессе торговли?