Обсуждение статьи "Возможности Мастера MQL5, которые вам нужно знать (Часть 41): Сети Deep-Q"

 

Опубликована статья Возможности Мастера MQL5, которые вам нужно знать (Часть 41): Сети Deep-Q:

Сеть Deep-Q (Deep-Q-Network) — это алгоритм обучения с подкреплением, который вовлекает нейронные сети в прогнозирование следующего значения Q и идеального действия в процессе обучения модуля машинного обучения. Мы уже рассматривали альтернативный алгоритм обучения с подкреплением — Q-обучение. Таким образом, в данной статье представлен еще один пример того, как многослойный перцептрон (multi-layer perceptron, MLP), обученный с помощью обучения с подкреплением, может использоваться в пользовательском классе сигналов.

Сети Deep-Q (Deep-Q-Networks, DQN) - еще один алгоритм обучения с подкреплением, помимо Q-обучения, рассмотренного в этой статье. В отличие от Q-обучения, алгоритм использует нейронные сети для прогнозирования значения q и следующего действия, которое должен выполнить агент. Он похож/связан с Q-обучением тем, что по-прежнему используется Q-таблица, в которой хранятся накопленные знания о действиях и состояниях из предыдущих "эпизодов". В Википедии алгоритм описывается на той же странице, что и Q-обучение и определяется как вариант Q-обучения.

Класс сигнала вместе с классом трейлинг-стопа и классом управления капиталом — это три основных модуля, которые необходимо определить при создании советника, собранного с помощью Мастера. Новички могут узнать о сборке советников в Мастере здесь и здесь. Исходный код, прикрепленный в конце этой статьи, предназначен для использования в соответствии с руководствами по сборке в Мастере, приведенными по этим ссылкам. Рассмотрим определение пользовательского класса сигналов для использования в советнике, собранном с помощью Мастера.

Однако это не единственный способ, которым мы можем исследовать DQN, поскольку можно также создать и протестировать реализации для пользовательского класса трейлинга или пользовательского класса управления капиталом. Мы сосредоточимся на классе сигналов, поскольку определение условий длинных и коротких позиций в этих советниках имеет решающее значение и во многих случаях наилучшим образом демонстрирует потенциал торговых настроек. В предыдущих статьях серии мы подробно останавливаемся на методах и различных настройках, которые можно использовать при разработке советников с помощью Мастера, поэтому я рекомендую новым читателям ознакомиться с прошлыми статьями, особенно если они хотят разнообразить свой подход. В этих статьях рассматриваются не только различные пользовательские сигналы, но и пользовательские реализации классов трейлинга и управления капиталом. 

Автор: Stephen Njuki