Обсуждение статьи "Возможности Мастера MQL5, которые вам нужно знать (Часть 62): Использование паттернов ADX и CCI с обучением с подкреплением TRPO"

 

Опубликована статья Возможности Мастера MQL5, которые вам нужно знать (Часть 62): Использование паттернов ADX и CCI с обучением с подкреплением TRPO:

Осцилляторы ADX и CCI — это индикаторы следования за трендом и импульса, которые можно использовать в паре при разработке советника. Мы продолжаем тему, начатую в предыдущей статье, рассмотрением того, как обучение и обновление разработанной нами модели в процессе эксплуатации могут осуществляться благодаря обучению с подкреплением. Мы используем алгоритм, который еще не рассматривали в этой серии, известный как оптимизация политики доверенных регионов (Trusted Region Policy Optimization, TRPO). Как всегда, сборка советника с помощью Мастера MQL5 позволяет нам гораздо быстрее настраивать наши модели для тестирования таким образом, чтобы их можно было распространять и тестировать с различными типами сигналов.

Раньше, чтобы получить полезный или практичный ответ от любой компьютерной программы, этот ответ приходилось вручную записывать в программу. По сути, условный оператор if был основой большинства программ. Если задуматься, зависимость от условных операторов означала, что данные, вводимые пользователем, или данные, обрабатываемые программой, должны были относиться к определенным категориям. Они должны были быть дискретными. Таким образом, можно утверждать, по большей части, что разработка и использование нами дискретных данных были ответом на программные ограничения, а не имели отношения к данным или решаемой проблеме.

А затем, осенью 2023 года, OpenAI представила свой первый публичный GPT, и всё изменилось. Разработка сетей трансформеров и GPT не произошла в одночасье, поскольку первые перцептроны были разработаны в конце 60-х годов, но можно с уверенностью сказать, что запуск ChatGPT стал важной вехой. С широким распространением моделей обработки больших языковых данных стало совершенно очевидно, что токенизация, векторное представление слов и, конечно же, самовнимание являются важнейшими компонентами, позволяющими моделям масштабироваться в соответствии с их возможностями обработки информации. Больше никаких условных выражений. Именно на этом фоне, используя токенизацию и векторное представление слов для обеспечения максимальной непрерывности входных данных сети, мы также сделали входные данные нашего многослойного перцептрона с обучением с учителем «более непрерывными».

Возможности Мастера MQL5, которые вам нужно знать (Часть 62)


Автор: Stephen Njuki