Обсуждение статьи "Нейросети — это просто (Часть 26): Обучение с подкреплением"

 

Опубликована статья Нейросети — это просто (Часть 26): Обучение с подкреплением:

Продолжаем изучение методов машинного обучения. Данной статьей мы начинаем еще одну большую тему "Обучение с подкреплением". Данный подход позволяет моделям выстаивать определенные стратегии для решения поставленных задач. И мы рассчитываем, что это свойство обучения с подкреплением откроет перед нами новые горизонты построения торговых стратегий.

В своей жизни мы смотрим по сторонам, оцениваем предметы на ощупь, прислушиваемся к звукам. То есть через свои органы чувств мы оцениваем наш мир ежемоментно. В своем сознании мы фиксируем его состояние.

Аналогично, Среда (Environment) генерирует свое Состояние (State), которое оценивается Агентом (Agent).

Точно также, как и мы действуем в соответствии со своим мировоззрением, Агент (Agent) совершает Действие (Action), продиктованное его Стратегией (Policy — Политикой).

Под влиянием оказанного воздействия среда изменяется с определенной долей вероятности. При этом за каждое действие Агент (Agent) получает от Среды (Environment) некое Вознаграждение (Rewards). При этом Вознаграждение (Rewards) может быть как положительное, так и отрицательное. Именно по размеру вознаграждение Агент (Agent) может оценить полезность совершенного действия.

Обучение с подкреплением

Автор: Dmitriy Gizlyk

 
 не запускается советник из статьи требует дополнительных библиотек
 
Хотелось бы увидеть новые статьи но с учетом обновления платформы МТ5 от 4 августа где были расширены возможности платформы MetaTrader 5 для алготрейдинга и машинного обучения