Все о MQL5 Wizard: создавайте роботов без программирования. - страница 7

 

Техники мастера MQL5, которые вы должны знать (часть 41): Deep-Q-Networks

Техники мастера MQL5, которые вы должны знать (часть 41): Deep-Q-Networks

Deep-Q-Networks (DQN) - это еще один алгоритм обучения с подкреплением, помимо Q-Learning, который мы рассматривали в этой статье, но он, в отличие от Q-Learning, использует нейронные сети для прогнозирования q-значения и следующего действия, которое должен предпринять агент. Она похожа/родственна Q-Learning тем, что в ней по-прежнему задействована Q-таблица, в которой хранятся накопленные знания о действиях и состояниях из предыдущих "эпизодов". Фактически, у него та же страница в Википедии, что и у Q-Learning, как видно из ссылок, где он определяется по сути как вариант Q-Learning.
MQL5 Wizard Techniques you should know (Part 41): Deep-Q-Networks
MQL5 Wizard Techniques you should know (Part 41): Deep-Q-Networks
  • www.mql5.com
The Deep-Q-Network is a reinforcement learning algorithm that engages neural networks in projecting the next Q-value and ideal action during the training process of a machine learning module. We have already considered an alternative reinforcement learning algorithm, Q-Learning. This article therefore presents another example of how an MLP trained with reinforcement learning, can be used within a custom signal class.
 

Техники мастера MQL5, которые вы должны знать (часть 42): Осциллятор ADX

Техники мастера MQL5, которые вы должны знать (часть 42): Осциллятор ADX

Индикатор ADX - это осциллятор, который предназначен для измерения того, насколько силен тот или иной тренд на рынке для той ценной бумаги, к которой он привязан. В этой статье, как и в предыдущих, рассматриваются различные паттерны, демонстрируемые этим индикатором в пользовательском файле класса сигналов, для советников, собранных мастером. Мы рассматриваем по одному паттерну за раз, как это было в предыдущих статьях, посвященных RSI, полосам Боллинджера и RSI, а затем завершаем статью тестом, включающим все паттерны, чтобы понять, какой из них имеет наибольший вес.
MQL5 Wizard Techniques you should know (Part 42): ADX Oscillator
MQL5 Wizard Techniques you should know (Part 42): ADX Oscillator
  • www.mql5.com
The ADX is another relatively popular technical indicator used by some traders to gauge the strength of a prevalent trend. Acting as a combination of two other indicators, it presents as an oscillator whose patterns we explore in this article with the help of MQL5 wizard assembly and its support classes.
 
Техники мастера MQL5, которые вы должны знать (часть 43): Обучение с подкреплением с помощью SARSA

Техники мастера MQL5, которые вы должны знать (часть 43): Обучение с подкреплением с помощью SARSA

Reinforcement Learning (RL) позволяет торговым системам обучаться на основе окружающей среды или рыночных данных и тем самым улучшать свои торговые способности с течением времени. RL позволяет адаптироваться к изменяющимся рыночным условиям, что делает его подходящим для определенных динамичных финансовых рынков и ценных бумаг. Финансовые рынки непредсказуемы, так как часто характеризуются высокой степенью неопределенности. RL отлично справляется с принятием решений в условиях неопределенности, постоянно корректируя свои действия на основе полученной обратной связи (вознаграждения), что очень полезно для трейдеров при работе с нестабильными рыночными условиями.
MQL5 Wizard Techniques you should know (Part 43): Reinforcement Learning with SARSA
MQL5 Wizard Techniques you should know (Part 43): Reinforcement Learning with SARSA
  • www.mql5.com
SARSA, which is an abbreviation for State-Action-Reward-State-Action is another algorithm that can be used when implementing reinforcement learning. So, as we saw with Q-Learning and DQN, we look into how this could be explored and implemented as an independent model rather than just a training mechanism, in wizard assembled Expert Advisors.
 

Техники мастера MQL5, которые вы должны знать (часть 44): Технический индикатор Average True Range (ATR)

Average True Range - распространенный и популярный индикатор волатильности, который, возможно, для форекс-трейдеров является "ближайшей вещью" к данным об объеме. Разработанный как индикатор, предназначенный для отслеживания диапазона ценовых баров, не скупясь на внутрибаровые изменения цены, он стал своего рода оплотом в индустрии не только для фильтрации сигналов входа, но и для руководства при определении размера позиции. Мы рассмотрим этот индикатор, разложив его на возможные паттерны, как мы делали это в предыдущих статьях об индикаторах, с тем, пожалуй, главным отличием, что мы рассматриваем паттерны вне класса пользовательских сигналов, а также класс пользовательского управления капиталом для советников, собранных мастером.

MQL5 Wizard Techniques you should know (Part 44): Average True Range (ATR) technical indicator
MQL5 Wizard Techniques you should know (Part 44): Average True Range (ATR) technical indicator
  • www.mql5.com
The ATR oscillator is a very popular indicator for acting as a volatility proxy, especially in the forex markets where volume data is scarce. We examine this, on a pattern basis as we have with prior indicators, and share strategies & test reports thanks to the MQL5 wizard library classes and assembly.
 

Техники мастера MQL5, которые вы должны знать (часть 45): Обучение с подкреплением с помощью Монте-Карло

Техники мастера MQL5, которые вы должны знать (часть 45): Обучение с подкреплением с помощью Монте-Карло

В этой статье мы продолжим рассмотрение обучения с подкреплением, рассмотрев другой алгоритм, а именно Монте-Карло. Этот алгоритм очень похож и, по сути, может включать в себя и Q-Learning, и SARSA, поскольку он может быть как политическим, так и не политическим. Однако его отличает акцент на эпизодах. Это просто способ пакетного обновления циклов обучения с подкреплением, который мы представили в этой статье, таким образом, чтобы обновление Q-значений Q-карты происходило реже.

В алгоритме Монте-Карло Q-значения обновляются только после завершения эпизода. Эпизод - это пакет циклов. Для данной статьи мы назначили это количество циклов входным параметром 'm_episodes_size', который можно оптимизировать или регулировать. Монте-Карло считается достаточно устойчивым к изменчивости рынка, поскольку он может лучше моделировать широкий спектр возможных рыночных сценариев, позволяя трейдерам определить, как различные стратегии работают в различных условиях. Такая изменчивость помогает трейдерам понять потенциальные компромиссы, риски и доходность, что позволяет им принимать более обоснованные решения.

MQL5 Wizard Techniques you should know (Part 45): Reinforcement Learning with Monte-Carlo
MQL5 Wizard Techniques you should know (Part 45): Reinforcement Learning with Monte-Carlo
  • www.mql5.com
Monte-Carlo is the fourth different algorithm in reinforcement learning that we are considering with the aim of exploring its implementation in wizard assembled Expert Advisors. Though anchored in random sampling, it does present vast ways of simulation which we can look to exploit.
 

Техники мастера MQL5, которые вы должны знать (часть 46): Ichimoku

Техники мастера MQL5, которые вы должны знать (часть 46): Ichimoku

Ichimoku Kinko Hyo, которую часто называют Облаком Ичимоку, - это широкомасштабная система технического анализа, призванная обеспечить целостное представление о рыночных тенденциях, уровнях поддержки и сопротивления, а также импульсе. Разработанная в конце 1930-х годов и усовершенствованная в течение последующих трех десятилетий, Ichimoku Kinko Hyo переводится с японского как "график равновесия с одного взгляда" или "график баланса с одного взгляда"; названия, которые подчеркивают ее дизайн, чтобы предложить единый, детальный взгляд на рынок.
MQL5 Wizard Techniques you should know (Part 46): Ichimoku
MQL5 Wizard Techniques you should know (Part 46): Ichimoku
  • www.mql5.com
The Ichimuko Kinko Hyo is a renown Japanese indicator that serves as a trend identification system. We examine this, on a pattern by pattern basis, as has been the case in previous similar articles, and also assess its strategies & test reports with the help of the MQL5 wizard library classes and assembly.
 

Техники мастера MQL5, которые вы должны знать (часть 48): Аллигатор Билла Вильямса

Техники мастера MQL5, которые вы должны знать (часть 48): Билл Уильямс Аллигатор

Индикатор Alligator был разработан Биллом Вильямсом исходя из того, что рынки имеют тенденцию к сильному тренду в любом заданном направлении только в течение 15-30 % времени. По своей сути он является инструментом следования за трендом, который помогает трейдерам определить направление рынка и потенциальные фракталы или разворотные точки. Это достигается за счет использования набора из трех сглаженных скользящих средних (SMA), которые не только установлены на разных периодах усреднения, но и сдвинуты вперед на разную величину.
MQL5 Wizard Techniques you should know (Part 48): Bill Williams Alligator
MQL5 Wizard Techniques you should know (Part 48): Bill Williams Alligator
  • www.mql5.com
The Alligator Indicator, which was the brain child of Bill Williams, is a versatile trend identification indicator that yields clear signals and is often combined with other indicators. The MQL5 wizard classes and assembly allow us to test a variety of signals on a pattern basis, and so we consider this indicator as well.
 

Техники мастера MQL5, которые вы должны знать (часть 47): Обучение с подкреплением с помощью временной разницы

Введение в обучение с использованием временной разницы (TD) в обучении с подкреплением служит пропуском к пониманию того, как TD отличается от других алгоритмов, таких как Monte Carlo, Q-Learning и SARSA. Эта статья призвана раскрыть сложности, связанные с обучением TD, подчеркивая его уникальную способность обновлять оценки значений постепенно, основываясь на частичной информации из эпизодов, а не дожидаясь завершения эпизодов, как в методах Монте-Карло. Это различие делает TD-обучение мощным инструментом, особенно в тех случаях, когда среда динамична и требует быстрого обновления политики обучения.

В предыдущей статье об обучении с подкреплением мы рассмотрели алгоритм Монте-Карло, который собирает информацию о вознаграждении в течение нескольких циклов, прежде чем выполнить одно обновление для каждого эпизода. Темпоральная разница (TD), однако, заключается в обучении на частичных и неполных эпизодах, подобно алгоритмам Q-Learning и SARSA, которые мы рассматривали ранее здесь и здесь.

MQL5 Wizard Techniques you should know (Part 45): Reinforcement Learning with Monte-Carlo
MQL5 Wizard Techniques you should know (Part 45): Reinforcement Learning with Monte-Carlo
  • www.mql5.com
Monte-Carlo is the fourth different algorithm in reinforcement learning that we are considering with the aim of exploring its implementation in wizard assembled Expert Advisors. Though anchored in random sampling, it does present vast ways of simulation which we can look to exploit.
 

Техники мастера MQL5, которые вы должны знать (часть 50): Awesome Oscillator

Техники мастера MQL5, которые вы должны знать (часть 50): Удивительный осциллятор

Awesome oscillator - это еще один индикатор, разработанный легендарным инвестором Биллом Вильямсом, помимо Alligator, который мы рассматривали в прошлой статье про индикатор-шаблон. В принципе, он предназначен для измерения рыночного импульса и помогает определить потенциальные изменения в преобладающих тенденциях.

MQL5 Wizard Techniques you should know (Part 50): Awesome Oscillator
MQL5 Wizard Techniques you should know (Part 50): Awesome Oscillator
  • www.mql5.com
The Awesome Oscillator is another Bill Williams Indicator that is used to measure momentum. It can generate multiple signals, and therefore we review these on a pattern basis, as in prior articles, by capitalizing on the MQL5 wizard classes and assembly.
 

Техники мастера MQL5, которые вы должны знать (часть 51): Обучение с подкреплением с помощью SAC

Техники мастера MQL5, которые вы должны знать (часть 51): Обучение с подкреплением с помощью SAC

Soft Actor Critic - это еще один алгоритм обучения с подкреплением, который мы рассматриваем, уже рассмотрев несколько, включая оптимизацию проксимальной политики, глубокие Q-сети, SARSA и другие. Этот алгоритм, как и некоторые другие, которые мы уже рассматривали, использует нейронные сети, но с некоторыми важными оговорками. Всего используется три сети, а именно: 2 сети критиков и сеть актеров. Две критические сети делают прогнозы вознаграждения (Q-Values) при вводе действия и состояния среды, а минимальное значение выходов этих двух сетей используется для модуляции функции потерь, применяемой для обучения сети актеров.
Soft Actor-Critic — Spinning Up documentation
  • spinningup.openai.com
Soft Actor Critic (SAC) is an algorithm that optimizes a stochastic policy in an off-policy way, forming a bridge between stochastic policy optimization and DDPG-style approaches. It isn’t a direct successor to TD3 (having been published roughly concurrently), but it incorporates the clipped double-Q trick, and due to the inherent stochasticity...