Discussão do artigo "Técnicas do MQL5 Wizard que você deve saber (Parte 59): Aprendizado por Reforço (DDPG) com Padrões da Média Móvel e do Oscilador Estocástico"

 

Novo artigo Técnicas do MQL5 Wizard que você deve saber (Parte 59): Aprendizado por Reforço (DDPG) com Padrões da Média Móvel e do Oscilador Estocástico foi publicado:

Continuamos nosso último artigo sobre DDPG com indicadores de Média Móvel e Estocástico, examinando outras classes-chave de Aprendizado por Reforço cruciais para a implementação do DDPG. Embora estejamos codificando principalmente em Python, será exportado para o formato ONNX para o MQL5, onde a integraremos como um recurso em um Expert Advisor montado pelo Wizard.

Em vez da pergunta que fizemos no aprendizado supervisionado, “o que o preço fará a seguir?”, fazemos a seguinte pergunta: “dadas essas mudanças de preço recebidas, quais ações o trader deve tomar?”. Assim, realizamos os treinamentos de simulação descritos acima para o ano de 2023 e depois executamos um teste forward para o ano de 2024, onde nossas condições de entrada são ligeiramente modificadas.

Em vez de basearmos nossas posições compradas ou vendidas apenas no que o preço fará a seguir, também consideramos quais ações realmente precisamos tomar diante do que o preço fará. Também levamos em conta se as recompensas serão lucrativas. Dos 7 padrões que avançaram nos testes forward no artigo 57, apenas 3 avançam de forma significativa quando o aprendizado por reforço é utilizado. Utilizando nossa indexação dos 10 padrões, numerados de 0 a 9, esses padrões são 1, 2 e 5. Seus relatórios são apresentados abaixo:

Para o padrão 1:

r1

c1


Autor: Stephen Njuki