Discussão do artigo "Redes neurais de maneira fácil (Parte 39): Go-Explore - uma abordagem diferente para exploração"

 

Novo artigo Redes neurais de maneira fácil (Parte 39): Go-Explore - uma abordagem diferente para exploração foi publicado:

Continuamos com o tema da exploração do ambiente no aprendizado por reforço. Neste artigo, abordaremos mais um algoritmo, o Go-Explore, que permite explorar eficazmente o ambiente durante a fase de treinamento do modelo.

A ideia central do Go-Explore é memorizar e retornar a estados promissores. Isso se torna fundamental para a exploração eficaz em cenários com poucas recompensas. Essa ideia é tão flexível e ampla que pode ser implementada de várias maneiras.

Diferentemente da maioria dos algoritmos de aprendizado por reforço, o Go-Explore não se concentra em encontrar diretamente a solução para a tarefa final, mas sim em descobrir estados e ações relevantes dentro do espaço de estados que podem levar ao estado final desejado. Para isso, o algoritmo possui duas fases principais: busca e reutilização.


A primeira fase envolve percorrer todos os estados no espaço de estados e registrar cada estado visitado em um "mapa" de estados. Em seguida, o algoritmo começa a examinar cada estado visitado com mais detalhes e coleta informações sobre as ações que podem levar a outros estados interessantes.

A segunda fase consiste em reutilizar os estados e ações previamente estudados para encontrar novas soluções. O algoritmo mantém as trajetórias mais bem-sucedidas e as utiliza para gerar novos estados que podem levar a soluções ainda mais bem-sucedidas.

Autor: Dmitriy Gizlyk

 
Olá. O Faza 1 funcionou no testador e criou um arquivo vazio na pasta compartilhada GoExploer. bd. O Faza 2 não está anexado ao gráfico.
 
Na segunda tentativa, o processo foi iniciado. A data de início foi definida muito distante, defina-a como se você tivesse um mês.
 
star-ik #:
Na segunda tentativa, o processo foi iniciado. A data de início foi definida muito distante, eu a defini como se você tivesse um mês.
Qual foi o resultado?
 
Mais ou menos. Mas os saques são grandes. Ele abre uma operação e espera muito tempo por um momento favorável para fechá-la. Muitas vezes reabastece. Muito raramente vende, sempre só compra. As setas estão em todas as barras. Assim que o mercado começar a funcionar, tentarei usá-lo na demonstração.
 
Na demonstração, ele é especificamente negativo. Ele se enche a cada abertura de uma nova barra. Não entendo como ele conseguiu um plus no testador.
 
star-ik #:
Na demonstração, ele é especificamente negativo. Ele se enche a cada abertura de uma nova barra. Não entendo como ele foi para mais no testador.

Obrigado

 
star-ik #:
Na demonstração, ele é especificamente negativo. Ele se enche a cada abertura de uma nova barra. Não entendo como ele estava fazendo um plus no testador.

Ahahahah))))

Groundhog Day.


Eu simpatizo com você.

Tente pressionar o botão "Start" no testador de estratégia várias vezes. Você ficará surpreso.

 

Boa tarde, Dimitri. Obrigado por essa maravilhosa série de artigos. Experimentei todos os seus Expert Advisors, mas tenho um problema com os mais recentes.

O Expert Advisor do artigo 36 (o que tem a maior rede neural) passa no teste no testador, mas a placa de vídeo não carrega durante o teste e o Expert Advisor não tenta negociar. O gráfico de saldo não é alterado. Não há erros no registro do testador. Os arquivos de 1 kb aparecem na pasta Common\Files.

Os Expert Advisors dos artigos 37 e 38 não são testados de forma alguma. O teste é iniciado, mas não há progresso. Ao mesmo tempo, a placa de vídeo é carregada a 100%. E assim por diante, até que o processo do MT5 seja encerrado no Gerenciador. Nenhum arquivo é criado em Common\Files. Não há erros no testador.

O Expert Advisor deste artigo Faza1 passa no teste corretamente, sem erros no registro, mas o arquivo GoExploer.bd também é criado com o tamanho de 1kb.

Você pode me dizer onde devo procurar? Outros Expert Advisors desta série de artigos (que são lançados no gráfico) funcionam normalmente e são considerados como uma placa de vídeo. Placa de vídeo RTX 3060 c 12Gb.

 
Viktor Kudriavtsev #:

O Expert Advisor deste artigo Faza1 também passa no teste corretamente, sem erros no registro, mas o arquivo GoExploer.bd também é criado com o tamanho de 1kb.


O Consultor especialista Faza1 adiciona dados ao banco de dados somente com lucro positivo, de acordo com os resultados do teste. Se todas as passagens não forem lucrativas, ele não salvará nada. Tente executá-lo várias vezes no modo de otimização.
 
star-ik #:
Na demonstração, ele é especificamente negativo. Ele se enche a cada abertura de uma nova barra. Não entendo como ele conseguiu um ponto positivo no testador.

Qual é o período de treinamento? Um curto período de treinamento permite apenas ver se o modelo pode aprender. Mas essa experiência não é suficiente para interpolá-la para estados futuros do sistema.