Discussão do artigo "Redes neurais de maneira fácil (Parte 39): Go-Explore - uma abordagem diferente para exploração" - página 2

 
Dmitriy Gizlyk #:


Olá Dimitri.

Essa abordagem pode ser identificada com "algoritmo de otimização de memória"?

Onde o algoritmo se lembra de seu histórico de pesquisa ou há algum outro ponto sutil que eu não tenha captado?

 
Por que há três opções de compra/venda/fechamento de todas as posições no bloco de ações aleatórias do agente? Por que não existe a opção "manter uma posição lucrativa (não fazer nada)"? A ação aleatória é executada na abertura de um candle de uma hora; se a operação está no positivo, por que é preciso fechá-la? Às vezes, é possível obter 300 pips em uma hora.
 
npats2007 #:
Por que há três opções de compra/venda/fechamento de todas as posições no bloco de ações aleatórias do agente? Por que não existe a opção "manter uma posição lucrativa (não fazer nada)"? A ação aleatória é executada na abertura de um candle de uma hora; se a operação está no positivo, por que é preciso fechá-la? Às vezes, é possível obter 300 pips em uma hora.

Observe que semplicamos suas 4 ações. Um agente pode executar uma das 3 ações:

0 - comprar
1 - vender
2 - fechar todas as posições abertas
e 3 - esperar, não executar nenhuma ação.

A ação 3 refere-se à espera por um estado adequado de ações de abertura ou fechamento. Incluindo a situação de acumulação de lucros descrita por você. Somente nesse caso o Expert Advisor não realiza operações de negociação. Portanto, o processamento de tal ação é deliberadamente omitido.

 
Dmitriy Gizlyk #:

Observe que fazemos uma amostragem de suas 4 ações. Um agente pode executar uma das 3 ações:

0 - comprar
1 - vender
2 - fechar todas as posições abertas
e 3 - esperar, não tomar nenhuma ação.

A ação 3 refere-se à espera por um estado adequado de ações de abertura ou fechamento. Incluindo a situação de acumulação de lucros descrita por você. Somente nesse caso o Expert Advisor não realiza operações de negociação. Portanto, o processamento de tal ação é deliberadamente omitido.

Entendi. Obrigado a você.

 

Ainda abre somente compra e preenche em todas as barras. Você pode me dizer como combater esse problema? Alguém conseguiu que ele executasse alguma ação significativa?

Arquivos anexados:
6u3_m6ydd.png  62 kb
 
Acho que o entendo. Ele acha que a única estratégia lucrativa é abrir e esperar sem olhar para as perdas. Como o euro está em alta, ele está operando vendido. Será divertido se ele começar a abrir posições vendidas quando a tendência mudar! Se eu estiver vivo para ver isso, com certeza vou dar uma olhada!
 

Quanto treinamento de fase 2 você deu a ele? Quantas vezes você executou a fase 2?

E qual foi o erro quando você passou para a fase 3?

E toda vez que eu executo a fase 2, o erro fica maior. Isso é normal? Entendo que em uma rede neural o erro deve diminuir durante o processo de treinamento, mas aqui acontece o contrário....

 

Recebi este erro.

2023.05.07 20:04:44.281 Core 01 pass 359 testado com o erro "critical runtime error 502 in OnTester function(array out of range, module Experts\GoExploer\Faza1.ex5, file Faza1.mq5, line 223, col 12)" em 0:00:00.202

//--- copiar célula

actions[action_count] = act;

Base[action_count].total_actions = action_count+StartCell.total_actions;


Como resolver isso?


 
Viktor Kudriavtsev rede neural o erro deve diminuir durante o processo de aprendizado, mas aqui acontece o contrário....

Se o erro estiver aumentando constantemente, tente reduzir o coeficiente de treinamento.

 
Zhongquan Jiang #:

Recebi este erro.

2023.05.07 20:04:44.281 Core 01 pass 359 testado com o erro "critical runtime error 502 in OnTester function (array out of range, module Experts\GoExploer\Faza1.ex5, file Faza1.mq5, line 223, col 12)" em 0:00:00.202

//--- copiar célula

actions[action_count] = act;

Base[action_count].total_actions = action_count+StartCell.total_actions;


Como resolver isso?


Qual é o período de estudo?