Discussão do artigo "Redes neurais de maneira fácil (Parte 29): Algoritmo ator-crítico de vantagem (Advantage actor-critic)" - página 2

encoder83 2025.02.12 11:01 #11

         double reward = Rates[i - 1].close - Rates[i - 1].open;
         switch(action)
           {
            case 0:
               if(reward < 0)
                  reward *= -20;
               else
                  reward *= 1;
               break;
            case 1:
               if(reward > 0)
                  reward *= -20;
               else
                  reward *= -1;
               break;
            default:
               if(batch == 0)
                  reward = -fabs(reward);
               else
                 {
                  switch((int)vActions[batch - 1])
                    {
                     case 0:
                        reward *= -1;
                        break;
                     case 1:
                        break;
                     default:
                        reward = -fabs(reward);
                        break;
                    }
                 }
               break;
           }

Você pode explicar melhor o código para calcular a recompensa. Porque na Parte 27, a política de recompensa é a seguinte, diferente do código acima:

Uma posição lucrativa recebe uma recompensa igual ao tamanho do corpo do candlestick (analise o estado do sistema em cada candlestick; estamos em uma posição desde a abertura do candlestick até seu fechamento).
O estado "fora do mercado" é penalizado no tamanho do corpo do candlestick (o tamanho do corpo do candlestick com um sinal negativo para indicar lucros perdidos).
Uma posição perdedora é penalizada pelo tamanho do corpo do candlestick duplo (perda + lucro perdido).

Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"

2022.11.25
MetaQuotes
www.mql5.com

New article Neural networks made easy (Part 29): Advantage Actor-Critic algorithm has been published: Author: Dmitriy Gizlyk...

Arquivos anexados:

Capture.PNG 15 kb

[ARQUIVO!] Qualquer pergunta de [ARQUIVO] Qualquer pergunta de O indicador do sistema

1 2

Novo comentário