Discusión sobre el artículo "Redes neuronales: así de sencillo (Parte 29): Algoritmo actor-crítico con ventaja (Advantage actor-critic)" - página 2

 
         double reward = Rates[i - 1].close - Rates[i - 1].open;
         switch(action)
           {
            case 0:
               if(reward < 0)
                  reward *= -20;
               else
                  reward *= 1;
               break;
            case 1:
               if(reward > 0)
                  reward *= -20;
               else
                  reward *= -1;
               break;
            default:
               if(batch == 0)
                  reward = -fabs(reward);
               else
                 {
                  switch((int)vActions[batch - 1])
                    {
                     case 0:
                        reward *= -1;
                        break;
                     case 1:
                        break;
                     default:
                        reward = -fabs(reward);
                        break;
                    }
                 }
               break;
           }

¿Puede usted explicar más sobre el código para calcular la recompensa. Porque en la Parte 27, la política de recompensa es la siguiente, difiere con el código anterior:

  1. Una posición rentable recibe una recompensa igual al tamaño del cuerpo de la vela (analice el estado del sistema en cada vela; estamos en una posición desde la apertura de la vela hasta su cierre).
  2. El estado "fuera del mercado" se penaliza en el tamaño del cuerpo de la vela (el tamaño del cuerpo de la vela con un signo negativo para indicar la pérdida de beneficios).
  3. Una posición perdedora se penaliza con el tamaño del cuerpo de la vela doble (pérdida + beneficio perdido).
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
  • 2022.11.25
  • MetaQuotes
  • www.mql5.com
New article Neural networks made easy (Part 29): Advantage Actor-Critic algorithm has been published: Author: Dmitriy Gizlyk...
Archivos adjuntos:
Capture.PNG  15 kb