Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 29): Der Algorithmus Advantage Actor Critic" - Seite 2

 
         double reward = Rates[i - 1].close - Rates[i - 1].open;
         switch(action)
           {
            case 0:
               if(reward < 0)
                  reward *= -20;
               else
                  reward *= 1;
               break;
            case 1:
               if(reward > 0)
                  reward *= -20;
               else
                  reward *= -1;
               break;
            default:
               if(batch == 0)
                  reward = -fabs(reward);
               else
                 {
                  switch((int)vActions[batch - 1])
                    {
                     case 0:
                        reward *= -1;
                        break;
                     case 1:
                        break;
                     default:
                        reward = -fabs(reward);
                        break;
                    }
                 }
               break;
           }

Können Sie den Code zur Berechnung der Prämie näher erläutern? Weil in Teil 27, die Belohnung Politik wie unten, es unterscheiden sich mit dem Code oben:

  1. Eine gewinnbringende Position erhält eine Belohnung, die der Größe des Kerzenkörpers entspricht (analysieren Sie den Systemzustand bei jeder Kerze; wir befinden uns in einer Position von der Eröffnung bis zur Schließung der Kerze).
  2. Der Zustand "aus dem Markt" wird durch die Größe des Kerzenkörpers bestraft (die Größe des Kerzenkörpers mit einem negativen Vorzeichen, um die entgangenen Gewinne anzuzeigen).
  3. Eine Verlustposition wird durch die doppelte Größe des Kerzenkörpers bestraft (Verlust + verlorener Gewinn).
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
  • 2022.11.25
  • MetaQuotes
  • www.mql5.com
New article Neural networks made easy (Part 29): Advantage Actor-Critic algorithm has been published: Author: Dmitriy Gizlyk...
Dateien:
Capture.PNG  15 kb