削除されたトピック "記事「相対的活力指数による取引システムの設計方法を学ぶ」についてのディスカッション" - ページ 2

 
         double reward = Rates[i - 1].close - Rates[i - 1].open;
         switch(action)
           {
            case 0:
               if(reward < 0)
                  reward *= -20;
               else
                  reward *= 1;
               break;
            case 1:
               if(reward > 0)
                  reward *= -20;
               else
                  reward *= -1;
               break;
            default:
               if(batch == 0)
                  reward = -fabs(reward);
               else
                 {
                  switch((int)vActions[batch - 1])
                    {
                     case 0:
                        reward *= -1;
                        break;
                     case 1:
                        break;
                     default:
                        reward = -fabs(reward);
                        break;
                    }
                 }
               break;
           }

報酬を計算するコードについて詳しく教えてください。Part 27では、報酬の方針は以下のようになっていますが、上記のコードとは異なります:

  1. 利益が出たポジションは、ローソク足の大きさに等しい報酬を受け取ります(各ローソク足のシステム状態を分析します。)
  2. アウト・オブ・ザ・マーケット」の状態は、ローソク足のボディー・サイズにペナルティーが課せられます(ローソク足のボディー・サイズにマイナスの符号を付けると、利益喪失を示します)。
  3. 負けポジションは、ローソク足のボディのダブルサイズ(損失+損失利益)でペナルティを受けます。
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm"
  • 2022.11.25
  • MetaQuotes
  • www.mql5.com
New article Neural networks made easy (Part 29): Advantage Actor-Critic algorithm has been published: Author: Dmitriy Gizlyk...
ファイル:
Capture.PNG  15 kb