文章 "神经网络变得轻松(第二十九部分):优势扮演者-评价者算法" - 页 2 12 新评论 encoder83 2025.02.12 11:01 #11 double reward = Rates[i - 1].close - Rates[i - 1].open; switch(action) { case 0: if(reward < 0) reward *= -20; else reward *= 1; break; case 1: if(reward > 0) reward *= -20; else reward *= -1; break; default: if(batch == 0) reward = -fabs(reward); else { switch((int)vActions[batch - 1]) { case 0: reward *= -1; break; case 1: break; default: reward = -fabs(reward); break; } } break; } 能否详细解释一下计算奖励的代码。因为在第 27 部分中,奖励政策如下,与上面的代码不同: 盈利头寸获得的奖励等于烛台体的大小(分析每个烛台的系统状态;从烛台开盘到收盘,我们都处于头寸中)。 脱离市场 "状态的惩罚是烛台体的大小(烛台体大小带负号,表示利润损失)。 亏损头寸则以双烛台体大小(亏损 + 损失的利润)表示。 Discussion of article "Neural networks made easy (Part 29): Advantage Actor-Critic algorithm" 2022.11.25MetaQuoteswww.mql5.com New article Neural networks made easy (Part 29): Advantage Actor-Critic algorithm has been published: Author: Dmitriy Gizlyk... 附加的文件: Capture.PNG 15 kb 12 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
能否详细解释一下计算奖励的代码。因为在第 27 部分中,奖励政策如下,与上面的代码不同: