文章 "强化学习中的随机决策森林" - 页 7

 
FxTrader562:

能否请您提供一个不含模糊逻辑的 指标代码示例,以及在当前代码执行中将该指标置于何处?

现在不行,我今晚试试。

 
mov :

现在不行,我晚上再试试。

好的,谢谢。我等着。

基本上,我只想知道如何将 MACD、SAR、MA 等其他指标输入策略矩阵,以更新策略并在每次盈亏时更新奖励。这不需要模糊逻辑

 

FxTrader562:

基本上,我只想知道如何将其他指标(如 MACD、SAR、MA 等)输入策略矩阵,以更新策略并在每次盈亏时更新奖励。这不需要模糊逻辑

我看了我的代码,它是不同算法的可怕混合体。为了简单起见,我在文章的源代码中加入了不使用模糊逻辑的必要要点。希望作者不要见怪。我检查过了,似乎可以工作,而且我没有忘记任何重要的东西。指标的数量由 nIndicat 设置。

 
mov :

我看了看自己的代码,各种可验证算法乱成一团。为了简单起见,我介绍了工作中的必要元素,但没有模糊到文章的源代码。希望作者不要见怪。我检查了一下,似乎是可行的。指标的数量指定为 nIndicat。

感谢您提供的代码。我会仔细研究的。

对了,还有一件事。如果你尝试过将迭代学习的优化过程 自动化,请告诉我。我的意思是,如果你有任何自动运行优化器的解决方案,使 EA 在每次亏损时自动调用优化器,那么请告诉我。

作者告诉我,他会在今后的文章中添加自动优化功能。但如果有人已经有了代码,那就再好不过了。由于 EA 会自动在文本文件中维护最优策略,因此只需定期自动运行优化器即可,我认为这很容易实现。

 
FxTrader562: 如果您尝试过自动优化迭代学习过程,请告诉我。

我试过,但效率低得多。不出所料,这是作者的一篇新文章。

 
mov:

我试过了,但效率低得多。正如你所期望的那样,作者写了一篇新文章。

总之,谢谢你。我也在尝试,同时也在等待作者的更新。

您提供的代码似乎效果不错。我将尝试各种组合,并可能再次向您提供最新信息。

再次感谢您。

 
大家好、
首先,我要对马克西姆-德米特里耶夫斯基的文章表示祝贺。
其次,我想说的是,我一直在关注这个话题,因为这个话题非常有趣。
第三,我想提出一个疑问,因为我不太明白今天在 EA 分类中是如何执行奖励的,有人能描述一下吗?

我的理解是,当 EA 以负值平仓时,矢量的两个指数(3 和 4)会发生变化。
因为我想在操作为正值时增加奖励,并获得一定数量的积分
//+------------------------------------------------------------------+
//||
//+------------------------------------------------------------------+
void updateReward()
  {
   if(MQLInfoInteger(MQL_OPTIMIZATION)==true)
     {
      int unierr;
      if(getLAstProfit()<0)
        {
         double likelyhood=MathRandomUniform(0,1,unierr);
         RDFpolicyMatrix[numberOfsamples-1].Set(3,likelyhood); // HERE 
         RDFpolicyMatrix[numberOfsamples-1].Set(4,1-likelyhood); // AND HERE 
        }
     }
  }


谢谢。
谢谢。我使用了谷歌翻译,如果无法理解,请见谅。
 
rogivilela:
我的理解是,当 EA 以负值平仓时,矢量的两个指数(3 和 4)会发生变化,有人符合条件吗?
因为我想在操作为正值时增加奖励,并获得一定数量的点数。

你把文章中的文字拿出来,看看上面的帖子,大家一直在讨论最好的奖励,有关于更有效奖励的建议。

 
rogivilela:

我怎么知道这个奖励是好的?

如果出现亏损,算法应尽量不交易或反向交易,我们不知道如何正确操作,我们使用的是随机值。这几行没有其他含义

 
mov:

如果出现亏损,算法应尽量不交易或反向交易,我们不知道正确的方法,我们使用随机值。以上行文没有其他含义

文章本身和给出的算法具有介绍性,要得到结果,不仅在测试器中需要准备输入数据,我最近在 YouTube 上观看了很多关于这个主题的视频,这里有一个非常翔实的例子,以及整个频道。


首先,我认为要按小时进行训练,即训练 24 个神经网络,因为在一天的不同时间段波动性不同,然后我们再看看。