文章 "强化学习中的随机决策森林"

Oleg Mironov 2018.08.06 16:27 #61

FxTrader562:

能否请您提供一个不含模糊逻辑的指标代码示例，以及在当前代码执行中将该指标置于何处？

现在不行，我今晚试试。

FxTrader562 2018.08.06 16:36 #62

mov :

现在不行，我晚上再试试。

好的，谢谢。我等着。

基本上，我只想知道如何将 MACD、SAR、MA 等其他指标输入策略矩阵，以更新策略并在每次盈亏时更新奖励。这不需要模糊逻辑。

Oleg Mironov 2018.08.06 20:35 #63

FxTrader562:

基本上，我只想知道如何将其他指标（如 MACD、SAR、MA 等）输入策略矩阵，以更新策略并在每次盈亏时更新奖励。这不需要模糊逻辑。

我看了我的代码，它是不同算法的可怕混合体。为了简单起见，我在文章的源代码中加入了不使用模糊逻辑的必要要点。希望作者不要见怪。我检查过了，似乎可以工作，而且我没有忘记任何重要的东西。指标的数量由 nIndicat 设置。

附加的文件：

RDF_in_reinforcement_learning_classification1.mq5 15 kb

FxTrader562 2018.08.06 23:17 #64

mov :

我看了看自己的代码，各种可验证算法乱成一团。为了简单起见，我介绍了工作中的必要元素，但没有模糊到文章的源代码。希望作者不要见怪。我检查了一下，似乎是可行的。指标的数量指定为 nIndicat。

感谢您提供的代码。我会仔细研究的。

对了，还有一件事。如果你尝试过将迭代学习的优化过程自动化，请告诉我。我的意思是，如果你有任何自动运行优化器的解决方案，使 EA 在每次亏损时自动调用优化器，那么请告诉我。

作者告诉我，他会在今后的文章中添加自动优化功能。但如果有人已经有了代码，那就再好不过了。由于 EA 会自动在文本文件中维护最优策略，因此只需定期自动运行优化器即可，我认为这很容易实现。

Oleg Mironov 2018.08.06 23:27 #65

FxTrader562: 如果您尝试过自动优化迭代学习过程，请告诉我。

我试过，但效率低得多。不出所料，这是作者的一篇新文章。

FxTrader562 2018.08.07 00:13 #66

mov:

我试过了，但效率低得多。正如你所期望的那样，作者写了一篇新文章。

总之，谢谢你。我也在尝试，同时也在等待作者的更新。

您提供的代码似乎效果不错。我将尝试各种组合，并可能再次向您提供最新信息。

再次感谢您。

Igor Vilela 2018.08.08 15:23 #67

大家好、

首先，我要对马克西姆-德米特里耶夫斯基的文章表示祝贺。

其次，我想说的是，我一直在关注这个话题，因为这个话题非常有趣。

第三，我想提出一个疑问，因为我不太明白今天在 EA 分类中是如何执行奖励的，有人能描述一下吗？

我的理解是，当 EA 以负值平仓时，矢量的两个指数（3 和 4）会发生变化。

因为我想在操作为正值时增加奖励，并获得一定数量的积分。

//+------------------------------------------------------------------+
//||
//+------------------------------------------------------------------+
void updateReward()
  {
   if(MQLInfoInteger(MQL_OPTIMIZATION)==true)
     {
      int unierr;
      if(getLAstProfit()<0)
        {
         double likelyhood=MathRandomUniform(0,1,unierr);
         RDFpolicyMatrix[numberOfsamples-1].Set(3,likelyhood); // HERE 
         RDFpolicyMatrix[numberOfsamples-1].Set(4,1-likelyhood); // AND HERE 
        }
     }
  }

谢谢。

谢谢。我使用了谷歌翻译，如果无法理解，请见谅。

Oleg Mironov 2018.08.08 16:01 #68

rogivilela:

我的理解是，当 EA 以负值平仓时，矢量的两个指数（3 和 4）会发生变化，有人符合条件吗？

因为我想在操作为正值时增加奖励，并获得一定数量的点数。

你把文章中的文字拿出来，看看上面的帖子，大家一直在讨论最好的奖励，有关于更有效奖励的建议。

Oleg Mironov 2018.08.08 16:14 #69

rogivilela:

我怎么知道这个奖励是好的？

如果出现亏损，算法应尽量不交易或反向交易，我们不知道如何正确操作，我们使用的是随机值。这几行没有其他含义

Igor Makanu 2018.08.08 16:55 #70

mov:

如果出现亏损，算法应尽量不交易或反向交易，我们不知道正确的方法，我们使用随机值。以上行文没有其他含义

文章本身和给出的算法具有介绍性，要得到结果，不仅在测试器中需要准备输入数据，我最近在 YouTube 上观看了很多关于这个主题的视频，这里有一个非常翔实的例子，以及整个频道。

首先，我认为要按小时进行训练，即训练 24 个神经网络，因为在一天的不同时间段波动性不同，然后我们再看看。

文章 "强化学习中的随机决策森林" - 页 7