文章 "您应该知道的 MQL5 向导技术(第 03 部分):香农(Shannon)熵"

 

新文章 您应该知道的 MQL5 向导技术(第 03 部分):香农(Shannon)熵已发布:

今天的交易者都是哲学家,几乎总是在寻找新的想法,尝试提炼它们,选择修改或丢弃它们:一个探索性的过程,肯定会花费相当的勤奋程度。 本系列文章将提出,MQL5 向导应该是交易者的支柱。

克劳德·香农(Claude Shannon)在 1948 年发表了他的论文通信的数学理论,该论文具有信息熵的新理年。 熵是物理学中的一个概念。 它是物体内粒子活跃程度的量度。 如果我们考虑水的 3 种状态,例如冰固态、水液态和蒸汽态,我们可以看到,粒子动能在蒸汽态中最高,在冰固态中最小。 同样的概念应用于数学中既是概率。 考虑以下三个集合。

集合 1: 

集合 1


集合 2: 

集合 2


集合 3: 

集合 3


如果您要猜测这些集合中哪一个的熵最高? 如果您选择了最后一组,那么您是对的,但是我们如何验证这个答案? 回答这个问题的最简单方式是取您重新组织每个集合的方式数量作为熵估算,同时忽略同色拉伸。 因此,对于第一个集合,只有一种方式可以“重新排列”它,然而当我们仔细查看这些集合,显然,从颜色的角度排列数量显著增加,所以您可以认定最后一个集合具有最高的熵。 

作者:Stephen Njuki

 

我读了这篇文章,但不是很理解:

1.随机森林 的输入是什么?

2.如何根据森林的分类历史计算熵?

不幸的是,这篇文章的翻译质量不高,导致我很难理解。

有时,文章中似乎没有足够的插图,尽管文中提到了这些插图:

"

让我们来看一个说明性的例子--在上图中,传统的决策树(蓝色 表示) 在决定如何分割一个节点时,可以从所有四个属性中进行选择。它决定使用属性 1(下划线为黑色),因为这可以将数据最大限度地分割成不同的组。

"

 

这个信号发生器有问题,代码本身没有意义。

我是在第 158 行出现错误时开始注意到问题的。 你创建了 __INPUTS 规则数,而它应该是

规则。


我知道决策森林是在优化过程中使用的,但在非优化运行中不读取它时,又有什么意义呢?

决策森林似乎是用来验证什么的,但对信号决策毫无帮助。

而且,如果要使用决策森林,也没有解释其用法(或需要事先了解)。这里 :


CDForest::DFProcess(DF,m_in_calculations,m_out_calculations);

   m_update.B(m_out_calculations[1]);


你正在改变中性集的轮廓。这确实会对信号产生影响,但能否请您解释一下如何影响以及为什么会影响。

其他方面都很好。