記事「知っておくべきMQL5ウィザードのテクニック(第03回):シャノンのエントロピー」についてのディスカッション

 

新しい記事「知っておくべきMQL5ウィザードのテクニック(第03回):シャノンのエントロピー」はパブリッシュされました:

今日のトレーダーは哲学者であり、ほとんどの場合、新しいアイデアを探し、試し、変更するか破棄するかを選択します。これは、かなりの労力を要する探索的プロセスです。この連載では、MQL5ウィザードがトレーダーの主力であるべきであることを示します。

クロード・シャノンは1948年に、情報エントロピーの斬新な理想を持った論文「通信の数学的理論」を発表しました。エントロピーは物理学からの概念で、物質内の粒子がアクティブである範囲の尺度です。たとえば、水の3つの状態、つまり氷、液体、蒸気を考えると、粒子の運動エネルギーは蒸気で最も高く、氷で最も小さいことがわかります。これと同じ概念が、確率を介して数学に適用されます。次の3つのセットを検討してください。

セット1: 

セット1


セット2: 

セット2


セット3: 

セット3


これらのセットのどれが最高のエントロピーを持つかを推測するとしたら、どちらでしょうか。 
最後を選んだ方は正しいですが、その答えをどのように検証するのでしょうか。これに答える最も簡単な方法は、各セットを再編成できる方法の数をエントロピー推定値として取り、同様の色のストレッチを無視することです。したがって、最初のセットを「再配置」する方法は1つしかありませんが、後のセットを見ると、明らかに色に関する順列の数が大幅に増加しているため、最後のセットが最も高いエントロピーを持っていると主張できます。

作者: Stephen Njuki

 

記事を読んだが、よく理解できなかった:

1.ランダムフォレストに 何を入力するのか。

2.どうやってエントロピーを計算するのか - 森の分類履歴に基づいて?

記事の翻訳は残念ながら質が高くなく、理解するのが難しい。

また、本文では図解について触れているにもかかわらず、図解が少ないように感じることがある:

"

上の図では、伝統的な決定木(青で 示されている)は、ノードの分割方法を決定する際に、4つの属性すべてから選択することができる。属性1(黒と下線)は、データを最大に分離したグループに分割する。

"

 

このシグナルジェネレーターには問題がある。 コード自体が意味をなしていないのだ。

158行目が正しくないときから、私は問題に気づき始めました。 ルールの数を__INPUTSにすべきところを、__RULESにしているのです。

ルール。


最適化時にデシジョンフォレストが使用されるのは理解できるが、最適化されていない時にそれを読まないのはどういうことだ?

デシジョンフォレストは何かを検証するために使われているようですが、信号の決定には何も寄与していません。

また、もしデシジョンフォレストを使っているのであれば、その使い方が説明されていない(あるいは予備知識が必要)。ここでは:


CDForest::DFProcess(DF,m_in_calculations,m_out_calculations);

   m_update.B(m_out_calculations[1]);


あなたは中立セットのプロファイルを 変更している。これはシグナルに影響を与えますが、その方法と理由を説明してください。

それ以外は素晴らしい。