トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2130

 
Aleksey Vyazmikin:

すでに分刻みでトレーニングを開始しており、様子を見ています。

また、1/4バーの時間-時間、4時間、日数も使っています。

一般に、木製のモデルには多くの入力が必要であり、それらは可能な限りあらかじめ分割されている、つまり、可能な限り最小限の分割数しかないことが判明しています。

 
elibrarius:

一般に、木製のモデルには、可能な限りあらかじめ分離された、つまり自らを分割しうる最小限の数の入力が必要であることがわかる。

自分で定量化するのであれば、そうですが、自動化も組み込まれています。

上のヒストグラムは、予測器ごとのクアンタ数の違いだけで、それらが最終結果にどう影響するかを見ることができます。

もし、価値ある情報の静脈を予測器の別量子として取り出すならば、この静脈をバイナリ特徴としてコード化し、別途供給することが可能である。

 
elibrarius:

一般に、木製のモデルには、可能な限りあらかじめ分割された入力、つまり最小限の分割数しかない入力が多く与えられる必要があることがわかります。

バランス - T1(分)、T2(分) -平均結果: 3384/3126/3890

再現性-平均結果:0.0459/0.0424/0.0458


精度 -平均 スコア:0.5216/0.5318/0.5389

T2集計の平均点を見ると、最悪のシナリオが浮かび上がってきた。

予測変数の有意性の表を開いてみて、驚きました



トレーニングメソッドによる最後の変化が気に入らないようです、何か間違ったことをしたのでしょうか?

//день недели, час = ввести через 2 предиктора sin и cos угла от полного цикла 360/7,  360/24
   double tmp[4];
   int nInd=0;
   MqlDateTime dts;
   double pi=3.1415926535897932384626433832795;
   for(int buf=0; buf<2; buf++)
   {
      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/1440.0;
      tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;
      tmp[buf]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));

      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf+2]=(double)(dts.day_of_week*1440+dts.hour*60+dts.min)*360.0/10080.0;
      tmp[buf+2]=(double)dts.day_of_week*360.0/7.0;
      tmp[buf+2]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));
   }


サンプルを開封してみました



そして、TimeHGのカラムに時間が含まれているのを確認しました。


 
Aleksey Vyazmikin:

バランス - T1(議事録あり)、T2(議事録なし)平均スコア: 3384/3126/3890

再現性 - 平均スコア:0.0459/0.0424/0.0458


精度 -平均 スコア:0.5216/0.5318/0.5389

T2集計の平均点を見ると、最悪のシナリオが浮かび上がってきた。

予測変数の有意性の表を開いてみて、驚きました



トレーニングメソッドによる最後の変化が気に入らないようです、何か間違ったことをしたのでしょうか?


サンプルを開封してみました



そして、私は列TimeHG -が時間であることを見ました - 私のミス - 私はすべてのテストをやり直す必要があります。


そして、時間は分単位で残っていた。

 tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;

このようになるはずです。

 tmp[buf]=(double)(dts.hour)*360.0/24.0;
TimeHG - どうやら全てを引き継いだようで、そのために他の時計は使われなかったようです。
 
elibrarius:

そして、時計は分単位で残されている

私たちはこれをやらなければならないのです。

OKです。

 

3ヶ月間、純粋に楽しむためのトレーニング-冒頭のトレーニング。全体のタイムテーブルは2014年から2020年です。

期間を大きくとれば、平凡なモデルになってしまう。同時に、全期間で3ヶ月の異なる期間を取ることができます。

例えば、ここではトレーニング期間-その前後で力学的にプラスになっていることがわかります。


現在の先物

Matの期待値は、実際のティックでは6.15を示します。

新型を撮りました。


興味深いことに、この2つは異なるものであり、このことが委員会に組み合わせる可能性を与えています。数学的な期待値は12.64である。

以下は、トレーニングサンプルを含む推定残高のヒストグラムで、トレーニングウィンドウの番号に応じて、数字が大きいほど我々の時間に近い、私はサンプルが2014年から2020年10月までであることを思い出してください。

興味深いのは、利益が最大値の半分近くまで落ちるところもあることだ。トレーニングで騒がしい地域がある、というのはどういうことでしょう?

 
elibrarius:

そして、時計は分単位で残されている

このようになるはずです。

TimeHG - どうやら全てを引き継いだようで、そのため残りの時計は使われなかったようです。

バランス - T1(議事録あり)とT2(議事録なし) - 平均結果:4209.70/2882.50/3889.90


再現性-平均結果:0.0479/0.0391/0.0458


精度 - 平均スコア:0.5318/0.5168/0.5389

予測因子の重要性



平均すると、分単位のないオプション(T2)が合流する。

 
Aleksey Vyazmikin:

バランス - T1(議事録あり)とT2(議事録なし)- 平均スコア:4209.70/2882.50/3889.90


再現性 - 平均スコア:0.0479/0.0391/0.0458


精度 - 平均スコア:0.5318/0.5168/0.5389

予測因子の重要性



平均すると、分単位のないオプション(T2)が合流する。

結論は?
分では、増加を与える。
時間をサインとコサインで表すのか、それとも日、時、分の数字で表すのか、どちらがいいのでしょうか?
 
elibrarius:
結論はどうなったのでしょうか?
分では、増加を与える。
時間をサインとコサインで表すのと、日、時、分の数字だけで表すのと、どちらがいいのでしょうか?

ここまでの結論として、T2は明らかに悪い選択肢であり、サインとコサインを足すことはリニアタイムと同一ではないことがわかる。数字の表現、つまり距離感が違うので、結果が違ってくるのだと思います。距離が異なると、クラスタリンググリッドの形成に影響を与え、その結果、不一致が生じます。

 
Aleksey Vyazmikin:

ここまでの結論として、T2は明らかに悪い選択肢であり、サインとコサインを足すことはリニアタイムと同一ではないことがわかる。数字の表現、つまり距離感が違うので、結果が違って くるのだと思います。距離の違いは、クラスタリンググリッドの形成に影響するため、不一致が生じます。

理論的には - ツリーも同じであるべきです。
日、時間、分におけるさまざまな選択肢の数は、サインとコサインにおける選択肢の数に等しい。7日後のあそこもここも、1分間に1回変化する10080通りの値です。
もし、トレーニングにランダム性があるとすれば、この差に起因するのかもしれません。

ネコババの訓練はしたのか?

NSの場合、59と1分が隣り合わせになるので、サインとコサインの方がもちろん良いのですが、数字の表現では、できるだけ離れている方が良いのです。ツリーに理解させたい場合は、2、3回余分に分割する必要があり、それが深さ制限に欠けている点かもしれません。

理由: