Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (counts):
Predicted
Actual -101 Error
-1240231523706.204733970619645.811058581761525.0
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (proportions):
Predicted
Actual -101 Error
-126.31.70.16.200.543.52.25.810.06.419.325.0
Overall error: 10.9%, Averaged class error: 12.33333%
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (counts):
Predicted
Actual -101 Error
-1238471502736.204553967719845.81760241767325.4
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (proportions):
Predicted
Actual -101 Error
-126.11.60.16.200.543.52.25.810.06.619.425.4
Overall error: 11%, Averaged class error: 12.46667%
一般的に、3つのクラスをターゲットにするのは、あまり良いことではありません。(-1,0)と(0.1)の2つのターゲットクラスに分け、ポジションを決定する際に組み合わせるのがベターです。
3クラスをお願いしたのは私です。数ページ前にも、ターゲットが2つだけの同様のファイルがありました。2つのターゲティングで対応できず(1つのクラスは人数が大きく偏っているので難しすぎる)、今は3つに挑戦しています。
学習用ファイルとしてソースファイルの10%を取りましたが、randomForestを待ちました。
その結果がこちらです。
ここに興味深いグラフがあります。
50本程度までは誤差が少なくなるが、それ以降は100本以上増やしても全く無駄であることがわかる
そして、検証用とテスト用のチャンクでの結果がこちらです。大型のものを、それぞれ45%ずつ持っています。
何もなければ、とてもまともです。
M1のTCははっきりしない:スプレッドの範囲内で予測する。
学習ファイルは元ファイルの10%を取りましたが、randomForestを待ちました。
以下はその結果である。
ありがとうございます。結果から見ると、調子は悪くないようですね?
しかし、予測変数の重要度表から判断して、arr_Sellが予測変数として使われていたようですね?もしそうなら、それは正しくない。
ここに興味深いグラフがあります。
50本程度までは誤差が少なくなるが、それ以降は100本以上増やしても全く意味がないことがわかる。
だから、予測変数が多ければ多いほど、解決策も多くなる、という論理になるはずなのですが、私の勘違いでしょうか?
何もなければ、とてもまともです。
M1のTSが理解できない:スプレッドの範囲内で予測する。
これはトレンド戦略であり、SiのMOEXで動作します、つまり、そこではスプレッドは重要ではありません。
最終的な判断を下すためには
トレンド戦略があり、それはSiのMOEX取引所で機能し、すなわちそこではスプレッドは重要ではありません。
他に分類上の傾向は?予測誤差はトレンドを引き裂き、トレンドは何も残らなくなる。
しかし、arr_Sellは予測変数の重要度表から判断すると、予測変数として使われていたようですね?もしそうなら、それは正しくない。
当たり前だろ、いい加減にしろ!
どのようなものですか?
再計算してみる。