Maxim Dmitrievsky #:
どんなクラスタリングや分類器も、確率、遷移、または距離の行列を持っています。いわゆる生の値。そしてクラス/クラスタのラベルがあります。それは異質なものを比較している。

そうだが、完全に正確というわけではない。私が好むのは、現在の状態を記述し、未来を予測する方法だ。これらの作業は本質的に同じだ。状態の変化は、現在の状態の記述とはいえ、予測なのだ))))

これは絶対に曖昧ではない。指でオパを比較する限り、私はもう対話に参加しない。しかも、私が始めたことではない。
 
本質的に未来確率と状態クラスタリングは同じであり、何が違うのか？

難しいですね？閾値のない生の確率 vs すでに閾値のあるクラスタ

彼の写真を見れば、離散と連続を比較していることがわかる。そして、彼は何もないところから閾値を引き出している。そしてその帽子を証明に使っている。

なぜグラフに線を引かなかったのか？それは同じだ。

閾値が2番目の方法で正しく計算されていれば、どちらの方法でも同じ値がある。

 
実際、類似点はある。線はパターンの平均であり、そうだ。そう、離散的なものは連続的なものよりも複雑だが、我々が持っているものは我々が扱うものなのだ))。

 
mytarmailS #:

設定日

新しい機能を作成する場合は、最初の10の株価情報、そうでない場合は、トレーニングから削除する必要があります。

最後の行 - ターゲット

トレーニング用とテスト用に選択範囲を半分に分ける。


フォレストでチューニングなしで新しいデータを得る

hgbustaに新しいフィーチャーを加えたところ、0.83の明暗が分かれた。


アクラシ0.9を達成することは可能なのだろうか？

mytarmailS#:
誰も触ってないのか。


面白半分で触ってみました
)ランダムフォレストを使用。


使用していない変数:
X_OI
X_PER
X_TICKER

リクエスト通り、トレインとテストを半分ずつ。
r1


最大500本までとした。

500本の木を成長させた場合のトレインのMSE
t1


500本の木を成長させた場合のテストの MSE
 t2


トレイン(OOB)とテストでの測定結果。

おそらく、MSEを1から引くべきでしょう
1- 0,16 = 0,84
 そうすると、XGBoostで得たような精度が得られます)).

r2


さて、そしてトレーニングに貢献する変数。
r3


これは私が得た分析です )

 
まあ、OHLCの絶対価格も、私が書いたように、おそらく捨てなければならない ）。

あなたは回帰をやっている、あなたは分類をやっている！ あなたはすべて間違っている。

 
これがOHLCなしの分類です。

精度は0.79。
k1

ROCテスト。
k2

混乱行列。
k4

影響変数
k3

