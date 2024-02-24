トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1236

森の皆さんへ。木と森のクラスバランシング（異なるクラスの例数を均等にすること）は必要ですか？
 
エリブラリウス
今読んでる記事：Flach P. - Machine Learning.データから知識を抽出するアルゴリズム構築の科学と技術 - 2015年

そこには、このテーマに特化したページがいくつもあります。ここが肝心なところです。

指摘されたポイント1は、バランス調整が有効であることを述べています。

このことから、大きなサンプルでは、小さなクラスの例が十分にあれば、それに対するサンプルは代表的なものになると結論づけることができます。そうすると、バランス調整が不要になるんです。
BPの代表例と言えるものはいくつあるのでしょうか？

そして、パラです。3.しかし、使用するプログラムのツリーの特定の実装にそのような補正があるかどうかを知ることは困難である。

 
私見では、アファターはMOの大数の法則を述べているのだと思います。

明らかに、最初のクラスに10のオブザベーションがあり、2番目のクラスに6がある場合、2番目のクラスに4を追加すると、モデルは変わりますが（必ずしも改善されません）、それでも代表的ではなくなります。

 
8:2と6:4というように、10分の1の小さな数字で説明した。でも、データはたくさんあるんですよ。


BPの代表例と言えるものはいくつあるのでしょうか？私は通常10000以下は使いません、小さなクラスでは少なくとも1000は必要です。

 
HZ.最大でも、木や森の日々の データ、つまり最低でも2年分は取っていました。

A_Kさんに聞いてみてください。彼はチェビシェフの不等式を使って最適値を決めていましたが（私の記憶が正しければ）、連続変数に対してだけでした。

変数の数から始めてみてください。それぞれ最低でも100個は必要です。

一般に、「永久不変」のパターンを見つけようとするならば、多ければ多いほどよい。パターン」が浮いている場合は、最適なウィンドウを探す必要があります。

 
今後、数千台単位で追加していき、モデルも変わっていくかもしれませんが。

そして、それは正しいのかもしれない。市場は変化しているのだから、モデルも変化させればいい。

 
その際、木材を使うのですか？

 
BPの分析には、お金を稼ぐために。
まだ使っていないけど、そろそろやってみたい。その長所と短所を理解するために、まだ理論を読んでいる段階です。満足できないので、森と一緒にやることにしました。BPに向いているような気がします。
 
2年前、ここでマキシムカに「NSは核爆弾のようなおもちゃだ」と書いた。他のモデルが少なくとも満足のいく結果を出した場合、NSを使うことは推奨されないということです-彼らは存在しないものを見つけ、それについて何もすることができません。

木は良いものですが、足場を使った方が良いですね。

