カオスにはパターンがあるのか?それを探してみよう!特定のサンプルを例にした機械学習。 - ページ 3

 
Aleksey Vyazmikin #:

exam.csv ファイルでモデルを正確にチェックできますか?

サンプリングの操作は試しましたか?

いくつかの予測因子を除いた後の試験サンプルのバランスです。

もちろん、モデルの回答分布のグラフは、ほんの少ししかトレーニングが行われなかったことを示しています - Recallは非常に低いですが、すでにある程度の結果が出ています。

train.csv


試験.csv

試験には9046行ある。私は9000です。

あなたの曲線の方がずっといい。もう少しパラメータをいじってみます。
 
elibrarius #:

あなたのベストバランスは?

今、私はさまざまなバリエーションで検索しました、それは一種のこの結果であることが判明 - 委員会のラウンドにもある3点は、アイデアに取られている。


 
elibrarius #:
行数は9046。私は9000です。大した違いはないだろう。 あなたの曲線の方がずっといい。もう少しパラメータをいじってみます。

そうですね、もし試験ファイルのデータなら、そうですねー、あまり違いはないですね。もともと3つのファイルをマージしたのですか?

試してみてください。

 
Aleksey Vyazmikin #:

まあ、試験ファイルのデータであれば、そうですね。あまり違いはないのですが、ただ、列車ファイルではないかと思っただけです。もともと3つのファイルを統合していたのですか?

試してみてください。

はい、3つともマージして、あとは区間の長さを指定するだけです。
 
elibrarius #:
ええ、3つを組み合わせて、あとはセクションの長さを入力するだけです。

なるほど。

サンプルを減らして、たとえば1/10でトレーニングすることで、トレーニングを改善できる可能性があると思います。

 

学習率を変えることによってのみ、基準を満たすモデルを100個中2個得ることができた。

1つ目。

つ目。

CatBoostの能力は高いが、より積極的に設定を調整する必要があることがわかった。

 
Aleksey Vyazmikin #:

そうか、それならいいんだ。

サンプルを減らして、例えば1/10でトレーニングすることで、トレーニングを改善できる可能性があると思います。

1000と20000でヴァルキング・フォワードを試してみましたが、すべて失敗しました。
 
1つのクラスでトレードする/しないを教えるのか?
それとも売買を分けるのか?
 
elibrarius #:

あるいは、売買を分けるか?

この結果は、ターゲット変換のないサンプル、つまり「はい - 取引する」と「取引しない」で示されています。

でも本当は、売買のサンプルを別々に作った方がトレーニングしやすいと思います。

elibrarius#:
1000と20000で順張りして学習してみました。

うーん、不思議だ。どのような方法で学習していますか?ランダムフォレストですか?

 
Aleksey Vyazmikin #:

うーん、奇妙だ。トレーニングにはどのような方法を使っていますか?ランダムフォレストですか?

Alglibowから再設計した。
今はもっと多くのツリーを実行している。朝までには新しいバージョンが計算されると思う。

あるいは、私が何か間違ったことをしたのかもしれない。

理由: