カオスにはパターンがあるのか？それを探してみよう！特定のサンプルを例にした機械学習。

Aleksei Kuznetsov 2022.10.28 19:38 #21

Aleksey Vyazmikin #:

exam.csv ファイルでモデルを正確にチェックできますか？

サンプリングの操作は試しましたか？

いくつかの予測因子を除いた後の試験サンプルのバランスです。

もちろん、モデルの回答分布のグラフは、ほんの少ししかトレーニングが行われなかったことを示しています - Recallは非常に低いですが、すでにある程度の結果が出ています。

train.csv

試験.csv

試験には9046行ある。私は9000です。

あなたの曲線の方がずっといい。もう少しパラメータをいじってみます。

Aleksey Vyazmikin 2022.10.28 19:44 #22

elibrarius #:

あなたのベストバランスは？

今、私はさまざまなバリエーションで検索しました、それは一種のこの結果であることが判明 - 委員会のラウンドにもある3点は、アイデアに取られている。

Aleksey Vyazmikin 2022.10.28 19:45 #23

elibrarius #:
行数は9046。私は9000です。大した違いはないだろう。あなたの曲線の方がずっといい。もう少しパラメータをいじってみます。

そうですね、もし試験ファイルのデータなら、そうですねー、あまり違いはないですね。もともと3つのファイルをマージしたのですか？

試してみてください。

Aleksei Kuznetsov 2022.10.28 19:50 #24

Aleksey Vyazmikin #:

まあ、試験ファイルのデータであれば、そうですね。あまり違いはないのですが、ただ、列車ファイルではないかと思っただけです。もともと3つのファイルを統合していたのですか？

試してみてください。

はい、3つともマージして、あとは区間の長さを指定するだけです。

Aleksey Vyazmikin 2022.10.28 19:54 #25

elibrarius #:
ええ、3つを組み合わせて、あとはセクションの長さを入力するだけです。

なるほど。

サンプルを減らして、たとえば1/10でトレーニングすることで、トレーニングを改善できる可能性があると思います。

Aleksey Vyazmikin 2022.10.28 20:31 #26

学習率を変えることによってのみ、基準を満たすモデルを100個中2個得ることができた。

1つ目。

つ目。

CatBoostの能力は高いが、より積極的に設定を調整する必要があることがわかった。

Aleksei Kuznetsov 2022.10.28 20:41 #27

Aleksey Vyazmikin #:

そうか、それならいいんだ。

サンプルを減らして、例えば1/10でトレーニングすることで、トレーニングを改善できる可能性があると思います。

1000と20000でヴァルキング・フォワードを試してみましたが、すべて失敗しました。

Aleksei Kuznetsov 2022.10.28 20:44 #28

1つのクラスでトレードする／しないを教えるのか？
それとも売買を分けるのか？

Aleksey Vyazmikin 2022.10.28 21:03 #29

elibrarius #:

あるいは、売買を分けるか？

この結果は、ターゲット変換のないサンプル、つまり「はい - 取引する」と「取引しない」で示されています。

でも本当は、売買のサンプルを別々に作った方がトレーニングしやすいと思います。

elibrarius#:
1000と20000で順張りして学習してみました。

うーん、不思議だ。どのような方法で学習していますか？ランダムフォレストですか？

Aleksei Kuznetsov 2022.10.28 21:11 #30

Aleksey Vyazmikin #:

うーん、奇妙だ。トレーニングにはどのような方法を使っていますか？ランダムフォレストですか？

Alglibowから再設計した。
今はもっと多くのツリーを実行している。朝までには新しいバージョンが計算されると思う。

あるいは、私が何か間違ったことをしたのかもしれない。

カオスにはパターンがあるのか？それを探してみよう！特定のサンプルを例にした機械学習。 - ページ 3