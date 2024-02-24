トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3360

Maxim Dmitrievsky #:
私は全くキャンペーンをしていない。アプローチはいくらでもある。質問はMOの知識についてだった

まあ、私自身はモデルの答えをクラスが脱落する確率とは関連付けておらず、クラス定義に対するモデルの信頼度として受け取っている。信頼度は葉っぱでカウントされ、葉っぱはトレーニングサンプルでカウントされます。ここでは、1つのリーフがクラス脱落の確率を示す。各葉はサンプルのすべてのポイントで応答を持っているわけではないので、確率の合計がモデルの最終的な応答で歪んでいることがわかります。おそらく、このレベルで修正する方法があり、私はそれに興味があります。

私の意見では、解決策は、似たような回答ポイントで葉をグループ化し、グループの平均要約結果をさらに変換することです...。

Aleksey Vyazmikin #:

まあ、私自身はモデルの反応をクラス脱落の確率とは関連付けず、クラス検出に対するモデルの自信として受け止めています。信頼度は葉に基づいており、葉はトレーニングサンプルに基づいています。ここでは、1つのリーフがクラス脱落の確率を示します。各葉はサンプルのすべてのポイントで応答を持っているわけではないので、確率の合計がモデルの最終的な応答で歪んでいることがわかります。おそらく、このレベルで修正する方法があるのでしょう - そして私はそれに興味があります - それが私が議論を変えようとした方向です。

私の意見では、解決策は、似たような回答ポイントで葉をグループ分けし、グループの平均的な要約結果をさらに変換することです......。

申し訳ないが、図書館やノート、論文の参照がなければ、私はまだおおよそ次のように受け止めている。


 
Maxim Dmitrievsky #:

申し訳ないが、図書館やノート、記事へのリンクがなければ、私はまだ大まかにこのように受け止めている。


え、必要なのはパッケージだけ...。

Aleksey Vyazmikin #:

バッグがあればいいのに。

任意の 分類器をCV法でキャリブレーションした後、すぐにこのモデルの可能性を見ることができる。何の能力もない場合、この手順の後、確率は0.5付近に集まる。それ以前は自信過剰でしたが。このようなモデルをこれ以上いじってもまったく意味がない。改善することはできない。つまり、普通にキャリブレーションすることさえできない。便利なものだ。

あなたの言う「量子カット」、つまり、利益が出る可能性のある範囲やビンは存在しない。

さて、最後にこの話題を終わります。シグモイドキャリブレーションをmetacにエクスポートすることに成功しました。

与えられたもの：再トレーニングされた勾配ブースティング、そしてこの状態にキャリブレーションされたもの：


しきい値0.5では、すべてが明らかで、OOSがどこにあるかわかります：

しきい値0.5を実行し、最適化を停止します：

いろいろなバリエーションが得られるが、しきい値0.75-0.85がベスト。しきい値0.5では通常のバリエーションはありませんが、新しいデータでは少しアウトです。

なかなか楽しいおもちゃだ。

 
Maxim Dmitrievsky #:

CV法を用いて任意の 分類器を校正した後、そのモデルの可能性をすぐに見ることができる。もしそのモデルが何の能力も持っていなければ、この手順の後、確率は0.5の周りに固まる。それ以前は過信していたが。このようなモデルをさらにいじっても、まったく意味がない。改善することはできない。つまり、普通にキャリブレーションすることさえできない。便利なものだ。

あなたの言葉を借りれば、「量子カット」は一つもなく、利益が出る可能性のある範囲やビンは一つもない。

モデルスクリーニングを自動化できるのであれば、それはもう良いことです。

私は、0.05のステップで確率信頼度指数によってモデルを視覚化し、そこですべてを一度に見ることができます。主なものは、トレーニングサンプルや他のサンプルでの結果の変換です。そこでは確率が忍び寄り、それが私が非代表性について話している理由です。それが、私が「非代表性」について話している理由です。ですから私は、今回のケースではキャリブレーションは有効な手段ではないと見ています。あなたのモデルに強いサンプル間バイアスがないとすれば、それはむしろ驚くべきことです。

また、訓練不足のモデルは、狭い範囲の確率を出すことに注意してください。

普通に訓練されたモデルは、多くの場合、確信度の高いゾーンに正確に存在します。だからこそ、分類しきい値ではなく、ウィンドウを設定することが意味を持つのです。両端では、モデルは信頼できるが、しばしばオブザベーションがとても少ないので、統計的有意性は小さい．

MoDの諸君！

その価値はあるか？

さあ)))))あけましておめでとうございます)))

真実は変わらない)))

Valeriy Yastremskiy #:

うん、いいね))))あけましておめでとうございます))))

真実は変わらない)))))

このような年、一般的に私たちの周りの世界では幸せではなく、誰かがそれを喜んでいる。乾杯：新しい年にモナドがひっくり返りますように。そして、それを可能にする人々に。
