トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2589

 
mytarmailS# :
https://stats.stackexchange.com/questions/31513/new-revolutionary-way-of-data-mining

この質問には、非常に興味深い考えが示されています...。

ちなみに、回答者はまだ質問の本質を理解していません

モデルを選ぶ際には、OOSの利益ではなく、トレイの利益に対する比率で最適化することをお勧めします。あるいは、そのような比率が小さい機種は捨てて、残りの機種からOOSの最大限の利益を取る。これは、憶測を排して引用文を文字通りに解釈した場合の話です。

 
Aleksey Nikolayev#:

機種選定の際には、OOSの利益ではなく、トレイの利益に対する比率で最適化することが提案されている。あるいは、そのような比率が小さい機種は捨てて、残った機種の中からOOS時の利益を最大に取る。これは、憶測を排して引用文を文字通りに解釈した場合の話です。

アレクセイ、利益、最大限の利益、モデルの廃棄......といったことが書かれている部分を、少し見せてくれないか?

今のところ、~のように聞こえる。
文字、憶測の域を出ません。
 
Aleksey Nikolayev#:

機種選定の際には、OOSの利益ではなく、トレイの利益に対する比率で最適化することが提案されている。あるいは、そのような比率が小さい機種は捨てて、残った機種の中からOOS時の利益を最大限に取る。これは、憶測を排して引用文を文字通りに解釈した場合の話です。

上記のコインと10000人の例で言うと頭を1、尾を0とする。与えられたアルゴリズム通りに行動しても、何も得られない。このことは、説明された文脈ではよく理解できる。つまり、何らかのエッジがあれば、ISやOOSで利益率を取るかどうかはそれほど重要ではなく、エッジがなければ、このような方法は何も機能しない。


そのとおりです。まずはエッジの存在を見極める必要があります。そのうえで、どう選ぶかを考えなければなりません。例えば、次のような方法で、ある閾値よりも高い何らかの指標によるモデルのシェアをISに求めます。例えば、勝率は55%~45%以上の機種が多い。勝率で順位をつけ、TOPを取る。OOSでこのトップで結果を確認するのか?選択された機種のうち、55%以上の勝率をあげたのは、同じ45%(選択された機種のうち、OOSでそのようなエンゲージメントをあげた機種の割合)ですか?- このモデル群は、安心して捨てられると思います。このようなトップモデルの選別がうまくいっているということは、エッジが効いているということであり、この効果がどれだけ強いかで、パターンの良し悪しを評価することができるのです。十分な強度があると判断しています。それ以上の選択はすべてテクニックの問題です。たとえ同じ勝率、PFによってでも、複雑な指標や論理に煩わされることなく、勝率とPFによって直接ISに触れることができます。

 
mytarmailS#:
Alexeiさん、利益、最大利益、モデルを捨てる...と書いてある引用文の一部をいただけませんか?

今のところ猛烈な誹謗中傷にしか聞こえないから、〜のように宣言してるんだろ?
文字通り、憶測なしに

私は自由に翻訳しています)要は、最初は多くのモデルを学習させ、最終的には作業モデルを選択する(モデル評価)必要があるのです。同志は、誰もがOOSで最大の結果を出すだけのモデルを選ぶのが普通で、これは間違ったアプローチだと主張しています。2つ目の言葉には、どうあるべきかが書かれています。

サンプル外のモデルの平均がサンプル内のスコアに対してかなりの割合を占めていれば、うまくいっていることが分かります。これは、トラック上の利益に対するOOS上の利益の比率を最大化すると訳される。

一般的に、サンプル外の結果がサンプル内の50%以上であれば、本当にどこかに到達していると言えるでしょう。これは、OOSの利益とトレイの利益の比率が0.5未満の機種は捨てると言い換えることができる
削除済み  

そうですね、最適化のようなモデル選択の問題ですね。自分の主観的な基準で考えればいいのです。

パラメータが微妙に違う、つまりばらつきを許容するモデルがたくさんあっても、すべてOOSをパスするのは悪いことではない。しかし、もちろん万能ではありません。

 
アレクセイ ニコラエフ#:
アレクセイ、最適化面を復元するテクニックはあるのでしょうか?
パラメータを検索するためにアルゴリズムを実行し、何かを発見し、アルゴリズムからのデータで最適化面を復元する...。
ヒューリスティック・アルゴリズムの話であって、自然に完全な検索ができるわけではないのですが......。
ググってみたが、結果はダメだった。
 
mytarmailS#:
Alexeyさん、最適化面を復元するテクニックはありますか?
パラメータ探索アルゴリズムを実行し、何かを見つけ、探索アルゴリズムからのデータを使って最適化面を再構築する...。
ヒューリスティック・アルゴリズムの話であって、自然に完全な検索ができるわけではないのですが......。
ググってみたが、結果はダメだった。

欠落した入力のモデル品質メトリクスを補足する、従来は、ジャイパラメータの値のセット?ウェルブーストは教えるのが簡単なんです。それは何のために必要なのでしょうか?

 
Replikant_mih#:

ハイパーパラメータ値の欠落した入力、条件、セットに対するモデル品質メトリックを補足する?さて......簡単なトレーニングブースターです。それは何のために必要なのでしょうか?

単純な補間でできるかもしれないので、まずは既製品があるかどうかを確認したかったのですが......。
なぜ?モデルのOOを見れば、そのモデルが新しいデータで動くかどうか予測できるはずだ


 
mytarmailS#:
Alexeyさん、最適化面を再構築するテクニックはあるのでしょうか?
パラメータ探索アルゴリズムを実行し、何かを見つけ、探索アルゴリズムからのデータを使って最適化面を再構築する...。
ヒューリスティック・アルゴリズムの話であって、自然に完全な検索ができるわけではないのですが......。
ググってみたが、結果はダメだった。

モデルのパラメータ空間では?それは大きな次元の話です。予測変数の数が少ない、非常にシンプルなモデルでのみ可能です。

巨大な次元の空間にどのように表面を作るかは、あまり明確ではありません。この次元数に対して、私たちは単純に点数が少ないだけなのです。PCAなどの次元ダウンスケーリングによる可視化であれば別ですが、その点は不明です。

 
Maxim Dmitrievsky#:

そうですね、最適化のようなモデル選択の問題ですね。自分の主観的な基準で考えればいいのです。

パラメータが微妙に違う、つまりばらつきを許容するモデルがたくさんあっても、すべてOOSをパスするのは悪いことではない。しかし、これはもちろん万能ではありません。

先ほど、標準のメトリクスとカスタムのメトリクスを組み合わせるというお話がありましたが、私は、標準のメトリクスでモデルを学習し、カスタムのメトリクスでモデルを選択するというふうに理解しています。