トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 364

СанСаныч Фоменко 2017.05.19 10:40 #3631

Vladimir Perervenko 2017.05.19 13:03 #3632

Алёша 2017.05.19 13:57 #3633

Алёша 2017.05.19 14:17 #3634

削除済み 2017.05.20 15:55 #3635

Aleksei Kuznetsov 2017.05.20 22:44 #3636

削除済み 2017.05.20 23:17 #3637

Uladzimir Izerski 2017.05.21 09:08 #3638

Дмитрий 2017.05.21 09:15 #3639

Aleksei Kuznetsov 2017.05.21 09:24 #3640
ここを見て ください。
予測因子の重要性を評価する場合、情報量基準だけでは決まらない複雑な量であることを忘れてはならない。 そして
私の考えでは、予測変数の重要度は、基本アルゴリズムに組み込まれた手段でも、独立した手段でも、問題解決にはならないのです。もし予測変数に土星の輪やコーヒーの粉が含まれていれば、アルゴリズムがこれらの予測変数を使用することになります。
私は、このスレッドや他のスレッドで、予測変数はターゲット変数に「関係」なければならないと何度も書いてきました。
もう一度、例を挙げます。
対象変数は男性/女性
予測因子：服装。
風俗が厳しい国では、予測変数がズボンとスカートからなる場合、重ならない2つのサブセットに分割され、それぞれがターゲット変数を一意に識別する、つまり、分類誤差はゼロになります。
ユニセックスやスコティッシュスタイルの服を予測変数に入れ始めると、重複が生じ、分類誤差が決定されます。このエラーは原理的に解消されることはありません。
これは私だけの考えではなく、このスレッドで同じような考えを持つ出版物を紹介しました。
真実は一つ、そこに至る道はいくらでもある。
誰にでも自分の道を歩む権利があります。要は、行き止まりになってはいけないということです。
グッドラック
しかし、私は、永遠に完璧に動作するわけではなく、時折与える自己最適化デバイスをうまく作ることは可能だと考えています。
しかし、標準的なインジケーターとジグザグの出力では明らかに無理でしょう :)私にはどこかの子供の遊びのようにさえ聞こえます、あくまで例としてですが。
私もそう願っていますが、3年前に抱いていた、数十個のパラメータを設定すれば、人気のあるライブラリの分類子ができる、という幻想からはほど遠い状態なのです。特に仕事終わりの夕方には、とてもノントリビアルで遅いことが判明しました((
ZZ はターゲティングが悪い、全く同感です。
予測因子の重要性を評価する際に、重要なことは...
...予測変数の重要度は，第1層での重みによって決定される。
この関数における重要度計算のアルゴリズム
Open Rをインストールし、すべてのパッケージをインストールしたが、VS 2017はRプロジェクトの作成時にまだハングアップしている
Pythonプロジェクトは問題なく動作します
R StudioとR 3.4を削除し、Open Rだけを残して、動作するようになった )どうやら、相反するようです。
そして、R Studioの意味がない、それは同じだ
トレーニングの前に、入力変数とターゲットの相関関係を構築することは意味があるのでしょうか？そして、最も相関のないものを削除して、計算を高速 化し、学習の度合いを高める？
確認すべきは、対象となる変数との相関ではなく（あるはず）、あるはずのない変数間の相関がないこと（多重共線性）である。
相関入力の除去はすでに行ったので、他にどう改善すればいいのか悩んでいるところです。
ですから、ターゲットとの相関があるべきだという意見には賛成です。ですから、ターゲットと最も相関のない入力、例えばKcorr<0.5や0.3の入力を追加で削除したいのです。これによって、品質に大きな影響を与えることなく、学習プロセスをスピードアップできるはずです。しかし、すべての入力を削除しなければならないという前提があります )))
使用した入力（技術指標からランダムに取り出したもの）については、今のところターゲットとの相関は見られず、学習誤差＝0.44、つまりほぼコインと同じです。まあ......バランスは悪くなってるんですけどね。