トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 185

 
ユーリー・レシェトフ
くだらないことを言うな。jPredictionでは、ノイズの多い予測因子や重要でない予測因子で学習されたモデルが出力されないように、入力次元削減のアルゴリズムを使用しています。つまり、予測変数の組み合わせが異なる様々なモデルの中から、一般化可能性が最も高いものだけが残るように選択される。

仮定の話ですが...。

100の潜在的な予測変数があるが、簡単のために指標とする。

例えば,RCIが90を超え,ストキャスティクスがゼロ以下になったとき(天井から見て自然な状態)です。このような状況は、90%の確率で価格が下落 し、他のすべての予測は 完全なノイズであり、RSIやストキャスティクス予測における他のすべての状況も 完全なノイズであり、何百何千という様々な状況が存在します。...

つまり、99.9%のノイズに対して、約0.01%の有用な信号があるのです

仮に、奇跡的に、あなたのMOが98の予測因子すべてを拒絶し、2つだけ-RSIとストキャスティック-を残したとします。

RSI>0、RSI>13、RSI<85、RSI=0、RSI<145、............といった状況が何百とあるのです。すべての値動きを認識するようにMOを訓練するので、MOはRSIやストキャスティクスで利用可能なすべての可能な 状況を考慮してモデルを構築し、それらの状況においてそれらが機能する確率はほぼゼロですが、 MOはそれらを考慮 に入れていくつかのモデルを構築 しなければ ならず、これは本当のノイズであるにも かかわらず、その一つの機能状況は他の何百ものソリューションの間で失われる、それが再トレーニングです・・・・・。

最終的にどのようにして手に入れたのですか?

 

ごっちゃになってますね。

異なる独立した問題があります。しかし、それらは家を建てるためのレンガのようなもので、それらがすべて揃って初めてトレーディングシステムとなるのです。

1.予測因子の準備 このステージには、かなり多くの目的とそれに対応するツールがあります。私は、この段階の問題全体を、意図的にノイズの除去、つまり、この特定のターゲット変数に対して予測能力を持つ予測因子を探すことに振り向けました。理想を述べよう。遺伝子の記事から引用。しかし、私自身の例で言えば

ターゲット変数「イスラム教徒」を例にとります(わかりやすくするため)。予測変数 "服 "は、"ズボン "と "スカート "の2つの値を持っています。予測値 "衣服 "のうち、"ズボン "という値を持つ部分は "男性 "というクラスを一義的に予測し、他の部分は女性を予測する。また、ターゲット変数「買い/売り」に対するRSIなどの予測変数も用意されています。指標はよく嘘をつくものですが、あるクラスを予測する部分と、別のクラスを予測する部分があることは周知のとおりです。したがって、あるクラスを予測する予測因子と、別のクラスを予測する予測因子を探さなければなりません。そして、重なり(偽陽性)が少ないほど、予測器の品質が高いということになる。理想は、予測変数が交差することなく2つの部分に分けられる「パンツ/スカート」である。でも、これはイスラム教徒にしか通用しないし、ヨーロッパ人にも...。

アルゴリズム的な手法(PCAなど、古典的なものではなく、洗練されたもの)もありますが、予測因子の内容から始めなければなりません。内容物を考慮し、最初は土星の輪っかやコーヒーのカスなどを捨てるべき......。重要なのは、これらの予測因子の相関関係ではありません。例えば、コティールからいくつかのデリバティブを取り出します。それらはすべてコティールからですが、建玉、出来高...を取り出します。それから、なぜか他の通貨ペア、マクロ経済が条件になっていない...。

2.モデルフィッティング。 これは別の問題であり、最初の問題は使用したモデルでは解決できません。多くのモデル・アルゴリズムに予測器選択 アルゴリズムが組み込まれているため、混乱が生じます。私自身は、最初の問題を解決するビルトインアルゴリズムを知りません。

レシェトフは、そのようなビルトインアルゴリズムを持っていると主張している。しかし、彼は自分のアルゴリズムを使って再教育が行われないことの根拠を示したことはない。

最初のステップは必須です。しかし、それは排除するものではなく、もしかしたら内蔵の予測器選択アルゴリズムを使うことも提案するかもしれません。しかし、これらのアルゴリズムは、最初のステップで「コーヒーの粉」を免れる必要があります。

3. バイナリ・オルタナティヴ分類器レ シェトフ氏は、いつものように、3値分類器の理解で問題を混乱させてしまったのだ。三項とは、対象変数が3つの値を持つ場合であり、一般的には任意の数の質的(名目、カテゴリー)値を持つとされる。レシェトフは、2つのバイナリーから作業シグナルを得ますが、これはFXでは非常に望ましいことです - 3元的な買い/売り/フレットのシグナルを持つことです。私は分類にバイナリターゲット変数を使用し、2つのバイナリ分類の結果から取引するために、私は3つのシグナルを取得します - まさにレシェトフのように。

4.複数のモデルの結果を組み合わせて売買のシグナルと することは、別の問題である。レシェトフが提案した解決策がある。しかし、他の解決策はこのスレッドの上で提案されました。Dikは、クラスの元となる値を考慮するよう、上で提案しました。特に、分類アルゴリズムが、そのクラスが派生したevery classの値を与えることを覚えていれば、この問題にも巻き込まれる可能性があります。複数のモデルの結果をひとまとめにする場合、これらの確率を考慮することは必然である。この確率を半分ではなく、それ以外に分割して分類誤差を減らすアルゴリズムもある。

5.最終モデル評価。こ の点については、ブルナコフと折り合いがつかなかった。この「アウト」とは、トレーニング、テスト、クロスバリデーションが行われた時間間隔から外れていることを意味します。このステップは、何をすべきかを教えてくれないので、建設的ではありません。このステップは、残すか捨てるかの評決です。捨てる」理由は、あまりの誤差ではなく、それまでのステップと比較しての「CHANGE」です。モデルがオーバートレーニングであり、絶望的で危険であるため、破棄する。このステップを乗り越えたら、テスターに移り、同じように「残す-捨てる」の結果を得ます。

 
mytarmailS:

仮定の話ですが...。

...

そして、MOはあらゆる 状況を想定してモデルを構築していきます。

すべての値動きを認識できるように訓練すると、MOは ...

...

しかし、 MOはそれらを考慮 し、それに基づいてモデルを構築しなければなりません。これが本当のノイズ であり、ある作業状況が他の何百もの解決策の中に紛れ込んでしまうという事実にもかかわらず、それがオーバートレーニングというわけです......。

jPredictionは、起こりうるすべての状況を考慮する必要はない のです。あなたが作ったものよりもずっとシンプルに機能します。

予測変数の逐次選択の原理(あなたが作り上げようとしているような組み合わせの完全な列挙ではない)は、pgの私の投稿に あります。109

記憶喪失の方は、既にp上の 予測変数の選択順序を明確にしたことを思い出してください。110

 

サンサニッチ・フォメンコ

レシェトフは、いつものように、問題を 3元分類の理解と混同して いるのだ。

...

私はバイナリーのターゲット変数を使って分類し、2つのバイナリー分類の結果からトレードするために、3つのシグナルを得るのですが、まさにレシェトフのよう です。


レシェトフは悪党じゃないのか?

彼は問題を混乱させ、今やフォメンコでさえレシェトフと全く同じことをしなければならなくなった。

シュリク・シュリコビッチ、棚からパイを取る。結局のところ、あなたは正直に批判大根と悪い男 - Reshetovの分野でそれを獲得しています。

 
ユーリー・レシェトフ

jPredictionは、すべての可能な状況を考慮する必要はありません。あなたが作ったものよりもずっとシンプルに機能します。

予測変数の一貫した選択の原則(あなたが作り上げようとしているような組み合わせの完全な列挙ではない)は、pg.の私の投稿に あります。109

記憶喪失の方は、既にp上の 予測変数の選択順序を明確にしたことを思い出してください。110

IO(any)はなぜ機能をちゃんと選択できないのかって話なのに、緑の話かよ...。

 
mytarmailS:

私は、なぜMO(any)がきちんと機能をサンプリングできないのか、という話をしているのに、あなたは緑の話をしている...。

jPredictionは予測変数のカリングに優れています。おそらく最も理想的な方法ではないでしょうが、応用的な作業には問題ないでしょう。まだ完成の域に達しておらず、さらなる研究の可能性があるのでは?一番大事なのは、ポジティブな結果が出て、そこからダンスを始められることです。

要は、機械学習の手法に 自分のバイアスを投影しないことです(MOの分野だけでなく)。

自分には効かないものが、他の人には同じように効くということは、正常な方法がないということではありません。これは、何らかの個人的な偏見によって、こうした通常の方法を使わないか、間違った方法で使っているに過ぎない。

 
ユーリー・レシェトフ

このレシェトフは悪党ではないのか?

彼は問題を混乱させ、今やフォメンコでさえレシェトフと全く同じことをしなければならなくなったのだ。

シュリク・シュリコビッチ、棚からパイを取る。大根役者で悪人であるレシェトフを批判する分野では、正直言って自業自得だ。

落ち着いてください。

私たちは同じ血が流れているので、あなたを個人的に侮辱しようと思ったことは一度もありません。

しかし、あなたの「迷っている」姿は、私にとって紛れもない関心事なのです。

ここからが本題です。バイナリーの例で言うと

1クラスの確率が0.49、2クラスの確率が0.51だとすると、2クラスなのか「塀の上」なのか?

 
ユーリー・レシェトフ

最も原始的な実装ではあるが、最も間抜けで最も将来性のない3元自転車:これは3つの出力を持つANNである。このような出力にそれぞれ分類用の閾値があるとすると、3つではなく8つの可能な状態があり、そのうち曖昧さのないもの(3つの出力のうち1つだけが閾値を上回る値)は3つだけで、解釈が不明なもの(2つ以上の出力が閾値を上回る値、または3つすべての出力が閾値を下回る値)は5つである。

すべてを分類するのはもっと簡単で、最も高い値を持つ出力を取るのが一般的です。3つの出力の結果が(0.1;0.3;0.2)の場合、最大値=0.4で出力番号2がアクティブとなります。
取引モデルはこのようなロジックを持つことができます。
最初の出口で最も高い値→ロングポジション。
2番目のexitで最も高い値→すべてのトレードを終了し、トレードしない。
3回目の出口で最高値→ショートポジション。
それだけで、閾値や状態などはありません。

これは全く自転車ではなく、ニューロニックで2クラス以上必要な場合の分類によく使われる手法で、例えば画像を分類する場合、少なくとも数十クラスはあり得ます。
2つのクラスには、真ん中に閾値がある1つの出力で十分です。
 

Dr.トレーダー

取引モデルはこのようなロジックになる可能性があります。


  • 最初の出口で最も高い値→ロングポジション。
  • 2回目の出口で最高値→全取引を終了し、取引しない。
  • 3回目の出口で一番高い値→ショートポジション。


それだけで、閾値や状態などはありません。

また、オプションとしてこのような些細なアプローチで正常な一般化性が得られるかどうかは定かではありませんが。シンプルであることは、時に盗みよりも悪いことです。つまり、経験的に確認することが必要なのです。
 
サンサニッチ・フォメンコ

1クラスの確率が0.49、2クラスの確率が0.51だとすると、それは2クラスなのか「塀の上」なのか?

だって、アイスクリームだもの。

申し訳ないが、質問がそうであるように、答えもそうである。

I.e.判断するためには、分類器の出力値を何か、例えば閾値と比較する必要があるので、ユーモアが理解できませんね。また、あなたの問題の定式化では、何らかの理由で比較可能な値が不明であり、分類に必要のない値だけが知られているので、それを明確にするのがよいでしょう。

理由: