記事「Pythonでの見せかけの回帰」についてのディスカッション

 

新しい記事「Pythonでの見せかけの回帰」はパブリッシュされました:

見せかけの回帰は、2つの時系列がまったくの偶然で高い相関を示し、回帰分析で誤解を招く結果をもたらす場合に発生します。このような場合、変数が関連しているように見えても、その相関関係は偶然であり、モデルの信頼性は低くなります。

機械学習によるアルゴリズム取引の領域に飛び込む前に、モデルの入力と予測しようとする変数の間に意味のある関係が存在するかどうかを確認することが極めて重要です。本稿では、データセットにこのような関係が存在することを検証するために、モデル残差の単位根検定を用いることの有用性を説明します。

不幸なことに、真正な関係を持たないデータセットを使用してモデルを構築することは可能です。そして、残念なことに、このようなモデルでは誤差指標が驚くほど低く、誤った管理意識や過度に楽観的な見通しを助長する可能性があります。このような欠陥のあるモデルは、一般に 「見せかけの回帰」と呼ばれます。

この記事では、まず見せかけの回帰について直感的に理解することから始めます。その後、見せかけの回帰をシミュレートするために合成時系列データを生成し、その特徴的な効果を観測します。その後、Pythonで作成された機械学習モデルを検証するための洞察力を頼りに、見せかけの回帰を特定する方法を掘り下げていきます。最後に、モデルが検証されたなら、それをONNXにエクスポートし、MQL5で取引戦略を実装します。

作者: Gamuchirai Zororo Ndawana

 
非常に興味深い記事だった!しかし、残差(予測値との差)、定常性(変動幅と平均値が一定かどうか)などの基本的な用語が簡単に説明されていれば、深い統計的知識のないトレーダーにとって助かっただろう。
 
Carl Schreiber #:
非常に興味深い記事だった!しかし、残差(予測値との差)、定常性(変動幅と平均値が一定かどうか)などの基本的な用語が簡単に説明されていれば、深い統計的知識のないトレーダーにとって役に立ったでしょう。

カールの言うとおりだ。次回からは、効用を最大化するために、簡潔にまとめることを忘れないようにしよう。

 

翻訳の問題かもしれませんが、明確にしたいと思います。記事中の定常性は残差、つまり実際のバーの終値と予測値の間のデルタについて定義されているのでしょうか?私の読解力不足かもしれませんが、なぜ学習させた同じデータで結論を出すのでしょうか?

この記事では、時系列の相場が定常的であるかのように書かれているが、すべての情報源はそうではないと言っている。これは資料の認識の誤りだと思う。

また、モデルの正確性についての質問も取り上げられていないが、私が理解したところでは、まったく正確ではないとのことである。そうだとすれば、モデルの答えにこれほど強い誤差のばらつきがあるのに、さまざまなテストを適用できるのだろうか?

理想的には、ある手法または別の手法によって予測因子がどのように除外され、それが回帰モデルの 結果にどのような影響を与えたかを見ることが有用でしょう。

このトピックについて、実際に引用に適用できるような記事がもっと必要だと思う。

 
Aleksey Vyazmikin 回帰モデルの 結果にどのように影響したかを見ることが有用でしょう。

このトピックについて、実際に引用に適用できるような記事がもっと必要だと思う。

アレクセイ、あなたはすでに知っていると思いますが、どんな問題でも解決する方法はいろいろあります。私は、モデルの残差を見たことのないテストデータで測定することを好みます。しかし、当時読んでいた学術文献では、モデルが以前に見たことのあるトレーニングデータでも問題ないと示唆されていました。


また、私の書き方が市場相場の時系列が定常的であることを示唆した可能性があることを認識していませんでした。定常的でないことは周知の事実です。そのように言う意図はありませんでしたし、おそらくもっと良い言い回しができたでしょう。

偽のモデルでも高い精度の評価基準を獲得する可能性があるため、モデルの精度に関する質問は私の範疇を超えていました。

これは、私がコミュニティのために書いた最初の記事の1つです。それ以来、私は学んできたので、このシリーズを続けていくつもりだ。今回は、分かりやすい文章を心がけ、特に金融市場の取引でこれをどのように応用すれば有利になるかを示すつもりだ。