記事「時系列の非定常性の指標としての2標本コルモゴロフ–スミルノフ検定」についてのディスカッション

 

新しい記事「時系列の非定常性の指標としての2標本コルモゴロフ–スミルノフ検定」はパブリッシュされました:

この記事では、最も有名なノンパラメトリック同質性検定の1つである2標本のコルモゴロフ–スミルノフ検定について考察します。モデルデータと実際の相場の両方が分析されています。また、この記事では非定常性指標(iスミルノフ距離)の構築例も紹介しています。

本研究では、経験分布関数を用いて、金融時系列が狭義の意味で定常性を持つかどうかを検証します。確率論と数理統計学は、前者の特定のセクションとして定常性の仮定に基づいています。定常過程の分析には、回帰分析、自己相関分析、スペクトル分析、ニューラルネットワークの利用など、多くの方法があります。しかし、これらの方法を非定常データに適用すると、予測誤差が大きくなる可能性があります。

トレーダーにとって、定常性の問題は、様々な指標を計算するためのデータ量の選択と密接に関係しています。定常過程であれば、データ量が多いほど統計的特性を正確に計算できますが、非定常過程の場合は最適なデータ量を決定するのが難しくなります。データが多すぎると、現状に影響を与えない古い情報が含まれている可能性がありますし、少なすぎると代表性が不十分で、プロセスの統計的特性を十分に評価できません。

ランダム過程の最も包括的な特徴は、その分布法則(確率関数)です。したがって、時系列の分布関数の経時変化を追跡できる指標を構築することは重要な課題です。この指標は、標準的なテクニカル分析指標を算出するためのデータ量を再検討する必要性についてのシグナルを提供します。数理統計学では、確率変数の分布関数が時間とともに変化しているかどうかを検定する問題を「同質性仮説の検定」と呼びます。

作者: Evgeniy Chernish

 
Перейдем к анализу реальных данных. В качестве примера я взял минутные бары валютной пары EURUSD и золота XAUUSD.

何が比較されているのかまったく理解できなかった。どうやらソースを研究する必要があるようだ。

ZЫ ソースを見ました。D1で、1440の代わりに少ないバーを取って(PERIOD_M 1の代わりにPERIOD_M5)実行する必要があるようです(試していませんが)。そして、"ボール" - クローズの増分

 
Стоит сказать, что есть разница на каком таймфрейме рассчитывается расстояние Смирнова. Для минутных данных как мы видели, наблюдается существенная нестационарность ряда, в то же время для пятиминутного таймфрейма ряд более стационарен, гипотеза однородности отвергается гораздо реже. Отчасти это связано с объемом данных, 1440 для минутного таймфрейма против 287 для пятиминутного. С постепенным увеличением данных с 287 до 1440 показатель отклонение нулевой гипотезы растет, тем не менее гипотеза однородности чаще отвергается именно для минутного графика. 

日ではなく週を比較しても(1435M5刻み)、M5はM1より「静止」していることに変わりはないだろう。これはデータ量の問題ではなく、インクリメントの構造の性質の問題なのだ。

TFインクリメント、ZZインクリメントなど、インクリメントの構成にはさまざまな法則を取ることができます。

つまり、定常性検定の結果は、初期データの準備に依存する。なぜTF法なのかは謎です。1日の小さなタイムフレームはハエとカツのミンチである。ロールオーバーもあるし、流動性も低いし、ニュースもある。そしてその日の断片を比較する。例えば、02:00から08:00までのEURUSD


結局のところ、誰も24時間365日の取引や学習を強制しているわけではない。

 
fxsaber PERIOD_M1ではなく PERIOD_M5)ではなく、もっと少ない本数で実行したほうがよさそうです(試していませんが)。そして、"ボール" - クローズの増分

このインディケータを日足のタイムフレームで実行すると、対数 値幅PERIOD_M5の 時系列が分析されます。分足も使用できますが、このデータはあまりに非定常です。

毎日、時系列リターンの分布法則がどの程度変化するかを分析し、この目的のためにスミルノフ同質性基準を使用します。この統計量自体は、2つの標本分布関数の比較に基づいています。差の最大モジュラスが、これら2つの関数の差とみなされます。

 
Евгений Черныш #:

日足のタイムフレームでインジケータを実行し、対数価格増分PERIOD_M5 の時系列を分析する。分足も使用できるが、このデータは非定常性が高すぎる。

毎日、時系列リターンの分布法則がどの程度変化するかを分析し、この目的のためにスミルノフ同質性基準を使用します。この統計量自体は、2つの標本分布関数の比較に基づいています。差の最大モジュラスが、これら2つの関数の差とみなされます。

私は記事を上から下まで読んだ。このフレーズにたどり着いた。

実データの分析に移ろう。例として、通貨ペアEURUSDと金XAUUSDの分単位を取りました。

さらに説明のないチャート。まるで小段落を書くのを忘れたかのように。

 
fxsaber #:

日ではなく週を比較しても(1435M5刻み)、M5の方がM1より「定常的」であることに変わりはないだろう。データ量の問題ではなく、インクリメントの構造の性質の問題なのだ。

TFインクリメント、ZZインクリメントなど、インクリメントの構成にはさまざまな法則がある。

つまり、定常性検定の結果は、初期データの準備に依存する。なぜTF法なのかは謎です。1日の小さなタイムフレームはハエとカツのミンチである。ロールオーバーもあるし、流動性も低いし、ニュースもある。そしてその日の断片を比較する。例えば、02:00から08:00までのEURUSD。

少なくともスミルノフの基準はそれを示している。

分足または極端な場合には5分足が、適切なラグを得るために使用されます。例えば1440を5分間分析すれば、2週間に一度、スミルノフの基準に従った結果が得られる。タイムフレームを大きくするのではなく、逆にティックの下の階まで下げることが必要で、その方が状況の変化に素早く対応できるだろう。 残念ながら、私は分析用のティックのベースを持っていなかったので、分足で分析した。

しかし、日中のセッションを分けて比較するのは良いアイデアだ。例えば、アジア・セッションはゼロ刻みが多く、ボラティリティもかなり異なるため、除外する。

追伸:ZZ増分とは何ですか?

 
fxsaber #:

私は記事を上から下まで読んでいた。こんな文章にたどり着いた。

そして、説明のないグラフがある。まるで小段落を書くのを忘れたかのようだ。

グラフの下に簡単な説明がある。もし、具体的なことがよくわからない場合は、私に書いてくれれば、すべて説明するつもりである。

 
良い記事をありがとう。ウィンドウサイズは可変であるべきだという結論は興味深かった。
 
Maxim Dmitrievsky #:
良い記事をありがとう。ウィンドウサイズは可変であるべきだという結論は興味深かった。
ありがとう。もちろん、ここでアメリカを発見したわけではないんだけどね =)
 

日々のボラティリティの変動を考慮に入れる価値はあると思う。たとえば、1日のその時間帯の平均ボラティリティで増分値を正規化することができる。私の試算によると、この方法で正規化された増分はノイズとの差がかなり少ない。

行については、分解の検定についてよく言われる。このような検定はしばしば均質性の検定に基づいているが、原理的にはmatstatの独立した分野である。例えば、Pettittの検定は計量経済学で よく使われる。

一般的に、この論文は良い。

 
Евгений Черныш #:

追伸:ZZ刻みとは何ですか?

HighBid/LowAskでZigZagを構築し、頂点間のインクリメントを取る。