記事"非加法的統計分布構造解析への固有座標法の応用"についてのディスカッション - ページ 2

 
alsu:

私が言いたいのはこういうことだ。あるモデルがあり、それに基づいて理論的な関数が得られたとする。そして、我々の無知が原因で、非常に些細な、しかし系統的な要因を考慮し損ねたとしよう。この場合、固有座標法はその並はずれた感度のために、「実際のデータはモデルに対応していない」と平手打ちを食らうだろう。しかしそうではない!- モデルは正しいが、1つの要因しか考慮していないわけではないし、実際的な観点からは、この欠陥はまったく取るに足らないものであることがわかるかもしれない(同じヒルホルスト・シェルの例のように、目視でもその違いに気づくのは難しい)。だから、私は「基本的な観点からだけ」を「むしろ基本的な観点からだけ」と読み替えたい。つまり、対応の最大限の正確さという価値は、(実際的な問題を解決するための)応用的な観点からはそれほど本質的ではないかもしれないが、(起こっているすべてのプロセスを徹底的に理解するという)基本的な観点からは本質的なのかもしれない、という意味である。

応用的な観点からは、モデルの限界があらかじめわかっていれば、最大適合精度の価値はそれほど本質的なものではない。例えば、実験データがあり、ある領域でそれをうまく説明する理論がある(どんなモデルにも限界がある)。例えば、私たちのモデルは高温/低温では機能しない。一方、私たちは通常、モデルの特性に関する情報を持っています。例えば、モデルがいくつかの仮定に基づいて導出されている場合、これらの温度ではモデルで説明されていない他の効果が現れます。モデルには適用可能な領域がある。

原理主義が常に強いのは、その適用範囲が広いからである。適用範囲が広いためには、特別な性質が必要なのだ。

また、この方法は、モデルが実験データに適合していないという評決を与えるだけで、その不一致の理由については何も語らない(私の例のように、モデルが「一般的に」正しいが小さな欠陥があるのか、それとも完全に修正すべきなのか判断できない)。

このような場合のために、よりクールなマジックがあります。

統計力学の構造的欠陥は、指示分布の助けを借りてもほとんど修正できないように私には思える。

 

Quantum:

指示分布によって統計力学の欠点を修正することは不可能だと思われる。

そして、あなたの計算にmu=0, nu=1, a=gammaを代入してみてください(論文の2.3-2.4項)。以下は論文からの抜粋である。


この場合、計算はほとんど些細なことである。3つの座標を代入した後は2つしか残らないが、X1とX2が線形に依存していること、つまり、実際にはもう1つの座標を削除しなければならないことに気づくだろう。次に、実際のデータ、例えばEURUSDを 代入してみよう。その結果(チャートの線形性という点で)に驚くことだろう。最も興味深いのは、私が記憶している限りでは、「高温」の領域(モジュールの戻りが大きい領域という意味で)だけ直線性からの乖離があり、期待される方向にはまったくないことです。実際、すべてを注意深くプロットすると、分布の「太いテール」が最後のほうで急激に細くなっていることがわかります(十分なポイントがないので推定は困難ですが、exp(-x^3)またはexp(-x^4)のようなものです)。これは、a)すべての領域で機能する単一のモデルを構築することが可能かどうか(「飽和モード」での非線形効果が支配的な役割を果たすので、おそらく不可能)、b)そのようなテールは、ヤギのアコーディオンのように、q-ガウシアンに対応します。

2.4項のスクリプトに偏差モジュールの実際の分布を含むcsvファイルを送り、何が起こるか見てください。この問題は非常に過決定的なので(C3係数の1つは非常にゼロに近く、他の2つのC1とC2は非常に線形に依存している)、結果を予測することさえできない(MNCはオーバーフローするかもしれない)。もしあなたが怠け者なら、夕方まで待ってください。写真を見れば、誰が正しいか、次に何を話すべきかがはっきりするだろう)。

ところで、私は指数関数が万能だと主張しているわけではありません。それどころか、非拡大的な観点からあなたを支持し、[0;+inf]上でどの分布がQ-エントロピーを最大にするかを計算することを提案します(あなたは変分積分を知っていますか? 私はよく知りませんが、原理的にはできますし、それほど複雑ではありません)。理論的な考察(情報については上に書きました)もありますが、正式なものではありません。

 
ああ、そうなんだ。さっさとネットで調べればよかった。q-exponentialはすでに親切な人たちによって計算されて いることがわかった。引用符の調整は誰がやるんだ?
 

特に喜ばしいのは

q指数分布は、個人間の富(資産)の分布を表すのに使われてきた。
 
alsu:

そして、ジョイントはない。あなたの計算(論文の段落2.3-2.4)でmu=0, nu=1, a=γに置き換えてみてほしい。以下は論文からの抜粋である。


この場合、計算はほとんど簡単である。3つの座標を代入した後に残るのは2つだけであるが、X1とX2が線形に依存していること、つまり実際にはもう1つの座標を削除しなければならないことに気づくだろう。次に、実際のデータ、例えばEURUSDを代入してみよう。その結果(チャートの線形性という点で)に驚くことだろう。最も興味深いのは、私が記憶している限りでは、「高温」の領域(モジュールの戻りが大きい領域という意味で)だけ直線性からの乖離があり、期待される方向にはまったくないことです。実際、すべてを注意深くプロットすると、分布の「太いテール」が最後のほうで急激に細くなっていることがわかります(十分なポイントがないので推定は困難ですが、exp(-x^3)またはexp(-x^4)のようなものです)。これは、a)すべての領域で機能する単一のモデルを構築することが可能かどうか(「飽和モード」での非線形効果が支配的な役割を果たすので、おそらく不可能)、b)そのようなテールは、ヤギのアコーディオンのように、q-ガウシアンに対応します。

2.4項のスクリプトに偏差モジュールの実際の分布を含むcsvファイルを送り、何が起こるか見てください。この問題は非常に過決定的なので(C3係数の1つは非常にゼロに近く、他の2つのC1とC2は非常に線形に依存している)、結果を予測することさえできない(MNCはオーバーフローするかもしれない)。もしあなたが怠け者なら、夕方まで待ってください。写真を見れば、誰が正しいか、次に何を話すべきかがはっきりするだろう)。

ところで、私は指数関数が万能だと主張しているわけではありません。それどころか、非拡大的な観点からあなたを支持し、[0;+inf]上でどの分布がQ-エントロピーを最大にするかを計算することを提案します(あなたは変分積分を知っていますか? 私はよく知りませんが、原理的にはできますし、それほど複雑ではありません)。理論的な考察(情報については上に書きました)がありますが、正式なものではありません。

モジュールを使うのはとてもいいアイデアだ。

P1(x)はP2(x)よりも弱く、後者はdif.方程式によればよりリッチなダイナミクスを持っています。

P(U)はほぼガウス型であるが,erf-1(x)を 通る引数の非線形変換が厄介である.

P(U)を微分積分するとき、erf(a*erf-1(x))のような形で引数を変換する構成がある。- これが何であるかはよくわからない。

つまり,微分方程式の一般的な形と方程式を比較することで,既知の厳密解(Scherにはスライド25の 2番目の例がある)を回復することである.

plot InverseErf - Wolfram|Alpha
  • www.wolframalpha.com
x
 
alsu:
そして、q-exponentialはすでに親切な人々によって計算されている ことがわかった。

さらに親切な人々は、「特定の選択肢」h(x)=tanh(x)とlamda=1の後にg->qが得られる大域的分岐点(式32)があることを示して くれた。

gaussian "オプションで他の "specific choice "オプションがあるかどうか。新しいクオリティの誕生は、「特別な役割を果たさない」という理由ではありえない。

UPD:「特別な役割を果たさない」というのは、いくつかの特殊なケースを根拠にした誤った発言である可能性がある。

 
Quantum:

アプリケーションの観点からは、事前にモデルの限界がわかっていれば、フィットの精度を最大化することの価値はそれほど大きくない。

油でお粥を汚してはいけない」という原則は、実用的なモデリングにおいては非常に疑わしい。

経済時系列だけに 集中すれば、他の問題を解決する必要性とともに、モデルの「冗長性/不十分性」という二面性の問題を常に解決しなければならない。この場合、モデルが同じであれば、より単純なものが選択される。統計学におけるこの問題を解決するために、この問題を何とか解決しようとする一連の検定がある。

モデル化のメカニズム全体がバランスしていなければならない。確かに、あるところでブレークスルーがあるのは面白いことだが、モデルの他の要素をそのブレークスルーのレベルまで引き上げることが現実的に面白いことなのだ。

現時点では、モデリングで説明できないねじれ(ブレークポイント)が日常的に存在することはまだ問題である。この問題が解決されない限り、モデルの改良は意味をなさない。

 

そうですね、まずは実験データを見た方がいいかもしれません。

qガウス(関数P2(x))を使ってSP500の分布を説明する典型的な例(記事の図4)を考えてみよう。

SP500の終値の日次データは、リンクhttp://wikiposit.org/w?filter=Finance/Futures/Indices/S__and__P%20500/。


SP500終値

SP500対数リターン

SP500対数リターン分布


SP500-data.csvファイルを確認する場合は、それを「Files」フォルダにコピーし、CalcDistr_SP500.mq5(分布計算)、q-gaussian-SP500.mq5(固有座標 解析)を実行してください。

計算結果

2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    2: theta=1.770125768485269
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    1: theta=1.864132228192338
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    2: a=2798.166930885822
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    1: a=8676.207867097581
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    2: x0=0.04567518783335043
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    1: x0=0.0512505923716428
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    C1=-364.7131366394939
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    C2=37.38352859698793
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    C3=-630.3207508306047
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    C4=28.79001868944634
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    1  0.00177913 0.03169294 0.00089521 0.02099064 0.57597695
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    2  0.03169294 0.59791579 0.01177430 0.28437712 11.55900584
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    3  0.00089521 0.01177430 0.00193200 0.04269286 0.12501732
2012.06.29 20:01:19    q-gaussian-SP500 (EURUSD,D1)    4  0.02099064 0.28437712 0.04269286 0.94465120 3.26179090
2012.06.29 20:01:09    CalcDistr_SP500 (EURUSD,D1)    checking distibution cnt=2632.0 n=2632
2012.06.29 20:01:09    CalcDistr_SP500 (EURUSD,D1)    Min=-0.1229089015984444 Max=0.1690557338964631 range=0.2919646354949075 size=2632
2012.06.29 20:01:09    CalcDistr_SP500 (EURUSD,D1)    Total data=2633

固有座標法によるパラメータqの推定値(q=1+1/θ): q~1.55

例(論文の図4)では、q~1.4。

SP 500固有座標 X1 Y1

SP 500固有座標 X2 Y2

SP 500固有座標 X3 Y3

SP 500固有座標 X4 Y4

結論:一般的に、これらのデータはq-gaussianにかなりよく投影され、データはそのまま取られたが、SP500-indexツール+日足チャートなので、平均化はまだ存在する。

X1とX2は本質的に敏感で、X3とX4ではテールがわずかに歪んでいるが、q-gaussianが適切な関数ではないというほどではない。

X1とX2をJX1とJX2に置き換えることで改善できます。X3とX4のテールは、2次依存性を一般化することによって固有座標の集合を拡張することによって修正することができます。(1+a(x-x0)^3)^θとその拡張(+新しいパラメータ)の3乗ケースを見ることができる。

測定器、時間間隔、時間枠依存性の研究が必要。

Quandl - Find, Use and Share Numerical Data
  • wikiposit.org
Browse pages curated by Quandl .
ファイル:
 
faa1947:

今のところ、コティールにはブレークポイントの問題が残っており、モデリングに考慮することができない。この問題が解決されない限り、モデルの改良は意味をなさない。

ブレークポイントについて(私の理解が正しければ)。

AA、M5(2011.12.01 21:15:00 -2012.06.29 18:10:00)の対数リターンの分布を考えてみよう。

計算は、スクリプトCalcDistr.mq5を使用し、シンボル#AA, M5について10000個のデータを使用しました。

#AA

この場合(スケールM5)の対数リターンの分布は複雑な構造を持っています:

#AA分布

対数リターンの分布~ある方向への動きの確率を考えるならば、ここには明らかに分布の和があります - 小さなスケールでの分布構造は非定常性を示します。

現在のダイナミクスは局所的な分布によって決定され、ブレークポイントでは再配列される:

すなわち、分布は本質的に非対称であり(|x|は通過しない)、2つの部分/分布(正と負)から構成され、局所力学はビーカー内の最大の体積によって決定される。

ファイル:
CalcDistr.mq5  4 kb
 

興味深い資料、ありがとう。ここで数学的な礼儀を乱したくはないのだが、それでも2つの素朴な疑問を抱かずにはいられない:

1.1.これらの分布の実用的な価値の問題。その結果、私たちは何を得るべきなのだろうか?それ自体のための説明は結構だが、(もちろん申し訳ないが)それは植物学の匂いがする。

2.市場において異なる「レベル」で発生する、全く性質の異なるプロセスを単一の分布で記述しようとすることは妥当なのだろうか。ねじれ」の問題はすでに述べたとおりだが、これは存在する問題の一部にすぎない。しかも、歴史的な時間間隔が異なれば、プロセスの構成そのものが大きく変化するのであり、それを一つの分布でどのように表現したいのか、私には理解できない。