ベルヌーイ、モアブ・ラプラスの定理、コルモゴロフ基準、ベルヌーイ方式、ベイズの公式、チェビシェフ不等式、ポアソン分布則、フィッシャー、ピアソン、スチューデント、スミルノフ等の定理、モデル、数式を使わない平易な言葉。 - ページ 6

 
sergeyas:

まずは、アレクセイのプレゼンから聞いてみよう。

Yusufさんや他の皆さんも、この件に関する知識を減らしたと受け取らないでください。

一貫性を保つどころか、用語を追加して先走るようになる。



トレーダーズディジーズです。ボタンが押せなくなるのが怖い。私自身もそうなんです。
 

ボリンジャーバンドのボリンジャー第9章にある正規分布の考え方

 
 

このスレッドは良い知識の貯蔵庫になることを約束します。

昔、実際に正規分布を求めようと思い、数値実験を行ったことがあります。独立したテストを500回、1万回と積み重ねました。500個のランダムな無結合グラフを得ることができる。同じ基準点から、時間の経過とともに、より正確にはテスト回数の増加とともに、どのように乖離していくのかを観察していきます。だから、それらの発散は正規分布の法則 に従うことになり、全体として正規分布のベルを形成することになる。

興味深いのは、平均的な乖離が試行回数の平方根に等しくなることである。したがって、1,000回の試行の後では、どの系列も平均して元のゼロの位置から32ポイント離れており、10,000回の試行の後では、わずか100ポイントしか離れていないと予想することができるのである。ベルの形状を見ればわかると思います。最初は横に十分大きく発散し、その後、発散の「速度」が低下し始める。

面白いことに、500の級数の和は、その中にいくつの試行があっても、ほぼゼロになるのである。これは写真によく表れている。1万回の試行で50%の系列がゼロを上回ったのに対し、50%の系列がゼロを下回った。したがって、すべてのシステムの平均状態や数学的期待値はゼロに近づくことになる。

そこで、目利きの方に質問 なのですが、実際の数学的な期待値と理論値であるゼロMOとの乖離をどのように計算するのでしょうか?結局のところ、もちろん、すべてのテストの合計が明確に0に等しくなることは期待できず、+3とか-20とかに等しいかもしれない。また、2つ目の疑問として、この誤差は試行回数が増えるとゼロになるのか、それとも試行回数の平方根に比例したレベルで「固まる」のでしょうか?

 
C-4:

実際の数学的期待値と理論値、ゼロMOとの乖離をどう計算するか?結局のところ、もちろん、すべてのテストの合計が明確に0になることは期待できず、+3や-20くらいになるかもしれません。また、2つ目の疑問として、この誤差は試行回数が増えるとゼロになるのか、それとも試行回数の平方根に比例したレベルで「固まる」のでしょうか?


sb は独立した確率変数の和である。増分は mo=0, sko=X の正規分布とする。すると、N個の増分の和もmo=0でNR、sko=SQRT(N)*Xとなり、図のようになります(そこでのNは10000です)。

M個の独立なSBSの和をとると、これもmo=0、sko=SQRT(M*N)*Xの正規分布になります。

そのため、試行回数が増えると、和はフリーズしたりゼロになったりせず、試行回数の根に比例して増加する。 しかし、算術平均(これも試行回数で割る)は、すでに考えたベルヌーイの定理により、試行回数が増えると0に収束することになる

 
分布の "テール "とは?明らかに分布から外れている異常値なのか?
 

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

OK、問題を解いてみましょう。10,000回ずつのテストの累積シリーズが10回与えられます。シリーズの最終結果は以下の通りです。

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
合計
40

Mの独立した兄弟の合計が+40となる。その結果を式に代入する。sqrt(40*10,000) * 100 = 63,245 です。何か不十分な結果であることが判明。私は「sum of M」の意味を取り違えていたようです。

それとも、すべての実験をひとつずつ並べて、最終結果のM.O.との乖離を分析せよということでしょうか。

 
C-4: 昔、実際に正規分布を求めようと思い、数値実験を行ったことがあります。独立したテストを500回、1万回と積み重ねました。ランダムな無関連グラフを500個得ることができる。同じ基準点から、時間の経過とともに、より正確にはテスト回数の増加とともに、どのように乖離していくのかを観察していきます。だから、その発散は正規分布の法則に従うことになり、全体として正規分布のベルを形成することになる。

正規分布の図解はよくない。例えば1万で処理を止めても、断面が正確に正規分布になるとは思えません。しかも、この分布はパラメータが常に変化している。

もし私が間違っているなら、「断面積」(つまりゼロからの発散)の分布が少なくとも漸近的に正規であると主張するリンクを教えてください。

SProgrammer:これを理解することが、定理の9割を理解する鍵になります。

フォーミュラでないと、肝臓への感触がつかめないのです。自分でもわかっているはずです。でも、ここでは数式は使えません。

yosuf:これは、物質収支の方程式の解と定理が一致し、現象の解析結果を解釈する上で相互に補完し合っていることを示していますね。

ガンマ関数が科学や工学のあらゆる分野で使われていることをご存知でしょうか?

ディプーラを解くときに、その姿に超自然的なものを感じないのです。そして、あなたがガンマ分布を持ち出したのは、Excelでこの関数が何と呼ばれているかを見たからに他なりません。お前とテリトリーの間にどんな関係があるんだ、ユースフ!

SProgrammerは 、terver/matstatには実際に使われている分布はほとんどない、と正しく言っています。だからあなたも、もしまだそんなに夢中になっているのなら(18)、Erlangについて、どこから得たのか考えてみることをお勧めします。ただ、上に引用したような簡潔な結論ではなく、より完成度の高い形で反省を述べるようにしてください。

Feller, vol.2を見てみましたが、ガンマ分布のことが書いてありますが、数式がひどいし、Erlangのことも2,3語しか書いてありません。だから、ここではダメなんです。

しかし、指数分布には面白いところがある(Feller, vol.2, p.69)。


特に、価格リターンの分布はラプラス分布でよく近似されるため、興味深い。
 
C-4:

OK、問題を解いてみましょう。10,000回ずつのテストの累積シリーズが10回与えられます。シリーズの最終結果は以下の通りです。

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
合計
40

Mの独立した兄弟の合計が+40となる。その結果を式に代入する。sqrt(40*10,000) * 100 = 63,245 です。何か不十分な結果であることが判明。私は「sum of M」の意味を取り違えていたようです。

それとも、すべての実験を一つずつ連鎖的に並べ、最終結果のM.O.との乖離を分析する必要があるということでしょうか。


バジル、冒頭からいきましょう。ランダムウォークをコイン型の増分値の累積和としてモデル化したことがありますか?この確率変数自体は正規分布ではなく、2つの値を持つ離散分布です。MO=0、RMS=SQRT(0.5*0.5)=0.5となります。

そうすると、すでにランダムウォークはこれらの増分の総和として考えることができる。仮に、あなたのように10000刻みで撮影するとします。何に相当するのでしょうか?明らかにランダム変数(2つ目)である。増分が独立であれば、この分布はMO=0、RMS=SQRT(10000)*0.5=50で試行回数が増えるに従って正規分布に収束します。これと、例えば3倍シグマルールから、このSVの実測値の99%以上は、区間-150...+150に収まることが推論される。つまり、この区間の外側では、10000*0.01=100のCB実現よりも少ない。

そうすると、すでにこれらのCBの合計を考えていることになります。このCBを10回実現したときの合計がコラムに書かれていますね。新しい(すでに3回目の)SAとなり、これもMO=0、RMS=50*SQRT(10)=158で正規分布しています。トータル+40で持っているのは、この第3のSVの1つの実現に過ぎないのです。しかし、それはかなり幅が広い。この場合も、99%のデータは-474...+474の範囲にあることになります。

 
理論派のクジラは、私の小さな疑問を忘れている(