記事"統計的推定"についてのディスカッション

 

新しい記事 統計的推定 はパブリッシュされました:

シーケンスの統計的パラメータの推定はたいへん重要なものです。それはたいていの数学的モデルと手法が異なる前提に基づいているからです。たとえば、分布法則の正常化、分散値、その他パラメータです。よって時系列を分析し推定するとき、主要な統計的パラメータを素早く明確に推定できるシンプルで使い勝手のよいツールが必要です。本稿では、もっともシンプルなランダムシーケンスの統計パラメータとビジュアル分析のメソッドをいくつか取り上げ述べていきます。それにより MQL5 でこれらメソッド、またニュープロットアプリケーションを用いて計算した結果の視覚化メソッドを実装します。

作者: Victor

 
  1. 代替

Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
  • www.mql5.com
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
 

「外れ値の排除


統計パラメータの推定に進む前に,標本に重大な誤差(外れ値)が含まれていると,推定値の精度が不十分となる可能性があることに注意すべきである。外れ値が推定精度に与える影響は、サンプルサイズが小さい場合に特に強くなります。外れ値とは、分布の中心から異常に逸脱した値のことである。このような偏差は,統計の収集やシーケンスの生成中に発生したさまざまな種類の起こりそうもない出来事やエラーによって引き起こされる可能性がある.

ほとんどの場合、与えられた値が外れ値であるか、検討中のプロセスに属するものであるかを明確に判断することは不可能であるため、外れ値をフィルタリングするかどうかを決定することはかなり困難である。外れ値が検出され、それをフィルタリングすることが決定された場合、これらの誤った値をどうするかという疑問が生じる。最も論理的なことは、単純にそれらをサンプルから除外することであり、一般集団の統計的特性の推定精度は上がるかもしれないが、時間系列を扱う場合は、系列からサンプルを除外することに注意すべきである ことを忘れてはならない。"

まったくやらない方がいい。

すべてのデータは検証されるべきであり、検証は自動化されるべきである。

しかし、手動であれ自動であれ、元のデータを操作するよりは、データソースを破棄する方がよい。

現実の世界では、「確率が低い」という理由で大きなリスクを受け入れたり除外したりすることが、多くの悲劇や災害の原因となっている。

 

ビクター、こういう質問なんだ。

クルトシスは 1より小さくなると思いますか?

もしそうなら

gs=(1.55+0.8*MathLog10((double)n/10.0)*MathSqrt(kurt-1))*MathSqrt(sum2/(n-1));

- 1になる:-)

素晴らしい記事だ!

 
denkir:

ビクター、こういう質問なんだ。

クルトシスは 1より小さくなると思いますか?

もしそうなら

- 1になる。:-)

素晴らしい記事だ!


ほとんどの場合、理論的には尖度は 1より小さくなることはありません。おそらく、直線標本で構成されるシーケンスでは、1に等しい値が得られるだろう。例えば、1,2,3,4,5。

誤差を犠牲にしてでも、この記事で使われているアルゴリズムが尖度の を1より小さくできるかどうかはわからない。記事の最後に、係数計算アルゴリズムの挙動は調査されていないと述べられている。

 

実際、不偏推定値を計算するとき、尖度は1より小さい値を取ることができる。例えば、入力配列4,7,13,16の場合である。

ご指摘ありがとうございます。変更させていただきます。

 
訂正しました。