faa1947: См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
私は「クラス」や「インターバル」という概念を使っています。
faa1947, あなたの図では、分布が単峰分布になっていませんね。これも問題ですね。
それから、クラス(ラック)の数も何らかの公式や規則で計算されます。有名なのは
スタージェスの公式、フリードマン-ディアコニスの法則、スコットの法則、平方根の選択などである。
denkir :
できると思うよ。外れはサンプルの統計的パラメータ(特に分布パラメータ)に何ら影響を与えないはずだ。だから外れ値なんだ。
サンプルサイズが十分大きいので、外れ値の影響を受けないという根拠です。これは、私が大きなサンプルサイズを好む理由の一つである。それから、同僚のfaa1947は、私の記憶が間違っていなければ、外れ値は外れ値とは違うと言った。例えば、eurusdの レートが1.20ドルから1.50ドルの範囲内で変動しているサンプルで、15.77ドルという 値を返すサーバーエラーがあった場合、そのような外れ値がサンプルのすべての統計パラメータを台無しにする ことは明らかです。
-アレクセイ
真の分布は系列の特性を特徴づけるものですが、非定常分布は定義上、それらが変化するものです。
でも教えてください,真の分布と定常性の間にどんな関係があるのですか?正直言って、私はそのような関係に出会ったことがありません。もしそれが秘密でないなら、あなたはそれをどこから手に入れたのですか?;-)
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
つまり、こういうことだ。サンプル・サイズを小さくすることで、ボラティリティのクラスタリングのような現象を見逃す可能性がある。それでは、非線形モデルを使う意味がない。だから線形モデルを使えばいい。そして、これは金融系列の性質、そのデリバティブ(行列分析におけるデリバティブと混同しないように)を反映していない。
二峰性分布が得られたデータは何ですか?データのファイルをアップロードしていただけますか?
つまり、こういうことだ。サンプル・サイズを小さくすることで、ボラティリティのクラスタリングのような現象を見逃す可能性がある。それでは、非線形モデルを使う意味がない。だから線形モデルを使えばいい。そして、これは金融系列の性質、その微分(行列分析における微分と混同してはならない)を反映していない。
システム・アプローチを公言するのであれば、ゴールであるエントリー/イグジットからポーズまで踊るべきである。乾燥残渣の商はどうなるのか?限られたサンプルを取るのであれば、揮発性や非定常性は全く必要ないのではないだろうか?モデルを選択する必要があります。ARMA(ARIMAでもない)が広く使われています。特定のモデルを適用することが目的ではありません。目標は、妥当なレベルの信頼限界のある予測を得ることです。例えば、100本、500本、1000本のローソク足の予測を計算するだけでも面白い。何か見えてくるかもしれない。
また、二峰性分布を得た根拠となるデータは何ですか?データのファイルをアップロードして いただけますか?
1999/01/04から2011/01/13までのEURUSD D1、ターミナルから取得した3063本のローソク足。
サンプル数が十分大きいので、外れ値には反応しないという根拠に基づいている。これが、私が大きなサンプルサイズを支持する理由の一つである。それから、私の同僚であるfaa1947氏は、私の記憶違いでなければ、異常値は異常値とは違うと言った。例えば、eurusdの レートがサンプルの中で1.20ドルから1.50ドルの範囲で変動し、その後サーバーのエラーで15.77ドルという 値が返されたとしたら、そのような異常値はサンプルの統計パラメータをすべて台無しにする ことは明らかです。
しかし、真の分布と定常性の間にどのような関係があるのでしょうか?正直言って、私はそのような関係を見たことがありません。もしそれが秘密でないなら、あなたはそれをどこから手に入れたのですか?;-)
最後のページで教科書からの引用でお答えしました。わかりにくければ、もう少し詳しく説明しよう:
一般母集団という概念は、ある意味で確率変数(確率分布法則、確率空間)の概念に似ている。
ある条件のセットは定常過程を生成する。もしそれが未定義であれば、一般集団は存在せず、それぞれ真の分布も存在しない。理屈はだいたいこんな感じだ。もちろん、私が間違っている可能性もありますが。
あなたの答えによれば、答えは間違っている。ところで、あなたが上記のような発言をした根拠となるマトリックスへの参照を期待していたのですが。もしそれをお持ちでないのであれば(つまり、外れ値がなぜ取り除かれ、分布にどのような影響を与えるのかをご存知でないのであれば)、先ほどの私と同じように、資料を学ぶことをお勧めします。大きな外れ値についてはすべてが明確であり、そのチェックが必要である(そのようなチェックは引用のずれを検出することができる)という指摘は正しいのですが、問題はそれについてではなく、3-4-5シグマについてなのです。また、外れ値を除去すべきかどうかという問題に触れずとも、外れ値を除去する方法論は(全ては書かれていないが、少なくとも上記の本によれば)非常に大きく長い作業であり、かなり複雑であることも興味深い。
ある条件のセットが定常過程を生成する。それが不確実であれば、一般集団は存在せず、したがって真の分布も存在しない。ロジックはだいたいこんな感じだ。もちろん、間違っているかもしれないが。
ウィキペディアによると、一般母集団とは、研究者が分析のために選択した値の集合である。研究者は、「定常性」のような疑わしいものも含め、どのようなルールによっても一般母集団にサンプルを入れることができる。例えば、「ユーロをルーブルで買うすべての取引」のように、統計の概念から外れたルールが選択されるのは普通のことである。この取引は、私たちがおおよそしか知らない何らかの経済プロセスによって発生したものであり、私たちは取引の数を知らない。これら2つの状況から、非定常性が為替相場の主な特徴であり、それ以外はすべてその兆候であると考えられます。
大きな異常値についてはすべてが明確であり、そのチェックが必要であることは正しく指摘されています(そのようなチェックは相場のズレを検出することができます)が、スピーチ(および質問)はそれらについてではなく、3-4-5シグマについてです。
さらに、100本のローソク足のユーロ・ドルペアのD1クォートのヒストグラムを持ってきた。
以下はサンプルの記述統計である。
さらに、クローズの値が3シグマ、5シグマ、5アベレージと一貫して変化している。
私たちは見ている:
1.左利きの尻尾
2.100本のローソク足につき20本の区間がどこでも指定されているにもかかわらず、ヒストグラムの列の数が変わる。
3.正規則への適合のp値と、それに従って、適合の信頼範囲が変わる。
半分は間違いで、残りの半分は控えめで、一部は正しい。だからWikiを専門的な文献でチェックし、文部科学省が推奨するようなものにすることが望ましいのだ。後ほど、統計学の百科事典から定義を書きます。あなたは完全に混乱していると思う。
母集団とは、研究者が分析のために選択した値の集合である。
半分は間違いで、残りの半分は控えめで、一部は正しい。したがって、Wikiを専門的な文献でチェックし、文部省やその他諸々の機関から推薦してもらうことが望ましい。後ほど、統計学の百科事典から定義を書きます。あなたは完全に混乱していると思う。
これは、現存するデータをすべて取り、他にデータがないことが分かっている場合に限られる。そうでなければ、10本のろうそくを取ったとしても、それは標本集団であって、一般集団ではない。例えば、機械の仕事を測定するとき、明日新しいデータが出ることが分かっている。一般母集団はそれ(サンプル)に対して評価される。そして推定では、正規の法則に当てはめるのではなく(そのような法則であることが知られていない場合)、特別な方法で法則を特定し、それが知られていない間は、どのように何かを取り除くことができるのか(私はあなたに本へのリンクをあげました-そこにはそれについて書かれています)。そしてさらに、1つのサンプルではなく、複数のサンプルによって評価され、特別なテストが比較されるなどする。残念なことに、あなたは私の投稿の意味を理解しようとせず、文脈から離れたフレーズを取り上げることを許してしまった。もう一度。FXでは、一般母集団を選択するためのルールは、私たちに知られていないすべての取引です。私はWikiのような百科事典からの定義には興味がありません - 私は予測に興味があり、一般集団の統計的特性には興味がありません。あなたの圧力で、私は植物的姦淫に陥りそうになり、「一般集団」の定義を見るためにSTATISTICSパッケージにまで行きました:世界的に有名なパッケージは、この概念を考慮していません。
排出ガスのクリーンアップ。排出ガスがフィットに与える影響の詳細を説明した。排出量を取り除かなければ、間違ったフィットが得られます。外れ値を変更すると、法則のパラメータか法則が変わってしまう。フィッティングの後、データをきれいにする必要はありません。
やはり、数理統計学ではなく、計量経済学に関する 教科書やMatパッケージのより良いドキュメントを読むことが非常に望ましい。どの計量経済学のパッケージも、分析のためのデータの準備から始まる。
.:)読者に誤解を与えたくなかっただけだが、必要な人にはわかってほしい。
よし、君に任せるよ。
私はそれが正しい判断だとは思わない。
どんなパッケージも単なるツールであり、それ以上のものではない。私たちは違う言語を話しているようだ。
パッケージについてあなたにアドバイスさせることをお許しください。論文や学位論文のような理論的な議論においては、あなたのアプローチは非常に有効であり、私のアプローチよりも好ましい。しかし、私たちには実際的な問題があり、パッケージは単なる道具ではなく、多くの概念をまとめて実際的な結果を生み出すシステムなのです。我々は、用語の曖昧さのない解釈だけでなく、その曖昧さのない計算も得ることができる。この記事の著者はGARCHについて言及しているが、これは非常にストレッチな概念であり、「一般母集団」よりもはるかにあいまいである。
あなたがこの話題に参加し続けることを願っています。