ベイズ回帰 - このアルゴリズムを使ってEAを作った方はいらっしゃいますか? - ページ 35

 

なんだ、また物足りないのか?

まあ、それ以上については。

被説明変数:AUDNZD Multiple R = .83469441 F = 3845.556

R?= .69671476 df = 1.1674

症例数:1676例 修正R?=0.69653358 p = 0.000000

推定値の標準誤差:0.053321255

切片: 6.047516031 標準誤差: .0782142 t( 1674) = 77.320 p = 0.0000


 

コントロールからヘッドへ。

従属変数:NZDCAD Multiple R = 0.87619213 F = 5532.591

R?= .76771265 df = 1.1674

症例数:1676件 調整後R=0.76757389 p=0.000000

推定値の標準誤差:0.032035522

切片: -2.664033151 標準誤差: .0469913 t( 1674) = -56.69 p = 0.0000


 
Дмитрий:

R^2はもう「非常に低い」のでしょうか?

相関関係はあるのでしょうか?

相関関係は検出できない。Rは弱い。私は自分の戦略のエクイティの質を評価するためにR2を非常に積極的に使っていますが、信じてください、私はR2がここで紹介されているものと同じようなチャートを何百と見てきました。これはSBと見分けがつかないくらい全くちぐはぐなものです。

 
Vasiliy Sokolov:

その関係は検出不可能です。Rは弱い。たまたま、私自身、自分の戦略の株式の質を評価するためにR2を積極的に使っており、信じて欲しいのだが、R2がここで紹介したものとほぼ同じであるチャートを何百枚も見てきたのだ。これはSBと見分けがつかないくらい全くちぐはぐなものです。

))))))))))))))))))))))))))0
 

R-projectで次のようなことをした記憶があります。ランダムな市場の軌跡を1000回ずつ計測して生成することです。そして、それぞれに線形回帰を投じて、そのR^2を求めた。その結果、R^2値のベクトルは0から0.99まで一様に分布することが判明し......。平均約0.5で。皆さんも、私の結果を繰り返して、何をカウントしているのか、その本質を考えてみてはいかがでしょうか。

s.w.手元にRやこれらのコードがないのが残念です。そうでなければ、一枚の絵は千の言葉に値するでしょう...。

 
Vasiliy Sokolov:
R-projectでそのようなことをした記憶があります。ランダムな市場の軌跡を1000個ずつ生成し、1000回計測しました。そして、それぞれに線形回帰を投じて、そのR^2を求めた。その結果、R^2値のベクトルは0から0.99まで一様に分布することが判明し......。平均約0.5で。皆さんも、私の結果を繰り返し、カウントしていることの本質を考えてみてください。

И?

書いてあることは、何のためにあるのか?生成されたPRNG系列のn番目の1つが大きなR^2を示すことがあるという理由で、回帰分析を使ってはいけないと?

だから、数学的統計や予測の方法をすべて捨てる必要があるのです。

 
Vasiliy Sokolov:

パネリストの方々の数学的手法の習得度の高さと、その適用原理を全く理解していないことに驚かされます。あらゆる回帰分析がデータを相関させる相関がない場合、回帰は適用できない。調査対象の量の分布が正規分布と異なる場合、パラメトリック統計の手法も適用できない。市場には正常という性質はない。また、プロセスとしての市場は時間に依存しない。どちらも、根底にあるものが何であれ、回帰分析という考え方そのものを横断しています。

問題は、あなたを含む多くの参加者が回帰を理解せず、不明瞭な定義を使っていることです。回帰分析の適切な定義において、誤差の分布に制限はない。主な点は、個々の誤差の関数の和として総回帰誤差を表すことができるように、誤差が互いに統計的に独立していなければならないことです。それ以外はすべて回帰の特殊なケースです。たとえば,誤差の正規性の要件は,RMS回帰,すなわち,総回帰誤差が個々の誤差の2乗の合計として表現される場合にのみ適用される.これは最も単純な回帰の方法なので、連立一次方程式を解くことになる。誤差の正規性を仮定したくない場合は、他の分布を使ってください。二乗和の代わりに、全体の誤差は、個々の誤差の他の関数の和で表されます。

このように説明してみます。測定値yと入力データxがあるとする。xにyをプロットしてみよう。y(x)の点は何らかの雲を形成している。この雲が円形で全方向の点の密度が均一 であれば、どんなに誤差分布をひねっても、yとxは独立なので、モデルy(x)は存在しないのです。この雲がある方向に広がっていれば、モデルを作ることができます。その場合、いくつかのモデルを選択することになります。

1.線形 y_mod(x) = a + b*x または非線形 y_mod(x) = F(x) = example = a0 + a1*x + a2*x^2 +... を構成してください。のモデルです。

2.測定誤差 e[i] = y[i] - y_mod[i] の独立性を仮定して、それらの正規性 err_sum = SUM e[i]^2 または非正規性 err_sum = SUM G(e[i]) ここで G() は任意の「非二乗」関数、例えば G(e) = |e| または一般的には G(e) = |e|^p である、と仮定しています。もっとひねって、例えばy[i]の負の値により多くの重みを与えるような誤差関数を作ってもよい。G(e)のどちらを選んでも、xの関数としてのyの予測可能性には影響しない。雲を通る直線y(x)の描き方にしか影響しない。例えば、G(e)=e^10とすると、この直線はyの値が大きい方に寄ることになる。

線形 y_mod(x) = a + b*x または多項式 y_mod(x) = a0 + a1*x + a2*x^2 +... のどちらを選択するかは、その時の状況です。のモデルは、私たちの細長い雲の形状に依存します。どちらの場合も、平均二乗回帰を使えば、一次方程式系がすぐに解けるようになる。

さて、次は時間についてです。y(t)とx(t)が時間に依存する場合、これは測定が異なる時点で行われるため、ほとんどすべての回帰のケースで起こりますが、問題は変わりません。回帰y(t)=F(x(t))はまだ語れます。関数 y(t) = F(x(t)) が時間依存性である場合,すなわち y(t) = F(x(t),t) の場合,全時間区間にわたる静的回帰 y=F(x) は適用できない.動的モデル y=F(x,t) を使用する必要があります。

 
Vladimir:
ある数学者(名字は忘れました、FINAMに勤務)の研究によると、分布は正規分布に近く、テールが細長い(しかしその理由は理解できる)そうです。だから、線形回帰が 支配的なのです。
 
Yuriy Asaulenko:
ある数学者(名字は忘れました、FINAMに勤務)の研究によると、分布は正規分布に近く、テールが細長い(しかしその理由は理解できる)そうです。だから、線形回帰は イマドキ、かなり優秀なんです。
いろいろなエラー配信を試しました。特に結果に違いは感じられませんでしたが、計算時間が大幅に増加します。だから、RMS回帰を使うんです。なぜなら、関数y(x)はx変数に対して非線形であっても、モデル係数に対しては線形である可能性があり、その場合でも平均化二乗回帰は計算を顕著に高速化することができるからです。正規性や回帰の適用性の理論に多くの時間を費やすよりも、入力データを準備して、入力xと測定値yの簡単な変換でこの雲y(x)を描いたり、円形にできるようにする話の方がずっと重要です。この雲を通る直線や放物線をどう描くか、モデル化誤差(2乗や絶対値)をどう計算するかは二の次である。
 

懐疑派に訴えます。

皆さん、皆さん、同志の皆さん!アルコール循環系の血液が多すぎるのです(C)。

ベイズ式の概念問答が決まっていない場合、R上で数学的にモデル化できるのは、「ゼロバーの右側の相場は何か」です。そして、それは市場なのでしょうか?あるいは、適切なアルゴリズムによる優れたゲームシミュレーターとか?どのような分布と尤度関数を取るか?

世の中は正規分布でハッピーエンドになったわけではないのです。ガウスが生まれたとき、ベイズは死んでいた。私が正規分布をとることを提案したのは、懐疑論者の皆さんが納得のいく形で示してくださったからです。そして、懐疑的な人たちが、それは合わない、適用できないと言うのであれば、すでに提案されているもの以外で、そうなるものを提案してください。尤度関数と分配法則は、例えば3月8日のブーケの下の投稿のP31で紹介したように、ベイズ式に応用することができます。そして、どうなるか見てみましょう。