標本相関がゼロでも、線形関係がないとは限らない - ページ 39

 


hrenfx さんからのリンクのコメントからこちら2011.03.22 00:43 気に入りました。

相関関係があるんだ!:)
は、一方が他方の結果であることを意味するものではありません。
が、現象は関連しています。
(そして、人は説明を発明し始めるかもしれません)。
が、そんなことはどうでもいい。
要は、ある観点からすれば、一方と他方の関係を予測することは可能なのです。)
もちろん、そのメカニズムを理解していれば、接続が終了するタイミングを予測することができる。
でも...
ということだけではなく、常に相関関係を分析することで、いつ終わるかを予測することができるのです。)

 
Groveのように : 相関関係がある - ないはずはない)))))))))
 
Neutron:

部分的には同意しますが、決して全てではありません。もし、あなたが提起したテーマについて実質的な議論をしたいのであれば、まず、このテーマについての私の見解を明らかにする私の投稿をいくつか読んでみる必要があるでしょう。何度も繰り返さなければならないので、もうやめよう。今、PMで私の投稿のリンクを2つ送りました。

 
hrenfx

こんにちは、あなたのスレッドを拝見して、あなたの論理に興味を持ちました。

質問ですが、recycle2の相関インジケータを mt5に書き換えて みましたか?

 

私の研究では、系列間の関係を定性的に評価する必要があったので、相関係数を使うことにした。古典的な統計学が示唆する方法は、系列間の非明示的な関係を見つけるには実質的に役に立たないということです。例えば、金先物の週足チャートとその建玉を例にとってみましょう。

明らかに、直接的な相関関係があるのです。そう、あまり強くはなく、分かりやすいのですが、金価格が上昇すると、金先物の建玉値が高くなり、下落すると-低くなるのです。

後ほど、金価格と起算点の相関係数を求めます。その前に、最も一般的なピアソンの相関式について考えてみましょう。

よく見ると、この式はデータ(x - x 中央値)をデトレンドし、サンプル全体の標準偏差でボラティリティを揃え、両系列が同じ方向にある時間を数えていることがわかる。明らかに、この計算では、I(0)の形の最初の差分が必要です。I(1)の場合、我々が扱っている系列は常に正(価格は常にゼロより大きい)であるため、待ち伏せされることになりますが、それについても後で説明します。

ピアソン相関: 0.02234314

ケンデル相関:0.002866038

スピアマン相関:0.002046104

つまり、実際には、すべてのケースで相関は見られなかった。しかし、私たちの鋭い目はどうでしょう?私たちは、すべてを想像しているのでしょうか?また、金とOpen Interestの相関は、モロッコからのバナナ輸入量と同国の出生率の相関と同じなのだろうか?

おそらくその理由は、一方の指標が他方に対して遅れていることにあるのだろう。ラグが合わないんです。OIが先に上がって、その時だけゴールドがやったらどうでしょう?- あ、それならそれでお金になるかもしれませんね :)このアイデアを相互相関関数で検証してみましょう。

やや説得力に欠ける。サンプルの中で際立っている2つの値がありますが、全体とここではまるで関係がなく、したがってラグが役割を果たしていないかのような絵になっています。

OKです。次に、I(1)系列の相関を計算してみましょう。どんな場合でもやってはいけないというのは、誰の意見ですか?結果は過大評価でも、結果が出ないよりはマシです。そこで、100個のBPを生成し、それらの相関行列を計算する実験を行った。平均値は、推定値がどの程度過大評価されるかを示すもので、単純にI(1)系列を扱う場合、これを考慮するかしないか?

これを実現するR上のスクリプトを紹介します。

#
# corexp - эксперимент выявляющий особенности корреляционных функций при работе с I(1) рядами
# exp - количество экспериментов
# lenght - длинна каждой серии
# cortype - тип корреляции (pearson - КК Пирсона, kendall - КК Кендалла, spearman - КК Спирмана)
# retrange - Истина, если требуется сгенерировать I(1) ряды
#
corexp <- function(exp = 10, lenght = 1000, cortype = 'pearson', retrange = TRUE)
{
   bp <- matrix(ncol = exp, nrow = lenght)
   for(i in 1:exp)
   {
      bp[,i] <- rnorm(lenght, mean = 0.000117, sd = 0.0048)
      if(retrange == FALSE)
            bp[,i] <- cumsum(bp[,i])
   }
   #Рассчитываем матрицу корреляций
   mcor <- matrix(ncol=exp, nrow=exp)
   for(k in 1:exp)
   {
      for(i in 1:exp)
      {
         mcor[k,i] <- cor(bp[,k], bp[,i], method = cortype)
      }
   }
   return(mcor)
}

# Статистика корреляций
# При желании считаем здесь все что угодно
corstat <- function(m)
{
   m[m == 1] <- NaN
   mean(m, na.rm = TRUE)
}

この「平均値」である0.153359を実際に見てみましょう。大丈夫そうですね~、15%くらい過大評価されています。しかし、もう一つの罠がある。相関行列の分布に注目する。

この場合の平均値は全く定義されていない、というより、どのような相関値も他の値と同じ頻度で存在する。これは、太字で表示されているパラメータで設定された、BPの正のバイアスに関係しています。結局、私たちが扱う価格はすべて正の値、つまりプラスゾーンにあるのです。

1.このように、I(1)系列は全く使えません。関係が明白でなく、厳密な関数でもない系列では、相関係数は全く役に立たない。

2.相関係数の特定の実装を選択することは、基本的に何も影響を及ぼさない。3つの共通係数はいずれも、金とその建玉の関係を明らかにすることはできないが、そのような関係が存在することは明らかである。

 
C-4:

ピアソン相関: 0.02234314

ケンデル相関:0.002866038

スピアマン相関:0.002046104

オリジナルシリーズを見てもらうことはできますか?例えば、Excelで利用できるのでしょうか?
 
元の行は保存されません。ここでは、その世代の一つをCSV形式でご紹介します。
ファイル:
bp.txt  2010 kb
 
C-4:
元の行は保存されません。ここでは、その世代の一つをCSV形式でご紹介します。
オープンインタレスト・データのソース行は何ですか?
 
こちらは金の価格に合わせたOIデータです。
ファイル:
gold_oi_2.txt  19 kb
 
相関係数 = 0.766654