Нулевая корреляция выборки вовсе не обозначает отсутствие линейной взаимосвязи - страница 40

 

Коэффициент корреляции = 0.766654

Считалось все в экселе. Единственное - взял котировки золота из МТ (в твоих лень было запятые разрядов в точки переделывать вручную)

 

Я тут еще раз перепроверил данные: в общем я немного накосячил. Во-первых, там коэффициенты рассчитанные не на открытом интересе, а на открытом интересе хеджеров золота, и во вторых, в конце данных у меня 3 нулевых значения по ОИ - это тоже могло оказать сильное влияние. В общем, обновленные коэффициенты:

Пирсон: 0.1968

Спирмэн: 0.2135

Кендэлл: 0.1430

Как видно, стало лучше. 

 
Demi:

Коэффициент корреляции = 0.766654

Считалось все в экселе. Единственное - взял котировки золота из МТ (в твоих лень было запятые разрядов в точки переделывать вручную)

На рядах считать нельзя, только на первых разностях.
 
почему нельзя?
 
Demi: почему нельзя?

В этой ветке примерно половина постов посвящено обсуждению этого вопроса (начало здесь)

Мое мнение: Оценка корреляции через коэффициент корреляции Пирсона, по аналогии как и оценка матожидания через среднеарифметическое, а дисперсии через СКО, приемлемо только для элементов множеств из линейного пространства. В противном случае надо либо делать преобразование над  исходными данными (например в случае ценовых временных рядов переводить измерения из абсолютной относительной шкалы в интервальную) либо корректировать формулы расчета оценок.

 
GaryKa:

В этой ветке примерно половина постов посвящено обсуждению этого вопроса (начало здесь)

Мое мнение: Оценка корреляции через коэффициент корреляции Пирсона, по аналогии как и оценка матожидания через среднеарифметическое, а дисперсии через СКО, приемлемо только для элементов множеств из линейного пространства. В противном случае надо либо делать преобразование над  исходными данными (например в случае ценовых временных рядов переводить измерения из абсолютной шкалы в интервальную) либо корректировать формулы расчета оценок.

На самом деле здесь.

Очена много букофф - корреляцию можно считать как между рядами, так и между первыми разностями. Аффтар выложил два графика и показал коэффициенты корреляции размерности 0,00... Это меня поразило и я пересчитал. Но аффтар поправился.

П.С. Проще, проще надо быть.... 

 

C-4:

Очевидно, что для расчета требуются первые разности вида I(0), т.к. в случае I(1) нас ждет засада, ведь ряды, с которыми мы имеем дело, всегда положительные (цена всегда больше нуля), но об этом тоже чуть позже.


Хех, неочевидно. Для КК Пирсона неважно, какие ряды, положительные или отрицательные, важно есть ли ковариация, т.е. похожесть динамики. Некоррелирующие первые разности вовсе не означают некоррелированность исходных рядов. Более того, при взятии этой самой разности линейные элементы корреляции, которые и показывает Пирсон, как раз уничтожаются. Поэтому в полученном результате нет ничего необычного, а вывод

1. Как видно ряды I(1) вообще использовать нельзя. Для рядов, чья взаимосвязь не очевидна и не жестко функциональна, коэффициенты корреляции абсолютно бесполезны.

, как и то, что КК якобы завышен, абсолютно неверен: при вычислении процесс центрируется (вычитается среднее по выборке), поэтому КК может получиться хоть положительный, хоть отрицательный. Т.е. 15% в вашем случае - абсолютно реальный коэффициент, примерно столько я бы и дал, глядя на график визуально.

 
alsu:

Т.е. 15% в вашем случае - абсолютно реальный коэффициент, примерно столько я бы и дал, глядя на график визуально.

С этим действительно соглашусь.

alsu:

Хех, неочевидно. Для КК Пирсона неважно, какие ряды, положительные или отрицательные, важно есть ли ковариация, т.е. похожесть динамики. Некоррелирующие первые разности вовсе не означают некоррелированность исходных рядов. Более того, при взятии этой самой разности линейные элементы корреляции, которые и показывает Пирсон, как раз уничтожаются. Поэтому в полученном результате нет ничего необычного...

Хорошо, тогда почему если мы сгенерируем 100 независимых BP(1) с незначительным положительным смещением (т.е. большая часть BP находиться в зоне > 0), затем построим их матрицу корреляций, а потом получим гистограмму распределений этих самых корреляций, то ничего общего с нормальным распределением на этой гистограмме мы не увидим, а увидим мы вот что:

 

Видно, что из 10 000 комбинаций BP (100*100), нулевую корреляцию имеют столько же комбинаций как с корреляцией 0.5 и -0.5. Т.е. вероятность того, что два независимых, положительных случайных блуждания будут скоррелированы друг с другом с КК 0.0 такая же, как если бы их КК был бы равен любому другому числу от -1.0 до +1.0. А значит I(1) использовать нельзя. Как-то так. 

 

Проблема корреляции находится в совершенно другой плоскости.

Когда считается КК, то мы всегда получаем цифру. Алгоритм не предусматривает получение значения КК= NA, т.е. "нет значения". Не ноль, а "нет значения". Именно поэтому можно получить корреляцию котира с кольцами Сатурна, а заодно с проблемами в носу.

КК необходимо считать только для тех пар, про которое из их содержания известно что они потенциально могут быть связаны. Как минимум. А вообще необходимо содержательно обоснование наличия такой связи. В этом случае полученная цифра и будет трактоваться как количественная мера этого содержания.

Об остальных тонкостях расчета я умалчиваю. 

 
faa1947:

Проблема корреляции находится в совершенно другой плоскости.

Когда считается КК, то мы всегда получаем цифру. Алгоритм не предусматривает получение значения КК= NA, т.е. "нет значения". Не ноль, а "нет значения". Именно поэтому можно получить корреляцию котира с кольцами Сатурна, а заодно с проблемами в носу.

КК необходимо считать только для тех пар, про которое из их содержания известно что они потенциально могут быть связаны. Как минимум. А вообще необходимо содержательно обоснование наличия такой связи. В этом случае полученная цифра и будет трактоваться как количественная мера этого содержания.

Об остальных тонкостях расчета я умалчиваю. 

Да глупости все это. "Потенциально связано" все в этом мире. И температура океана у берегов Мексики функционально влияет на урожайность пшеницы во Франции.

Коэффициент корреляции можно расчитывать и между явлениями, не связанными причинно-следственной связью. Вопрос в интерпретации этого коэффициента 

Причина обращения: