샘플 상관 관계가 0이라고 해서 선형 관계가 없는 것은 아닙니다. - 페이지 39

 


다음은 hrenfx 2011년 3월 22일 00:43 좋아요의 링크에 대한 댓글입니다.

상관관계가 있다! :)
이것은 하나가 다른 하나의 결과라는 것을 의미하지 않습니다.
그러나 현상은 관련이 있습니다.
(그러면 설명을 시작할 수 있습니다)
그러나 설명의 본질은 아닙니다.
요점은 어떤 관점에서 서로 간의 관계를 예측하는 것이 가능하다는 것입니다. 어느 시점까지. )
물론 링크 메커니즘에 대한 명확한 이해는 링크가 언제 끝날지 예측할 수 있게 해줍니다.
하지만…
그러나 상관 관계를 지속적으로 분석하면 언제 끝날지 예측할 수 있습니다. )

 
그루브처럼: 상관관계가 있다 - 먹을 수밖에 없다))))))))))))
 
Neutron :

부분적으로는 동의하지만 완전히는 아닙니다. 당신이 제기한 주제에 대해 자세히 이야기하고 싶다면 먼저 이 주제에 대한 내 비전을 보여주는 내 게시물 몇 개를 읽어야 합니다. 많이 반복해야 해서 다시는 하지 않겠습니다. 방금 PM에 내 게시물에 대한 두 개의 링크를 보냈습니다.

 
hrenfx

안녕하세요! 당신의 주제와 관심 있는 논리를 보고,

질문이 있습니다 - 당신은 재활용 2에서 MT5로 상관 지표를 다시 쓰려고 시도하지 않았습니다

 

제 연구에서는 계열 간의 관계를 정성적으로 평가할 필요가 있어 상관계수를 사용하기로 했습니다. 결론은 실망스럽습니다. 고전 통계에서 제공하는 방법은 계열 간의 명확하지 않은 관계를 찾는 데 실제로 쓸모가 없습니다. 예를 들어 금 선물과 미결제약정에 대한 주간 차트를 살펴보겠습니다.

분명히 직접적인 관계가 있습니다. 예, 매우 강하고 분명하지는 않지만 금 가격이 상승하면 선물의 OI가 낮아지고 낮아집니다.

잠시 후 금 가격과 OI 간의 상관 계수를 찾을 수 있습니다. 그러나 먼저 가장 일반적인 Pearson 상관 공식을 고려하십시오.

자세히 살펴보면 공식이 데이터(x - x avg.)의 추세를 없애고 전체 표본에 대한 표준 편차에 따라 변동성을 정렬한 다음 두 계열이 같은 방향에 있었던 시간을 계산한다는 것이 분명해집니다. 분명히, I(0) 형식의 첫 번째 차이는 계산에 필요합니다. I(1)의 경우, 우리가 다루고 있는 시리즈가 항상 양수(가격은 항상 0보다 큼)이기 때문에 매복을 당하게 되지만 이에 대해서는 나중에 자세히 설명합니다.

피어슨 상관관계: 0.02234314

켄델 상관관계: 0.002866038

스피어맨 상관관계: 0.002046104

저것들. 사실 모든 경우에 상관관계가 발견되지 않았습니다. 그러나 우리의 예리한 눈은 어떻습니까? 우리 모두는 그것을 상상하고 있습니까? 그리고 금과 미결제약정의 관계는 모로코의 바나나 수입량과 그 나라의 출생률의 관계와 같다고?

아마도 그 이유는 한 지표가 다른 지표에 비해 지연되기 때문일 수 있습니다. 러그가 일치하지 않습니다. RP가 먼저 상승한 다음 골드가 상승하면 어떻게 될까요? - 오, 그러면 돈을 벌 수 있습니다 :) 교차 상관 기능을 사용하여 아이디어를 확인합시다.

어쩐지 설득력이 없다. 일반적으로 샘플에서 눈에 띄는 두 가지 값이 있는데, 여기에서는 마치 연결이 없는 것처럼 되어 지연이 역할을 하지 않습니다.

확인. 그런 다음 I(1) 시리즈의 상관 관계를 계산해 보겠습니다. 누가 이런 일을 절대 해서는 안 된다고 했습니까? 결과를 과대평가하지만 과대평가된 결과가 없는 것보다 낫습니다. 이러한 목적을 위해 실험이 수행되었으며 100BP를 생성하고 이에 대한 상관 행렬을 계산합니다. 평균 값은 추정치가 얼마나 과대 평가되는지를 보여주고 I (1) 행에서 작업할 때 이것을 고려할 것입니까?

다음은 이 모든 작업을 수행하는 R 스크립트입니다.

#
# corexp - эксперимент выявляющий особенности корреляционных функций при работе с I( 1 ) рядами
# exp - количество экспериментов
# lenght - длинна каждой серии
# cortype - тип корреляции (pearson - КК Пирсона, kendall - КК Кендалла, spearman - КК Спирмана)
# retrange - Истина, если требуется сгенерировать I( 1 ) ряды
#
corexp <- function(exp = 10 , lenght = 1000 , cortype = 'pearson' , retrange = TRUE)
{
   bp <- matrix(ncol = exp, nrow = lenght)
   for (i in 1 :exp)
   {
      bp[,i] <- rnorm(lenght, mean = 0.000117 , sd = 0.0048 )
       if (retrange == FALSE)
            bp[,i] <- cumsum(bp[,i])
   }
   #Рассчитываем матрицу корреляций
   mcor <- matrix(ncol=exp, nrow=exp)
   for (k in 1 :exp)
   {
       for (i in 1 :exp)
      {
         mcor[k,i] <- cor(bp[,k], bp[,i], method = cortype)
      }
   }
   return (mcor)
}

# Статистика корреляций
# При желании считаем здесь все что угодно
corstat <- function(m)
{
   m[m == 1 ] <- NaN
   mean(m, na.rm = TRUE)
}

실제로 우리는 동일한 '평균': 0.153359를 봅니다. 15%만 과대평가된 좋은 것 같습니다. 그러나 매복은 갑작스럽다. 상관 행렬의 분포를 살펴봅니다.

이 경우의 평균값은 전혀 정의되어 있지 않으며, 오히려 어떤 상관값도 다른 값만큼 자주 발생합니다. 그리고 그것은 굵게 강조 표시된 바로 그 매개변수에 의해 설정되는 BP의 양수 오프셋에 관한 것입니다. 결국 우리가 다루고 있는 모든 가격에는 긍정적인 가치가 있습니다. 긍정적인 영역에 있습니다.

1. 보시다시피 시리즈 I(1)은 전혀 사용할 수 없습니다. 관계가 명확하지 않고 엄격하게 기능하지 않는 계열의 경우 상관 계수는 절대적으로 쓸모가 없습니다.

2. 상관 계수의 특정 구현 선택은 근본적으로 아무 영향도 미치지 않습니다. 일반적으로 사용되는 세 가지 비율 중 어느 것도 금과 미결제약정 사이의 관계를 식별할 수 없었지만 관계가 있다는 것은 분명합니다.

 
C-4 :

피어슨 상관관계: 0.02234314

켄델 상관관계: 0.002866038

스피어맨 상관관계: 0.002046104

원래 라인을 볼 수 있습니까? 엑셀에도 있나요?
 
원래 행은 저장되지 않습니다. 다음은 CSV 형식의 세대 중 하나입니다.
파일:
bp.txt  2010 kb
 
C-4 :
원래 행은 저장되지 않습니다. 다음은 CSV 형식의 세대 중 하나입니다.
원래 미결제약정 데이터 시리즈는 무엇입니까?
 
다음은 금 가격으로 조정된 ROI 데이터입니다.
파일:
gold_oi_2.txt  19 kb
 
상관 계수 = 0.766654
사유: