A correlação de amostra zero não significa necessariamente que não exista uma relação linear - página 40

 

Coeficiente de correlação = 0,766654

Tudo foi calculado em excelência. A única coisa - tirei citações de ouro do MT (eu era preguiçoso demais para converter os dígitos em vírgula para pontos manualmente no seu)

 

Eu verifiquei os dados novamente: eu me enganei um pouco. Em primeiro lugar, os rácios lá não são calculados sobre juros abertos, mas sobre juros abertos de hedgers de ouro e, em segundo lugar, tenho 3 valores zero para OM no final dos dados - isto também poderia ter um forte impacto. De qualquer forma, rácios atualizados:

Pearson: 0.1968

Lanceiro: 0,2135

Kendall: 0,1430.

Como você pode ver, ficou melhor.

 
Demi:

Coeficiente de correlação = 0,766654

Tudo foi calculado em Excel. A única coisa - tirei citações de ouro do MT (eu era preguiçoso demais para converter os dígitos em vírgula para pontos manualmente no seu)

Não se pode contar com filas, apenas com as primeiras diferenças.
 
Por que não?
 
Demi: por que não?

Cerca da metade dos posts neste tópico são dedicados a uma discussão sobre este assunto (iniciada aqui)

Minha opinião: A estimativa de correlação pelo coeficiente de correlação de Pearson, por analogia com a estimativa de expectativa por média aritmética e estimativa de variância por RMS, é aceitável apenas para elementos de conjuntos do espaço linear. Caso contrário, é necessário ou fazer uma transformação sobre os dados originais (por exemplo, no caso de séries temporais de preços, para converter as medições da escala relativa absoluta para a escala de intervalos) ou ajustar as fórmulas para estimativa.

 
GaryKa:

Cerca da metade dos posts neste tópico são dedicados à discussão deste assunto (iniciado aqui)

Minha opinião: A estimativa de correlação pelo coeficiente de correlação de Pearson, por analogia com a estimativa de expectativa por média aritmética e variância por RMS, é aceitável apenas para elementos de conjuntos do espaço linear. Caso contrário, é necessário ou fazer uma transformação sobre os dados originais (por exemplo, no caso de séries temporais de preços, para converter as medições da escala absoluta para a escala de intervalos) ou ajustar as fórmulas para estimativa.

Na verdade, aqui.

Há muito texto - a correlação pode ser contada tanto entre as séries como entre as primeiras diferenças. Hafftar afixou dois gráficos e mostrou coeficientes de correlação de dimensão 0,00. Isto me impressionou e eu recalculei. Mas o afftar corrigiu a si mesmo.

P.S. Mais simples, mais simples devemos ser....

 

C-4:

Obviamente, as primeiras diferenças do formulário I(0) são necessárias para o cálculo, porque no caso do I(1) estamos diante de uma emboscada, porque as séries com as quais estamos lidando são sempre positivas (o preço é sempre maior que zero), mas sobre isso também mais tarde.


Heh, não é óbvio. Para o CQ Pearson não importa se as séries são positivas ou negativas, o que importa é se há covariância, ou seja, a similaridade da dinâmica. As primeiras diferenças não correlatas não implicam de forma alguma que as séries originais não estejam correlatas. Além disso, tomando esta mesma diferença, os elementos de correlação linear, que Pearson mostra, são simplesmente eliminados. Portanto, não há nada de anormal no resultado obtido, e a conclusão é

1. Como você pode ver, a série I(1) não pode ser usada de forma alguma. Para séries cuja correlação não é óbvia e não rigidamente funcional, os coeficientes de correlação são absolutamente inúteis.

O fato de o CQ ser supostamente superestimado é absolutamente errado: o processo é centralizado no cálculo (a média da amostra é subtraída), de modo que o CQ pode ser positivo ou negativo. Ou seja, 15% no seu caso é um coeficiente perfeitamente realista, que é sobre o que eu daria quando olhasse o gráfico visualmente.

 
alsu:

Ou seja, 15% no seu caso é um coeficiente perfeitamente realista, que é sobre o que eu daria olhando o gráfico visualmente.

Eu concordo com isto.

alsu:

Heh, não é óbvio. Para o CQ da Pearson não importa se a série é positiva ou negativa, o que importa é se há covariância, ou seja, a similaridade da dinâmica. As primeiras diferenças não correlatas não implicam de forma alguma que as séries originais não estejam correlatas. Além disso, tomar esta mesma diferença destrói os elementos de correlação linear que Pearson mostra. Não há, portanto, nada de anormal no resultado obtido.

Ok, então por que se gerarmos 100 BP independentes(1) com um viés positivo insignificante (ou seja, a maioria das BPs estão na área > 0), então construa sua matriz de correlação e então obtenha um histograma de suas distribuições, não veremos nada comum com a distribuição normal neste histograma, mas veremos isto:

Podemos ver que de 10 000 combinações de BP (100*100), há tantas combinações com correlação 0,5 e -0,5. Ou seja, a probabilidade de dois passeios aleatórios independentes e positivos estarem correlacionados entre si com KK 0,0 é a mesma como se seus KK fossem iguais a qualquer outro número de -1,0 a +1,0. O que significa que I(1) não pode ser usado. De alguma forma.

 

O problema da correlação está em um plano completamente diferente.

Quando o CQ é contado, sempre recebemos um número. O algoritmo não fornece um valor QC= NA, ou seja, "sem valor". Não zero, mas 'sem valor'. É por isso que é possível obter uma correlação de kothir com os anéis de Saturno e, ao mesmo tempo, com problemas no nariz.

O CQ só precisa ser contado para aqueles pares sobre os quais você sabe pelo conteúdo deles que eles estão potencialmente correlacionados. No mínimo. E, em geral, é necessário que haja uma justificativa significativa para a existência de tal conexão. Neste caso, o número obtido será interpretado como uma medida quantitativa deste conteúdo.

Estou em silêncio sobre o resto das sutilezas do cálculo.

 
faa1947:

O problema da correlação está em um plano completamente diferente.

Quando o CQ é contado, sempre recebemos um número. O algoritmo não fornece um valor QC= NA, ou seja, "sem valor". Não zero, mas 'sem valor'. É por isso que é possível obter uma correlação de kothir com os anéis de Saturno e, ao mesmo tempo, com problemas no nariz.

O CQ só deve ser contado para aqueles pares sobre os quais você sabe pelo seu conteúdo que eles são potencialmente correlacionados. No mínimo. E, em geral, é necessário que haja uma justificativa significativa para a existência de tal conexão. Neste caso, o número obtido será interpretado como uma medida quantitativa deste conteúdo.

Sou silencioso sobre todas as outras sutilezas de cálculo.

Isso tudo é um absurdo. "Potencialmente conectados" tudo neste mundo. E a temperatura do oceano ao largo da costa do México tem um efeito funcional no rendimento do trigo na França.

Um coeficiente de correlação também pode ser calculado entre fenômenos que não estão relacionados causalmente. A questão é a interpretação deste coeficiente

Razão: