Una correlación muestral nula no significa necesariamente que no exista una relación lineal - página 40

 

Coeficiente de correlación = 0,766654

Todo fue calculado en Excel. Lo único es que las comillas de oro las obtuve de MT (me dio pereza convertir los dígitos de las comas en puntos manualmente en la tuya)

 

He vuelto a comprobar los datos: me he equivocado un poco. En primer lugar, los ratios no se calculan sobre el interés abierto sino sobre el interés abierto de los coberturistas de oro, y en segundo lugar, tengo 3 valores cero para OM al final de los datos - esto también podría tener un fuerte impacto. En fin, ratios actualizados:

Pearson: 0,1968

Spearman: 0,2135

Kendall: 0,1430.

Como puedes ver, ha mejorado.

 
Demi:

Coeficiente de correlación = 0,766654

Todo fue calculado en Excel. Lo único - tomé las comillas de oro de MT (me daba pereza convertir los dígitos de las comas en puntos manualmente en los suyos)

No se puede contar con las filas, sólo con las primeras diferencias.
 
¿Por qué no?
 
Demi: ¿Por qué no?

Aproximadamente la mitad de los mensajes de este hilo están dedicados a debatir esta cuestión (iniciada aquí)

Mi opinión: La estimación de la correlación por el coeficiente de correlación de Pearson, por analogía con la estimación de la expectativa por la media aritmética y la estimación de la varianza por la RMS, es aceptable sólo para elementos de conjuntos del espacio lineal. En caso contrario, es necesario realizar una transformación sobre los datos originales (por ejemplo, en el caso de las series temporales de precios, convertir las mediciones de escala relativa absoluta a escala de intervalo) o ajustar las fórmulas de estimación.

 
GaryKa:

Aproximadamente la mitad de los mensajes de este hilo están dedicados a la discusión de esta cuestión (iniciada aquí)

Mi opinión: La estimación de la correlación por el coeficiente de correlación de Pearson, por analogía con la estimación de la expectativa por la media aritmética y la varianza por la RMS, es aceptable sólo para elementos de conjuntos del espacio lineal. En caso contrario, es necesario realizar una transformación sobre los datos originales (por ejemplo, en el caso de las series temporales de precios, convertir las mediciones de escala absoluta a escala de intervalo) o ajustar las fórmulas de estimación.

En realidad aquí.

Hay mucho texto: la correlación puede contarse tanto entre series como entre las primeras diferencias. Hafftar publicó dos gráficos y mostró coeficientes de correlación de dimensión 0,00... Esto me llamó la atención y volví a calcular. Pero el aftar se corrigió.

P.D. Más sencillo, más simple deberíamos ser....

 

C-4:

Evidentemente, las primeras diferencias de la forma I(0) son necesarias para el cálculo, porque en el caso de I(1) estamos ante una emboscada, ya que las series que tratamos son siempre positivas (el precio es siempre mayor que cero), pero sobre eso también más adelante.


No es obvio. Para el control de calidad de Pearson no importa si las series son positivas o negativas, lo que importa es si hay covarianza, es decir, la similitud de la dinámica. Las primeras diferencias no correlacionadas no implican en absoluto que las series originales no estén correlacionadas. Además, al tomar esta misma diferencia se destruyen los elementos de correlación lineal que muestra Pearson. Por lo tanto, no hay nada inusual en el resultado obtenido, y la conclusión es

1. Como se puede ver, la serie I(1) no se puede utilizar en absoluto. Para las series cuya correlación no es evidente y no es rígidamente funcional, los coeficientes de correlación son absolutamente inútiles.

El hecho de que el CC esté supuestamente sobreestimado es absolutamente erróneo: el proceso se centra en el cálculo (se resta la media de la muestra), por lo que el CC puede ser positivo o negativo. Es decir, el 15% en tu caso es un coeficiente perfectamente realista, que es más o menos lo que yo daría al mirar el gráfico visualmente.

 
alsu:

Es decir, el 15% en tu caso es un coeficiente perfectamente realista, que es más o menos lo que yo daría mirando el gráfico visualmente.

Estoy de acuerdo con esto.

alsu:

No es obvio. Para el CC de Pearson no importa si la serie es positiva o negativa, lo que importa es si hay covarianza, es decir, la similitud de la dinámica. Las primeras diferencias no correlacionadas no implican en absoluto que las series originales no estén correlacionadas. Además, al tomar esta misma diferencia, se acaban de eliminar los elementos de correlación lineal que muestra Pearson. Por lo tanto, no hay nada inusual en el resultado obtenido...

Ok, entonces por qué si generamos 100 BP(1) independientes con un sesgo positivo insignificante (es decir, la mayoría de los BPs están en el área > 0), luego construimos su matriz de correlación y luego obtenemos un histograma de sus distribuciones, no veremos nada común con la distribución normal en este histograma, pero veremos esto:

Podemos ver que de 10 000 combinaciones de BP (100*100), hay otras tantas combinaciones con una correlación de 0,5 y -0,5. Es decir, la probabilidad de que dos paseos aleatorios independientes y positivos estén correlacionados entre sí con KK 0,0 es la misma que si su KK fuera igual a cualquier otro número de -1,0 a +1,0. Lo que significa que no se puede utilizar I(1). De alguna manera.

 

El problema de la correlación está en un plano completamente diferente.

Cuando se cuenta el control de calidad, siempre se obtiene un número. El algoritmo no proporciona un valor QC= NA, es decir, "sin valor". No cero, sino "sin valor". Por eso es posible obtener una correlación de kothir con los anillos de Saturno, y al mismo tiempo con problemas de nariz.

El control de calidad sólo debe contarse para aquellos pares de los que se sabe, por su contenido, que están potencialmente correlacionados. Como mínimo. Y, en general, es necesario que haya una justificación significativa para la existencia de dicha conexión. En este caso, la cifra obtenida se interpretará como una medida cuantitativa de este contenido.

El resto de las sutilezas del cálculo me las callo.

 
faa1947:

El problema de la correlación está en un plano completamente diferente.

Cuando se cuenta el control de calidad, siempre se obtiene un número. El algoritmo no proporciona un valor QC= NA, es decir, "sin valor". No cero, sino "sin valor". Por eso es posible obtener una correlación de kothir con los anillos de Saturno, y al mismo tiempo con problemas de nariz.

El control de calidad sólo debe contarse para aquellos pares de los que se sabe, por su contenido, que están potencialmente correlacionados. Como mínimo. Y, en general, es necesario que haya una justificación significativa para la existencia de dicha conexión. En este caso, la cifra obtenida se interpretará como una medida cuantitativa de este contenido.

No digo nada sobre las demás sutilezas del cálculo.

Todo esto es una tontería. "Potencialmente conectado" todo en este mundo. Y la temperatura del océano frente a la costa de México tiene un efecto funcional sobre el rendimiento del trigo en Francia.

También se puede calcular un coeficiente de correlación entre fenómenos que no están relacionados causalmente. La cuestión es la interpretación de este coeficiente

Razón de la queja: