Una correlación muestral nula no significa necesariamente que no exista una relación lineal - página 41

 
alsu:

No es obvio. Para el control de calidad de Pearson no importa si las filas son positivas o negativas...


Bien, supongamos que no importa. Entonces el aspecto de la distribución de la matriz de correlación I(0) será aproximadamente el mismo que con I(1). Compruébalo. Tomemos 100 I(0). Construyamos una matriz de correlación de estos yoes entre sí. A continuación, construya un histograma de las frecuencias de los valores más frecuentes:

Vemos una distribución normal clásica centrada en el cero - muy bien, porque 100 filas son completamente independientes entre sí. Rara vez la correlación entre filas alcanza el +/- 10%.

Ahora toma 100 series y las integra. La salida será un paseo aleatorio clásico de la forma I(1). Construimos una matriz de correlación para estas series y luego el mismo histograma de distribución:

La distribución está colapsada. Los valores de -0,5 y +0,5 se repiten con la misma frecuencia que los valores de 0,0. El CC se convierte en un indicador sin sentido, ya que cualquier otro número puede caer con la misma probabilidad, aunque no hay dependencia entre las filas de forma fiable.

Ahora toma 100 PA de tipo I(1), pero añade el valor 100 a cada uno de ellos. Debido a la pequeña varianza, se trata de una cifra significativa para estas series. Por lo tanto, todos los 100 PA estarán en la zona positiva > 0. Miramos el histograma:

De hecho, nada ha cambiado en comparación con el gráfico anterior. Pero esto no cambia la esencia y la hipótesis sigue siendo válida: la serie I(1) no puede utilizarse para calcular el QC.

 

¡Esa no es la manera de hacerlo! Hay que calcular el logaritmo del precio, luego las primeras diferencias, luego sacar el logaritmo de ellas y luego calcular la correlación.

¡Ja, ja, ja!


 
faa1947:

...

No cero, sino "sin valor". Por eso se puede obtener una correlación de kotir con los anillos de Saturno, y por lo mismo, problemas de nariz.

...

Esa es la belleza y el punto de la correlación: que se puede contar entre series de diferentes dimensiones.
 
Integer:

¡Esa no es la manera de hacerlo! Hay que calcular el logaritmo del precio, luego las primeras diferencias, luego sacar el logaritmo de ellas y luego calcular la correlación.

¡Ja, ja, ja!

Antes del segundo logaritmo, multiplica por 100 y añade 5.
 
Integer:

¡Esa no es la manera de hacerlo! Hay que calcular el logaritmo del precio, luego las primeras diferencias, luego sacar el logaritmo de ellas y luego calcular la correlación.

¡Ja, ja, ja!

¿Qué te dará el logaritmo? Los logaritmos sólo son útiles cuando los puntos inicial y final de una serie son demasiado diferentes en su volatilidad y nivel. Es decir, si se analizan los DowJons de 1900 a 2013, no se puede prescindir de él, pero en otros casos no se puede utilizar.
 
Era una broma.
 

Limitaciones del análisis de correlación:

Los valores totales de todas las variables de factores y resultados deben seguir una distribución normal multivariante.

Wiki

Creo que tengo entendido que el control de calidad sólo funciona para NR de SV. En las series del mundo real, incluso la primera diferencia no es una NR.

 
Avals:

Limitaciones del análisis de correlación:

Los valores totales de todas las variables de factores y resultados deben seguir una distribución normal multivariante.

Wiki

Creo que tengo entendido que el control de calidad sólo funciona para NR de SV. En las series del mundo real, incluso la primera diferencia no es una NR.

No existe ningún requisito de normalidad para calcular el control de calidad. La normalidad es necesaria para el análisis de correlación, ya que se utiliza para determinar si los factores deben incluirse en una regresión múltiple y para evaluar la ecuación de regresión resultante para comprobar su coherencia con las relaciones identificadas.
 
Avals:

...

wiki

...

Ibid:

A menudo, la seductora simplicidad de los estudios de correlación anima al investigador a sacar falsas conclusiones intuitivas sobre la existencia de una relación causal entre pares de atributos, mientras que los coeficientes de correlación sólo establecen relaciones estadísticas. Si se observan los incendios en una ciudad determinada, por ejemplo, se puede encontrar una correlación muy alta entre los daños causados por el fuego y el número de bomberos que participan en la extinción de un incendio, y la correlación sería positiva. Sin embargo, no se deduce que "un mayor número de bomberos provoque más daños", y tiene aún menos sentido intentar minimizar los daños por incendio eliminando las brigadas de bomberos[5]. Al mismo tiempo, la falta de correlación entre ambas cantidades no significa que no exista relación entre ellas.

 
C-4:


Vale. Supongamos que no importa. Entonces el tipo de distribución de la matriz de correlación ...


El tipo de distribución de la matriz de correlación depende de las propiedades de ambas series y de la relación entre ellas, es decir, no tiene por qué ser la misma para todas las series posibles... Para SB es uno, para algunas erupciones solares otro...
Razón de la queja: