Discusión sobre el artículo "Criterio de independencia de Hilbert-Schmidt (HSIC)" - página 2

 
Maxim Dmitrievsky #:


También he observado que suele ser más rápido calcular modelos MO rápidos para determinar la dependencia que estos criterios diferentes, que suelen ser más lentos. Aunque debería ser al revés :)
Nos lleva tiempo calcular la significación, por lo que es rápido calcular la estadística en sí
[Eliminado]  
Evgeniy Chernish #:
Nos lleva un tiempo calcular la importancia, así que es rápido con las estadísticas.
Cierto, me olvidé de eso.
 
Maxim Dmitrievsky #:
tardan más.

Los intervalos (X1, X2, Y) no se solapan.

 
Evgeniy Chernish #:
El HSIC no puede utilizarse para series no estacionarias. Es necesario tomar incrementos de precios en lugar de precios. La correlación de Pearson indica "dependencia" por la misma razón.

La complejidad computacional de HSIC es muchos órdenes de magnitud (con comprobaciones de significación) superior a la de Pearson, por lo que esperaba un resultado diferente.

Si los incrementos son independientes, pero sus sumas de repente son "dependientes", es un resultado extraño para un criterio que consume tantos recursos, incluso en teoría.

[Eliminado]  
fxsaber #:

Allí los intervalos (X1, X2, Y) no se solapan.

La ACF muestreada de la SB decae aún más lentamente o no decae en absoluto. A grandes rasgos, se trata de cálculos sin sentido :)

 
Maxim Dmitrievsky #:

La ACF muestreada de la SB se atenúa aún más lentamente o no se atenúa en absoluto

No entiendo la aplicación de este argumento al contexto de la discusión.

 

Afirmación.

Si después de transformar las series (sin pérdida de información - podemos volver al estado inicial) obtenemos la independencia, entonces las series originales son independientes.

[Eliminado]  
fxsaber #:

No entiendo la aplicación de este argumento al contexto de la discusión.

Estos métodos no muestran lo que se espera en series no estacionarias. Por lo tanto, podemos tomar la ACF como base y explicar utilizando como ejemplo. Cómo cambian las correlaciones en función del paso t. En la SB, la autocorrelación depende del tiempo. Está todo escrito, se puede leer en internet.
La autocorrelación es la correlación de la SB consigo misma, con el desfase. Depende del desfase temporal.
Esto es lo básico del análisis de series temporales.
Lea cómo el acf simple y muestral de la SB varía con el retardo.

La única diferencia entre el método propuesto en el artículo es que trabaja con correlaciones no lineales.
 
fxsaber #:

Aprobación.

Si después de transformar las series (sin pérdida de información - podemos volver al estado inicial) obtenemos la independencia, entonces las series originales son independientes.

Tres series independientes.

if (SData == Nonlinear_dependence){
double x1 [];
MathRandomUniform(-5,5,data_,x1);
double x2 [];
MathRandomUniform(-5,5,data_,x2);
double y[];
MathRandomUniform(-5,5,data_,y);


obtenemos este resultado.

Коэффициент корреляции (X1, Y) = 0.0283
Коэффициент корреляции (X2, Y) = -0.0097
----------------Nonlinear_dependence-------------
Время выполнения: 13.469 seconds
-----------------------------------
Number observations 1000
HSIC: 0.00028932
p-value: 0.5100
Critical value: 0.0005
Не отвергаем H0: Наблюдения независимы


Ahora las transformamos en sumas (sin pérdida de información).

double sum1 = 0, sum2 = 0, sum = 0;

for (int i=0;i<data_;i++){
x1[i] = (sum1 += x1[i]);
x2[i] = (sum2 += x2[i]);
y[i] = (sum += y[i]);
}


El resultado es "dependiente".

Коэффициент корреляции (X1, Y) = 0.3930
Коэффициент корреляции (X2, Y) = 0.1924
----------------Nonlinear_dependence-------------
Время выполнения: 12.890 seconds
-----------------------------------
Number observations 1000
HSIC: 0.01020060
p-value: 0.0000
Critical value: 0.0009
Отвергаем H0: Наблюдения зависимы
[Eliminado]  
fxsaber #:

Tres filas independientes.


obtenemos este resultado.


Ahora conviértelos en sumas (sin pérdida de información).


El resultado es "dependiente".

La pérdida de información es enorme. Se eliminan la tendencia, la estacionalidad y los ciclos. Se trata de 2 series temporales diferentes.