Diskussion zum Artikel "Das Hilbert-Schmidt-Unabhängigkeitskriterium (HSIC)" - Seite 2

 
Maxim Dmitrievsky #:


Ich habe auch festgestellt, dass es oft schneller ist, schnelle MO-Modelle zu berechnen, um die Abhängigkeit zu bestimmen, als diese verschiedenen Kriterien, die normalerweise langsamer sind. Obwohl es eigentlich andersherum sein sollte :)
Wir brauchen Zeit, um die Signifikanz zu berechnen, also ist es schnell, die Statistik selbst zu berechnen.
[Gelöscht]  
Evgeniy Chernish #:
Wir brauchen eine Weile, um die Signifikanz zu berechnen, also ist er schnell mit den Statistiken.
Richtig, das habe ich vergessen.
 
Maxim Dmitrievsky #:
eine längere Zeitspanne in Anspruch nehmen.

Dort überschneiden sich die Intervalle (X1, X2, Y) nicht.

 
Evgeniy Chernish #:
Der HSIC kann nicht für nicht-stationäre Reihen verwendet werden. Es ist notwendig, Preisschritte und nicht Preise zu verwenden. Die Pearson-Korrelation zeigt aus demselben Grund eine "Abhängigkeit" an.

Der Rechenaufwand von HSIC ist um viele Größenordnungen (mit Signifikanzprüfungen) höher als der von Pearson, so dass ich ein anderes Ergebnis erwartet habe.

Wenn die Inkremente unabhängig sind, aber ihre Summen plötzlich "abhängig" sind, ist dies ein seltsames Ergebnis für ein so ressourcenintensives Kriterium, selbst in der Theorie.

[Gelöscht]  
fxsaber #:

Dort überschneiden sich die Intervalle (X1, X2, Y) nicht.

Der abgetastete ACF der SB zerfällt noch langsamer oder gar nicht. Grob gesagt, sind dies sinnlose Berechnungen :)

 
Maxim Dmitrievsky #:

Die abgetastete ACF des SB schwächt sich noch langsamer oder gar nicht ab

Ich verstehe nicht, wie dieses Argument auf den Kontext der Diskussion angewendet werden kann.

 

Behauptung.

Wenn wir nach der Umformung der Reihen (ohne Informationsverlust - wir können zum Ausgangszustand zurückkehren) Unabhängigkeit erhalten, dann sind die ursprünglichen Reihen unabhängig.

[Gelöscht]  
fxsaber #:

Ich verstehe nicht, wie man dieses Argument auf den Kontext der Diskussion anwenden kann.

Diese Methoden zeigen nicht das, was man bei nicht-stationären Reihen erwartet. Daher können wir den ACF als Grundlage nehmen und an seinem Beispiel erklären. Wie sich Korrelationen in Abhängigkeit vom Schritt t verändern. Bei der SB ist die Autokorrelation zeitabhängig. Es ist alles geschrieben, man kann es im Internet nachlesen.
Autokorrelation ist die Korrelation der SB mit sich selbst, mit der Verzögerung. Sie ist abhängig von der Zeitverzögerung.
Dies sind die Grundlagen der Zeitreihenanalyse.
Lesen Sie, wie der einfache und der Stichproben-ACF der SB mit der Verzögerung variiert.

Der einzige Unterschied zwischen der im Artikel vorgeschlagenen Methode ist, dass sie mit nichtlinearen Korrelationen arbeitet.
 
fxsaber #:

Genehmigung.

Wenn wir nach der Umformung der Reihen (ohne Informationsverlust - wir können zum Ausgangszustand zurückkehren) Unabhängigkeit erhalten, dann sind die ursprünglichen Reihen unabhängig.

Drei unabhängige Reihen.

if (SData == Nonlinear_dependence){
double x1 [];
MathRandomUniform(-5,5,data_,x1);
double x2 [];
MathRandomUniform(-5,5,data_,x2);
double y[];
MathRandomUniform(-5,5,data_,y);


erhalten wir dieses Ergebnis.

Коэффициент корреляции (X1, Y) = 0.0283
Коэффициент корреляции (X2, Y) = -0.0097
----------------Nonlinear_dependence-------------
Время выполнения: 13.469 seconds
-----------------------------------
Number observations 1000
HSIC: 0.00028932
p-value: 0.5100
Critical value: 0.0005
Не отвергаем H0: Наблюдения независимы


Nun transformieren wir sie in Summen (ohne Informationsverlust).

double sum1 = 0, sum2 = 0, sum = 0;

for (int i=0;i<data_;i++){
x1[i] = (sum1 += x1[i]);
x2[i] = (sum2 += x2[i]);
y[i] = (sum += y[i]);
}


Das Ergebnis ist "abhängig".

Коэффициент корреляции (X1, Y) = 0.3930
Коэффициент корреляции (X2, Y) = 0.1924
----------------Nonlinear_dependence-------------
Время выполнения: 12.890 seconds
-----------------------------------
Number observations 1000
HSIC: 0.01020060
p-value: 0.0000
Critical value: 0.0009
Отвергаем H0: Наблюдения зависимы
[Gelöscht]  
fxsaber #:

Drei unabhängige Reihen.


erhalten wir dieses Ergebnis.


Nun wandeln wir sie in Summen um (ohne Informationsverlust).


Das Ergebnis ist "abhängig".

Der Informationsverlust ist enorm. Trend, Saisonalität und Zyklen werden entfernt. Es handelt sich um 2 verschiedene Zeitreihen.