Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 16

 
Und ich habe einen weiteren Forschungsansatz konzipiert (ich schreibe für die Interessierten, nicht für die, die in der Formelsprache fluchen). Wenn wir eine Abhängigkeit von der Volatilität haben (Abhängigkeit sowohl von den nächsten Lags als auch von der zyklischen - 24 Stunden für H1), warum berechnen wir dann nicht die gleiche gegenseitige Information für die modulo genommenen Renditen (das wird die reine Volatilität sein), und ziehen dann die erhaltene Informationsmenge von den ähnlichen ab (wo die Renditen mit +- Zeichen waren). Wenn alles richtig berechnet ist, dann werden wir eine Vorzeichenabhängigkeit im Rückstand haben. Dieser Fall kann bereits mit einer Rauschzeitreihe verglichen werden.
 
alexeymosc:
Und ich habe einen weiteren Forschungsansatz konzipiert (ich schreibe für die Interessierten, nicht für die, die in der Formelsprache fluchen). Wenn wir eine Abhängigkeit von der Volatilität haben (sowohl von den nächsten Lags als auch von den zyklischen - 24 Stunden für H1), warum berechnen wir dann nicht dieselbe gegenseitige Information für die modulo genommenen Renditen (das wird die reine Volatilität sein) und subtrahieren dann die erhaltene Informationsmenge von den ähnlichen (wo die Renditen mit +- Zeichen waren). Wenn alles richtig berechnet ist, dann werden wir eine Vorzeichenabhängigkeit im Rückstand haben. Dieser Fall kann mit Rauschzeitreihen verglichen werden.

Selbst wenn etwas nichttriviales gefunden wird, stellt sich immer die Frage nach der korrekten Anwendung der Formeln und vor allem nach der Anwendung in der Praxis. D.h. das Interesse ist rein akademisch)))
 
avatara:

Aber könnten Sie, Alexey, genauer formulieren (anhand Ihrer Tabelle), welche Hypothese über die Verteilung der Renditen der Chi-Quadrat-Schätzung entspricht?

Die vordergründig "braune" oder eine kühlere Variante?

Keine. Bei der Schätzung des Chi-Quadrat-Verhältnisses wird keine Hypothese über die Verteilungen aufgestellt. Es handelt sich um ein nicht-parametrisches Kriterium.

 
Mathemat:

Keine. Bei der Schätzung des Chi-Quadrat-Verhältnisses werden keine Verteilungshypothesen aufgestellt. Es handelt sich also um ein nicht-parametrisches Kriterium.

Was meinen Sie mit "keine"?

Können Sie die zu schätzenden Abhängigkeiten aufschreiben?

Vielleicht komme ich nach den Formeln auf die Idee. Oder hoffen Sie auf eine gleichmäßige Verteilung...

;)

 
Avals:

Selbst wenn etwas nichttriviales gefunden wird, bleibt immer die Frage nach der korrekten Anwendung der Formeln und vor allem die Frage, wie sie in der Praxis angewendet werden können. D.h. das Interesse ist rein akademisch)))
Meiner Meinung nach sind die Ergebnisse von Vorhersageexperimenten das wichtigste Kriterium. Wenn es offensichtlich ist, dass die TI-Statistiken helfen, dann ist alles gut. Und um die Formeln natürlich richtig anzuwenden, lese ich jetzt Artikel darüber.
 
avatara: Was meinen Sie mit "keine"?

Kann ich die geschätzte Abhängigkeit aufschreiben?

Vielleicht werde ich nach den Formeln ein Gefühl dafür bekommen. Oder hoffen Sie auf eine gleichmäßige Verteilung...

Nein, ganz und gar nicht, ich sage Ihnen die Wahrheit. Hypothesen non fingo.

Haben Sie schon einmal versucht, das Chi-Quadrat-Kriterium der Unabhängigkeit der Werte anzuwenden? Vor ein paar Monaten wusste ich selbst nicht, wie ich es machen sollte, aber ich habe es einfach getan. Probieren Sie es aus, es ist nicht schwer. Suchen Sie sich ein Matstat-Handbuch für eine Einrichtung außerhalb des Landes und lesen Sie es. Je einfacher und klarer die Methode beschrieben wird, desto schneller werden Sie sie verstehen.

Eigentlich gibt es mehrere Chi-Quadrat-Kriterien. Aber ich spreche von demjenigen, der die Unabhängigkeit der Werte bewertet. Dieses Kriterium bewertet sie nicht auf der Grundlage von a priori gegebenen Verteilungen. Sie testet nur die Hypothese der Unabhängigkeit zweier Variablen auf einem bestimmten Signifikanzniveau (normalerweise 0,95 oder 0,99). Je näher das Signifikanzniveau bei 1 liegt, desto zuverlässiger ist die Schlussfolgerung.

Die ideologische Grundlage des Kriteriums ist die übliche Formel für die gemeinsame Wahrscheinlichkeit von zwei Größen. Zu den Fingern: Wenn P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) für jedes zulässige x1,y1, dann sind X und Y unabhängig. Und vice versa. Und das Chi-Quadrat berechnet, grob gesagt, eine gewichtete Summe der Abweichungen von dieser Gleichheit für alle möglichen Fälle und vergleicht sie mit einem Grenzwert. Ist die erhaltene Summe größer als dieser Grenzwert, so wird die Hypothese der Unabhängigkeit der Variablen (Null) nicht akzeptiert. Ist er kleiner, wird die Nullhypothese nicht abgelehnt.

 
Mathemat:

Überhaupt nicht, ich sage Ihnen die Wahrheit. Hypothesen non fingo.

Haben Sie schon einmal versucht, das Chi-Quadrat-Kriterium der Unabhängigkeit der Werte anzuwenden? Vor ein paar Monaten wusste ich selbst nicht, wie ich es machen sollte, aber ich habe es einfach getan. Probieren Sie es aus, es ist nicht schwer. Suchen Sie sich ein Matstat-Handbuch für eine Einrichtung außerhalb des Landes und lesen Sie es. Je einfacher und klarer die Methode beschrieben wird, desto schneller werden Sie sie verstehen.

In der Tat gibt es mehrere Chi-Quadrat-Kriterien. Aber ich spreche von demjenigen, der die Unabhängigkeit der Werte bewertet. Sie bewertet die Unabhängigkeit nicht auf der Grundlage von A-priori-Verteilungen. Sie testet nur die Hypothese der Unabhängigkeit zweier Variablen auf einem bestimmten Signifikanzniveau (normalerweise 0,95 oder 0,99). Je näher das Signifikanzniveau bei 1 liegt, desto zuverlässiger ist die Schlussfolgerung.

Die ideologische Grundlage des Kriteriums ist die übliche Formel für die gemeinsame Wahrscheinlichkeit von zwei Größen. Zu den Fingern: Wenn P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) für jedes zulässige x1,y1, dann sind X und Y unabhängig. Und vice versa. Und das Chi-Quadrat berechnet, grob gesagt, eine gewichtete Summe der Abweichungen von dieser Gleichheit für alle möglichen Fälle und vergleicht sie mit einem Grenzwert. Ist die erhaltene Summe größer als dieser Grenzwert, so wird die Hypothese der Abhängigkeit der Werte angenommen. Bei einem geringeren Wert wird die Hypothese der Unabhängigkeit nicht verworfen.

Mach dich nicht lächerlich...

Sie wurden nach der Verteilungshypothese gefragt, und diese Methode haben Sie erst gestern kennen gelernt.

Ich möchte immer wieder wissen: Wie lautet die Nullhypothese? Dass sie unabhängig sind?

 

Null - "die Erträge sind unabhängig". Das ist nicht lustig, wirklich!

Keine Hypothese über die von mir getesteten Verteilungen! Das ist ein weiteres Chi-Quadrat. Und ich habe nur die Abhängigkeit getestet!

Wenn Sie die Verteilung überprüfen wollen, bitte sehr. Es ist Laplacian mit anständiger Genauigkeit.

 
Mathemat:

Null - "die Erträge sind unabhängig". Das ist wirklich nicht lustig!

Keine Hypothese über die von mir getesteten Verteilungen! Das ist ein weiteres Chi-Quadrat. Und ich habe nur die Abhängigkeit getestet!

Wenn Sie die Verteilung testen wollen, bitte sehr. Es ist Laplacian mit anständiger Genauigkeit.

Ja.

Schauen wir es uns an.

---

Ist die Hypothese der Unabhängigkeit dasselbe wie die Hypothese einer Gleichverteilung oder einer Normalverteilung?

Genau das möchte ich herausfinden.

Mit "Laplace-ähnlich" macht dann alles Sinn.

 
alexeymosc:
Und ich habe ein Konzept für einen weiteren Forschungsgang entwickelt (ich schreibe für Interessierte, ohne in der Formelsprache zu fluchen). Wenn wir Abhängigkeiten von der Volatilität haben (Abhängigkeit von den nächsten Lags sowie zyklisch - 24 Stunden für H1), warum berechnen wir dann nicht dieselbe gegenseitige Information für die modulo genommenen Renditen (das wäre die reine Volatilität) und subtrahieren dann die erhaltene Informationsmenge von den ähnlichen (wo die Renditen mit +- Zeichen waren). Wenn alles richtig berechnet ist, dann werden wir eine Vorzeichenabhängigkeit im Rückstand haben. Dieser Fall kann bereits mit einer Rauschzeitreihe verglichen werden.

Kann ich es auf meine Weise ausdrücken?

Der gewählte Ansatz zeigt also, dass es Abhängigkeiten gibt. Die offensichtlichste, vernünftigste und mit bloßem Auge sichtbare ist die tägliche Periodizität der Volatilität.

Daher wäre der nächste logische Schritt in meiner Forschung der Versuch, diese offensichtliche und sehr starke Abhängigkeit aus den Daten auszuschließen und zu sehen, ob unsere (Ihre) Methode das Vorhandensein anderer Abhängigkeiten zeigt.

Als Ausschlussmethode schlage ich vor, die Inkremente einfach auf das tägliche Volatilitätsprofil zu beziehen.