Diskussion zum Artikel "Kolmogorov-Smirnov-Test bei zwei Stichproben als Indikator für die Nicht-Stationarität von Zeitreihen" - Seite 2
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Es ist interessant, iSmirnovDistance mit der fraktalen Dimension zu vergleichen (wie diese https://www.mql5.com/en/code/20586).
Im Allgemeinen ist der Artikel gut.
Für mich ist das Zeitfenster für die Beobachtungen zu klein.
Aber selbst wenn wir dieses kleine Fenster nehmen, macht es vielleicht Sinn, es nicht mit einem benachbarten Fenster zu vergleichen, sondern mit Fenstern des letzten Jahres oder der letzten fünf Jahre? Das wäre dann ein Schachbrett, auf dem wir sehen können, wie viele Fenster ähnlich waren, sie gruppieren und vielleicht klassifizieren können. Und dann nach Mustern und deren wahrscheinlichen Ergebnissen auswerten.
Eugene Chernysh, haben Sie so etwas schon einmal gemacht?
Евгений Черныш #:
Ich verstehe, dass pettit auf Ranks basiert, aber ich habe fast keine Informationen darüber gefunden.
Normalerweise verwende ich die Implementierung aus dem Trend-Paket in R. In der Beschreibung gibt es Hinweise auf Quellen.
Das Beobachtungsfenster ist für mich zu klein.
Aber selbst wenn wir dieses kleine Fenster nehmen, macht es vielleicht Sinn, es nicht mit einem benachbarten Fenster zu vergleichen, sondern mit Fenstern des letzten Jahres oder der letzten fünf Jahre? Das wäre dann ein Schachbrett, auf dem wir sehen können, wie viele Fenster ähnlich waren, sie gruppieren und vielleicht klassifizieren können. Und dann nach Mustern und deren wahrscheinlichen Ergebnissen auswerten.
Imho wäre das typisches P-Hacking.
Das Beobachtungsfenster ist für mich zu klein.
Aber selbst wenn wir dieses kleine Fenster nehmen, macht es vielleicht Sinn, es nicht mit einem benachbarten Fenster zu vergleichen, sondern mit Fenstern des letzten Jahres oder der letzten fünf Jahre? Das wäre dann ein Schachbrett, auf dem wir sehen können, wie viele Fenster ähnlich waren, sie gruppieren und vielleicht klassifizieren können. Und dann nach Mustern und deren wahrscheinlichen Ergebnissen auswerten.
Eugene Chernysh, haben Sie so etwas schon einmal gemacht?
Imho würde sich dies als typisches P-Hacking herausstellen.
Wie sehen Sie das? Ich spreche von einer Studie über die Ähnlichkeit von Tagen und die Ähnlichkeit des Verhaltens von Prädiktoren an diesen Tagen.
Ich kenne das Ergebnis nicht, also gibt es keinen Grund, die Studie an das gewünschte Ergebnis anzupassen.
Wenn wir solche Gruppen, selbst innerhalb eines Tages, klassifizieren können, können wir für sie separate Modelle für Prädiktoren mit höherer Wahrscheinlichkeit verwenden.
Die Verteilung der Smirnow-Distanzen ist dieselbe wie bei der Berechnung von zwei aufeinanderfolgenden Tagen.
Wie ist das möglich? Verstehe ich das richtig, dass der letzte Tag und der Tag vor 100 Tagen ähnliche geschätzte Metriken haben werden, als ob der letzte Tag und der vorletzte Tag nicht ähnlich wären? D.h. der Unterschied bewegt sich innerhalb einer engen Spanne?
Aber Sie können Statistiken über die durchschnittliche Anzahl von Tagen zwischen zwei Ablehnungen der Nullhypothese der Homogenität erstellen. So erhält man eine Vorstellung davon, wie viel Zeit im Durchschnitt vergeht, bis sich eine neue Verteilung auf dem Markt etabliert hat.
Nun, es ist auch interessant, sich das Histogramm der Häufigkeit von Verteilungsänderungen anzusehen.
Wie sehen Sie das?
Wie üblich, mehrere Wiederholungen desselben Tests für dieselben Daten. Wenn es N Tage gibt, dann ist die Anzahl der Wiederholungen des Tests N*(N-1)/2 (die Anzahl der Tagespaare). Sie muss N/2 sein.
Nicht, dass ich jemandem verbieten möchte, dies zu tun, aber imho ist dies der erste Schritt zur Selbsttäuschung.