Diskussion zum Artikel "Die Vorhersage von Marktbewegungen mittels der Bayes'schen Klassifikation und Indikatoren auf der Basis einer singulären Spektralanalyse" - Seite 2

 
СанСаныч Фоменко:


In Anbetracht des recht hohen Niveaus des Artikels möchte ich den Autor in Zweifel ziehen, nämlich die Notwendigkeit, in diesem Stadium einen Experten zu schreiben. Es gibt in dem Artikel keinen Hinweis darauf, dass man den Ergebnissen der Prüfung eines Sachverständigen vertrauen kann. Nun, wenn wir 2 oder 3 oder sogar 10 Werte für den Gewinnfaktor oder andere Werte vom Prüfer erhalten - ist das eine Statistik? Was ist die Garantie dafür, dass sich der Experte in der ZUKUNFT genauso verhalten wird?

Im Mittelpunkt dieser Zweifel steht die Behauptung des Autors, dass SSA in der Lage ist, auf NICHT stationären Märkten zu funktionieren. Wo ist der Beweis dafür? Ich kann mich nicht an einen solchen Beweis erinnern.

Möglicherweise habe ich in dieser Angelegenheit etwas übersehen. In dem Artikel wird jedoch überhaupt nicht angegeben, welche Arten von Nicht-Stationarität SSA löst und was das Ergebnis ist. Ist es möglich, den Trend zu isolieren? Aber dann ist das Residuum aus der Subtraktion des Trends nicht unbedingt stationär. Diese Frage wird im Rahmen von ARCH-Modellen sehr ausführlich behandelt. Aufgrund der Vielfalt der Residuen ist eine sehr große Vielfalt von ARCH-Modellen entstanden.

Dieser Teil ist nicht in dem Artikel enthalten, und daher gibt es keinen Beweis dafür, dass Handelsentscheidungen auf der Grundlage einer stationären Zeitreihe getroffen werden. Daraus folgt, dass das zukünftige Verhalten des TS auf der Grundlage dieser Ideen NICHT vorhersehbar ist.


PS.

Vor etwa 10 Jahren habe ich "caterpillar" (FATL-SATL) verwendet. Expert Advisors lebte von 3 bis 6 Monate, dann begann zu entwässern. Das Hauptproblem liegt nicht nur in der NICHT-Stationarität im klassischen Sinne (MO und Streuung ändern sich), sondern auch in der sich ändernden Periodizität, die deutlich in ZZ zu sehen ist.


Die Tatsache, dass die PCA zur Analyse nicht-stationärer Zeitreihen verwendet wird, ist keine "Autorenaussage", sondern eine Eigenschaft der Methode, die auf der Bildung einer eigenen orthogonalen Basis beruht, die für ein bestimmtes Fragment der Zeitreihe am optimalsten ist. Tatsächlich ist sogar ein Trend oder eine Periodizität bereits nicht-stationär. Daher werden Handelsentscheidungen nicht auf der Grundlage einer stationären Reihe getroffen, da wir keine solche Reihe haben und es keine Annäherung an sie gibt (im Gegensatz zu ARMA-Modellen). Das Modell basiert auf der Darstellung von Zeitreihen als Summe von Trend-, periodischen (mit wechselnder Periode) und Rauschkomponenten. Das Rauschen im Modell wird nicht kontrolliert und gefiltert, und für stabile Komponenten gibt es eine Vorhersage für die sehr nahe Zukunft. Die Methode geht von lokaler Stabilität, nicht von Stationarität der preisbildenden Prozesse aus. Zweitens gibt auch niemand Garantien. Wir sprechen davon, dass das Training des Modells auf einer willkürlich gewählten Menge historischer Daten stabile Ergebnisse bei seiner Anwendung auf andere Reihen und Zeitskalen gezeigt hat. Wie dauerhaft diese Ergebnisse sind, ist eine andere Frage, aber meiner Meinung nach lässt sich das kontrollieren, zum Beispiel indem man das Modell vor dem Handel auf die "jüngste Vergangenheit" anwendet. Auch das erneute Trainieren nimmt ein wenig Zeit in Anspruch. Wichtiger ist es, wiederum aus meiner Sicht, mögliche "Fehleinstiege" zuverlässiger herauszufiltern und Risiken zu reduzieren, und das erfordert einen weiteren Ausbau des Expert Advisors mit Kontrollmethoden, zum Beispiel: Begrenzung der Trades des Bots nach Zeitplan, Erweiterung des Indikatorensatzes für die Bayes'sche Analyse oder mit Hilfe von neuronalen Netzen. Und die Ergebnisse der laufenden Tests werden zeigen, ob die bereits verfügbaren Filter funktionieren oder ob sie weiterentwickelt werden müssen. Der einzige Beweis für die Eignung wird, wie immer, die Praxis sein.
 
Roman Korotchenko:

Das Rauschen im Modell wird nicht kontrolliert und gefiltert....


Der Schlüsselsatz in Ihrem Beitrag ist für mich der obige.

Rauschen kann und sollte gefiltert werden, wenn es stationär oder besser normalverteilt ist. Wenn das Rauschen nicht stationär ist, und aus dem Artikel geht nicht hervor, welche Art von Rauschen nach der SSA-Filterung verbleibt, dann kann es unter keinen Umständen gefiltert werden. Darauf beruhen alle ARCH-Modelle, denn der Hund liegt immer in dicken Schwänzen begraben, die in der Rauschverteilung nicht immer vorkommen, aber wenn sie auftreten, dann leeren sie auf jeden Fall das Depot.


Man kann Ihre Idee auch von der anderen Seite her angehen.

Der Punkt ist, dass Sie einen Klassifikator verwenden, der von SSA trainierte Prädiktoren eingibt. In diesem Fall ist mir persönlich die Bedeutung der Stationarität der verwendeten Prädiktoren nicht ganz klar, aber es gibt bewährte Anforderungen an die Prädiktoren, die in den Input des Klassifikators eingespeist werden - sie sollten von Rauschen bereinigt werden, d. h. von solchen, die eine "schwache Beziehung zur Zielvariablen haben (nicht zu verwechseln mit dem oben erwähnten Rauschen). Das Interessanteste ist, dass jede Art von Glättung (Trends) bei diesem Ansatz als Rauschen bezeichnet wird. All dies ist in der Abteilung für maschinelles Lernen verfügbar.


Wie auch immer Sie es aufschneiden....


PS.

Die Praxis ist das Kriterium der Wahrheit, aber nur, wenn diese Praxis auf der Theorie beruht.

 
СанСаныч Фоменко:


In Ihrem Beitrag ist der Schlüsselsatz für mich der zitierte.

Rauschen kann und sollte gefiltert werden, wenn es stationär und vorzugsweise normalverteilt ist. Und wenn das Rauschen nicht stationär ist, und aus dem Artikel geht nicht hervor, welches Rauschen nach der SSA-Filterung übrig bleibt, dann kann es unter keinen Umständen gefiltert werden. Darauf beruhen alle ARCH-Modelle, denn der Hund liegt immer in dicken Schwänzen begraben, die nicht immer in der Rauschverteilung vorkommen, aber wenn sie auftreten, dann sind sie sicher, um das Depot zu leeren.


Mit anderen Worten: Niemand hebt den Schmetterlingseffekt auf :)
 
SSA ist die Hauptkomponentenmethode, richtig?
 
Комбинатор:
SSA ist eine Hauptkomponentenmethode, richtig?

Eher eine FFT.
 
Комбинатор:
SSA ist die Hauptkomponentenmethode, richtig?


Sie ist ihr ähnlich. Die Algorithmen sind etwas anders. Eine allgemeine Beschreibung finden Sie in Loskutkov A.Yu. "Zeitreihenanalyse. MSU lecture course". Sie kann zur Vorhersage entweder durch "Caterpillar" oder durch Autoregression verwendet werden.

Im Gegensatz zur Fourier-Methode extrahiert die PCA sowohl Komponenten mit modulierter Amplitude und Frequenz als auch nicht-periodische Komponenten.

Was das zu untersuchende Rauschen betrifft, so wird in einem nächsten Schritt SSA mit Box-Jenkinson-Modellen (ARPSS usw.) kombiniert, und diese Modelle arbeiten mit dem "Rest" des durch CCA erhaltenen Trends.

Es wird argumentiert, dass ein Modell, das den GARCH-Prozess mit einem Modell kombiniert, das das Verhalten des Mittelwerts beschreibt, vom Standpunkt der Vorhersage aus vielversprechend ist. Als Option ist es möglich, GARCH+SSA im Expert Advisor weiter zu implementieren.

Man sollte den "Grad der Zufälligkeit" der Reihe auf dem verwendeten Zeithorizont nicht übersehen. Wenn sie "außerhalb der Skala" liegt, wird die Vorhersage des perfektesten Modells nichts Gutes bringen und der Prozess ist nicht durch ein langes Gedächtnis gekennzeichnet. Daher ist es logisch, in Zukunft die Schätzung der Serienfraktalität(ähnlich dem Hurst-Exponenten ) hinzuzufügen, um die "Farbe" des Rauschens herauszufinden und den aktuellen Preisprozess zu klassifizieren. Daraus ergibt sich, dass ein zuverlässiger Experte in erster Linie das Risikoniveau für das von ihm verwaltete Kapital überwachen und optimieren sollte.

 
Roman Korotchenko:

Man sollte den "Grad der Zufälligkeit" der Reihe für den verwendeten Zeithorizont nicht übersehen. Wenn sie "außerhalb der Skala" liegt, wird die Vorhersage des besten Modells nichts Gutes bringen, und der Prozess ist nicht durch ein langes Gedächtnis gekennzeichnet. Daher ist es logisch, in Zukunft die Schätzung der Serienfraktalität(ähnlich dem Hurst-Exponenten ) hinzuzufügen, um die "Farbe" des Rauschens zu ermitteln und den aktuellen Preisprozess zu klassifizieren. Dies legt nahe, dass ein zuverlässiger Experte in erster Linie das Risikoniveau des von ihm verwalteten Kapitals überwachen und optimieren sollte.

Der "Grad der Zufälligkeit" ist also der Hauptgrund dafür, dass Ihr Modell niemals funktionieren wird, daher würde ich es nicht als großartig, sondern eher als wahnhaft bezeichnen. Es ist ein 50/50-Ratespiel. Wer hat Ihnen überhaupt gesagt, dass die Marktprozesse häufiger persistent als antipersistent sind, zum Beispiel.... und dass es überhaupt periodische Zyklen gibt. Die Bildschirme zeigen typische Vorhersagen dieser Art von Systemen, die ungefähr nichts.....

Aber ich bewundere Ihr Verständnis und Ihre Erfahrung in der Mathematik und im Aufbau von Modellen, dafür natürlich 5++++... damit es nicht so aussieht, als würde ich alles und jeden kritisieren :)


 
Stanislav Korotky:

Mehr wie FFT.
Oops, ugh, ja, total verwirrt. Na dann, noch mehr unnützes Zeug )
 
Maxim Dmitrievsky:

Der "Grad der Zufälligkeit" ist also der Hauptgrund dafür, dass Ihr Modell nicht funktioniert, daher würde ich es nicht als schön, sondern eher als wahnhaft bezeichnen. Es ist ein 50/50-Ratespiel. Wer hat Ihnen überhaupt gesagt, dass die Marktprozesse häufiger persistent als antipersistent sind, zum Beispiel.... und dass es überhaupt periodische Zyklen gibt. Die Bildschirme zeigen typische Vorhersagen dieser Art von Systemen, die ungefähr nichts.....

Aber ich bewundere Ihr Verständnis und Ihre Erfahrung in der Mathematik und im Aufbau von Modellen, dafür natürlich 5++++... damit es nicht so aussieht, als würde ich alles und jeden kritisieren :)



Wenn Sie glauben, dass alle Bewegungen auf dem Markt zufällig sind, irren Sie sich gewaltig. Alle modernen Modelle versuchen, den Effekt der Vorgeschichte zu berücksichtigen - "heavy tails", weil sie "Vorläufer" des weiteren Verhaltens enthalten. Die Hauptaufgabe des Modells besteht darin, die Signale der Vorläufer aus dem Rauschen zu extrahieren, und das Problem des Modells ist seine Angemessenheit für die Situation und seine Anpassungsfähigkeit.
 
Roman Korotchenko:

Wenn Sie glauben, dass alle Bewegungen auf dem Markt zufällig sind, irren Sie sich gewaltig. Alle modernen Modelle versuchen, die Auswirkungen der Vorgeschichte - "heavy tails" - zu berücksichtigen, weil sie "Vorläufer" des weiteren Verhaltens enthalten. Die Hauptaufgabe des Modells besteht darin, die Signale der Vorläufer aus dem Rauschen zu extrahieren, und das Problem des Modells ist seine Angemessenheit für die Situation und seine Fähigkeit zur Anpassung.

Es gibt keine einzige Quelle, die die Preise auf dem Markt beeinflusst, so dass die Ausgangsbedingungen für die Entwicklung dieser oder jener Situation spontan entstehen und sich gegenseitig überlagern. Angenommen, wir haben einige Ausgangsbedingungen gefunden, die die Situation weiterhin beeinflussen, wie können wir dann sicher sein, dass beim nächsten Balken nicht eine andere Einflussinformation auftaucht, die wieder alles zunichte macht? Wo liegen die Kriterien für die Beurteilung der Zuverlässigkeit der Prognose?