Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2634

 

Ein wenig mehr Quasi-Philosophie. Der Kompromiss zwischen Verzerrung und Varianz wird immer die Komplexität des Modells begrenzen. Daher kann man nie sicher sein, dass das Modell für die gesamte Gruppe von Prädiktoren gut funktioniert. Daher stellt sich die Aufgabe, eine funktionierende Teilmenge dieses Modells zu bestimmen. Wenn ich es richtig verstanden habe, hat Maxim kürzlich genau darüber geschrieben (über zwei Modelle). Das ist ganz im Sinne der alten Idee, dass man nicht versuchen sollte, die ganze Zeit auf dem Markt zu sein".

Es wäre schön, wenn man versuchen könnte, dies alles in einem Modell zu vereinen. Zum Beispiel diese Idee (Aleksey Vyazmikin hatte eine etwas ähnliche Idee) - jeden Prädiktor in Segmente zu unterteilen, was eine Aufschlüsselung der gesamten Menge an Prädiktoren in mehrdimensionale Würfel ergibt. Dann wählen wir aus all diesen Würfeln einen Satz geeigneter Würfel aus. Bei großer Dimensionalität wird dieses Problem kombinatorisch unlösbar sein, aber wir können in Analogie zum Zufallsforst eine niedrigdimensionale Menge von Prädiktoren zufällig auswählen. Die anfängliche Segmentierung für jeden Prädiktor kann durch Aufteilung des Eigenkapitals (wenn die Transaktionen nach einem bestimmten Prädiktor und nicht nach der Zeit sortiert sind) in monotone Abschnitte erfolgen.

Ergänzen Sie das Ganze mit Crossvalidation (vorwärts) und all den anderen Dingen, die das sollen) Wahrscheinlich wird es nicht einmal ganz Unsinn sein) Na ja, oder jemand hat so etwas schon einmal gemacht.

 
 
Mikhail Mishanin #:
Nützlicher Artikel.
https://habr.com/ru/company/ods/blog/544208/
Hut. Ein Sammelsurium von verschiedenen statistischen Tests
 
Maxim Dmitrievsky #:
Hut. Ein Sammelsurium von verschiedenen statistischen Tests

Als Thema zum Nachdenken/Verstehen, das

Korrelation != Kausalität

1-4.

Und machen Sie trotzdem Ihre eigenen Tests. Und so ist der Artikel praktisch Werbung)

 
Mikhail Mishanin #:

Als Thema zum Nachdenken/Verstehen, das

Korrelation != Kausalität

1-4.

Und machen Sie trotzdem Ihre eigenen Tests. Und so ist der Artikel praktisch Werbung)

Wer sagt, dass es gleich ist? Wie eine falsche Behauptung aufstellen und sie dann widerlegen
 
Ich frage mich, ob es möglich ist, in synthetischen Daten nach Mustern zu suchen. Lassen Sie mich erklären - aus einer kleinen Stichprobe von 100-200 Beobachtungen, um aus ihrer Verteilung eine Menge von synthetischen Daten zu ziehen und dort bereits für einige komplexe Sequenzen, usw. suchen.
 
mytarmailS #:
Ich frage mich, ob es möglich ist, in synthetischen Daten nach Mustern zu suchen. Lassen Sie mich erklären - aus einer kleinen Stichprobe von 100-200 Beobachtungen, um aus ihrer Verteilung eine Menge von synthetischen Daten zu ziehen und dort bereits für einige komplexe Sequenzen, usw. suchen.
Nicht nach der Logik.
 
Valeriy Yastremskiy #:
Logisch gesehen, nein.
Warum nicht?
 
mytarmailS #:
Und warum?

logisch :-)

PS/ zu wenig Daten und sie werden zu ohlc oder separaten Metriken kastriert

PPS/ Aber wenn Sie regelmäßig solche Proben nehmen, sieht es anders aus. Schauen/Suchen Sie - hier sind einige Muster, was haben sie gemeinsam. Hier darf die Größe der einzelnen Fragmente und ihre Gesamtzahl nicht groß sein. Denn das Hauptmuster, das Sie durch die Bildung einer Reihe von

 
Was verstehen Sie unter regelmäßigen solchen Proben?
Grund der Beschwerde: