Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2553

 
Dmytryi Nazarchuk #:
Logistische Regression
Die Wald/Busch-Regression ist genauer.
 
elibrarius #:

Nein, es ist eine Datenbank mit auswendig gelernter Geschichte...

Das war eine rhetorische Frage:))

 
mytarmailS #:

Das war eine rhetorische Frage :)))

Dass Sie sich mit dem Thema befassen, weiß ich))
Es ist für Neulinge in der MO. Wenn sie hier reinkommen.

 
Vladimir Perervenko #:

Es gibt drei Optionen für die Behandlung der Rauschproben: Löschen, Neuaufteilung (Korrektur der Markierung) und Trennung der Rauschproben in eine eigene Klasse. Nach meiner Erfahrung sind etwa 25 % der Stichprobe "Rauschen". Die Qualitätsverbesserung beträgt etwa 5 % und hängt von den Modellen und der Datenaufbereitung ab. Ich verwende es gelegentlich.

Bei der Verwendung von Prädiktoren gibt es ein weiteres Problem - ihre Drift. Und dieses Problem muss sowohl bei der Prüfung als auch beim Betrieb erkannt und berücksichtigt werden. Im Anhang befindet sich eine Übersetzung des Artikels (suchen Sie nach anderen im Netz) und es gibt ein Drifter-Paket. Sie ist nicht die einzige. Bei der Auswahl der Prädiktoren muss man jedoch nicht nur deren Bedeutung, sondern auch deren Drift berücksichtigen. Bei starken Driftern sollten wir sie verwerfen oder umwandeln, bei geringen Driftern sollten wir sie beim Testen und Arbeiten berücksichtigen (korrigieren).

Viel Glück!

Was meinen Sie mit "gelegentlich anwenden"?

Entweder gibt es eine Art von Pipelining, das sich bewährt hat, oder es ist nur eine müßige Spekulation.

Wenn man Lärm zu einer separaten Klasse macht, wird das Modell theoretisch nicht verbessert (er bleibt im Modell und geht nirgendwo hin).

über Drift - das sind die Grundlagen, der Kompromiss zwischen Verzerrung und Varianz
 
Maxim Dmitrievsky #:
Haben Sie versucht, die Verteilung zukünftiger Kurse vorherzusagen?
 
mytarmailS #:
Haben Sie versucht, die Verteilung zukünftiger Kurse vorherzusagen?

Ich habe so etwas schon gemacht, aber ich verstehe nicht, worum es dabei geht.

Erinnern Sie sich, ich habe künftige Chunks mit fester Länge geclustert und die Clusterzahl vorhergesagt. Jeder Cluster hat eine andere Verteilung, jeder hat eine andere Strategie für jeden. Bei Traine hat es funktioniert, bei den neuen Daten scheitert es, wenn man es frontal macht.
 
Maxim Dmitrievsky #:

etwas Ähnliches gemacht, aber nicht verstanden, worum es dabei ging

Denken Sie daran, dass ich zukünftige Chunks mit fester Länge und vorhergesagter Clusteranzahl geclustert habe. Jeder Cluster hat seine eigene Verteilung, jeder hat seine eigene Strategie. Bei Trayne hat es funktioniert, aber bei neuen Daten schlägt es fehl, wenn man es direkt macht.

Ich erinnere mich...

Ich habe eine etwas andere Idee...

Wenn Sie die Verteilung der künftigen Kurse qualitativ vorhersagen können, z. B. für 50 Kerzen im Voraus, dann können Sie aus dieser Verteilung mehrere tausend Serien ziehen und das Modell trainieren, und auf diese Weise wird das Modell theoretisch für die neuen 50 Kerzen angemessen funktionieren...

 
Ich schaue von Zeit zu Zeit in den Thread, dieselben Gesichter, dieselbe Modelldiskussion, vielleicht hat jemand etwas zu zeigen?
 
Farkhat Guzairov #:
Ich besuche das Thema regelmäßig, die Gesichter sind die gleichen, die Diskussion der Modelle ist die gleiche, vielleicht hat jemand etwas zu zeigen?
Dieses Problem ist nicht zu lösen
Grund der Beschwerde: