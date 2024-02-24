Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3226
Vielleicht sollten wir versuchen, das Problem der Generierung neuer Daten durch Annäherung zu lösen?
Nehmen Sie ein Fenster und versuchen Sie, darin eine numerische Reihe mit unterschiedlicher Genauigkeit zu beschreiben, wobei dieser Ansatz es ermöglichen wird, die Dynamik der Preisbewegung global zu speichern, einschließlich der täglichen Schwankungen.
Außerdem reicht es aus, die Geschichte in Form von Approximationskoeffizienten zu speichern.
Ihr TC sucht nicht nach allen Mustern, die es geben könnte. Deshalb müssen Sie ihn abgleichen
Dann stehen wir vor dem "Huhn und Ei"-Problem:
Alle diese Entwickler sind weit vom Handel entfernt. Anstelle von Average sollte es Median sein.
Klingt gut. Wenn ich mir die Artikel zum Thema IDC-Forschung ansehe, beginne ich fast sofort an ihren Ansätzen zu zweifeln, wenn unter der Annahme, dass sie rund um die Uhr gelten, nach Regelmäßigkeiten gesucht wird.
Abhängigkeit mit einer Länge von 1000 Ticks
Und 5.000 Ticks obendrein.
Bei Ticks ist eine solche Wahl des Fensters seltsam. Es ist logisch, an Zeitstempel zu binden, nicht an Tick-Indizes.
Es gibt einen Fehler an dieser Stelle: es sollte time_msc sein. Das hat aber keine Auswirkung auf die Ergebnisse nach dem Posting.
https://disk.yandex.ru/d/6F8FdUGthpnk3A
.
Sehen Sie sich an, wie unterschiedlich die Kurven im Stichprobenintervall (zwischen den blauen Linien) sind.
Das deutet darauf hin, dass man eher entfernte als nahe Parametersätze erhält. Wenn man von einer verrauschten Zielfunktion ausgeht, erhält man Ergebnisse in der Nähe von verschiedenen Hügeln.
Es ist klar, dass, wenn man den GA nicht unterbricht, sondern bis zur Fertigstellung wartet, eine Spitze gefunden wird. Und alle 20 besten Durchläufe werden von dort aus erfolgen - die Musterkurven werden fast gleich sein. Dies ist nicht von Nutzen.
Wenn Sie die GA nicht unterbrechen, sondern warten, bis sie beendet ist, wird ein Spitzenwert gefunden. Und alle 20 besten Durchgänge werden von dort stammen - die Musterkurven werden fast gleich sein.
Ich habe diese Aussage mit demselben VDC ohne Unterbrechung der GA überprüft.
Es ist gut zu sehen, dass es unter diesen 20 unähnliche Gruppen gibt. Dies deutet eher darauf hin, dass der reguläre GA seine Aufgabe nicht erfüllt hat. Genauer gesagt, hat er sich selbst unterbrochen, indem er die Ergebnisse von verschiedenen Spitzenwerten in die Top 20 platziert hat.
Klingt gut. Wenn ich mir Artikel zum Thema Tsvr-Forschung ansehe, beginne ich fast sofort, an ihren Ansätzen zu zweifeln, wenn nach Mustern gesucht wird und davon ausgegangen wird, dass sie rund um die Uhr verfügbar sind.
Ich kann Ihnen sagen, dass eine zeitliche Aufteilung nicht für alle Prädiktoren eine sinnvolle Wahrscheinlichkeitsverzerrung ergibt, zumindest nicht für mich. Ich neige also zu der Ansicht, dass die Zeit ein wichtiger Faktor ist, aber auch andere, wichtigere Faktoren können das Ergebnis beeinflussen, wenn sie sich in der aktiven Phase befinden.
Ich denke auch, dass man im Fenster einfach ein anderes Quantifizierungsraster für den Preis nehmen kann, mit einer großen Anzahl von Intervallen (für eine genauere Erhaltung der Struktur), und auf ein solches "komprimiertes Signal" testen kann - es wird bereits Abweichungen aufweisen. Oder Sie können eine kleine Anzahl von Intervallen plus zufälliges Rauschen im Referenzbereich zwischen zwei Intervallen verwenden.Sie können sogar das Raster fixieren und nur den Offset für die erste Referenz speichern. Dann braucht es nur wenig Platz und die Umwandlung sollte schnell gehen.
Und mit einer Länge von 5 Kilometern, um das Ganze abzurunden
https://disk.yandex.ru/d/1ypCrzYKk82XdA
Es scheint, dass ein Optimierungsdiagramm zeigen kann, wie schwierig der Suchprozess ist. Also los geht's.
Leider sind das alles Hypothesen, die erst einmal implementiert und getestet werden müssen.@Maxim Dmitrievsky versucht seine Varianten, ich versuche meine.