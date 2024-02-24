Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3005
Es war ein Aufruf zum Nachdenken, bevor man so einen Unsinn macht, wie die anfänglichen Reihen in Graphen, Quanten, Ebenen, Sinuskurven oder was auch immer man sonst erfunden hat, umzuwandeln.
Die Tatsache, dass die Aufgabe nicht richtig eingestellt ist, das habe ich hier schon lange gesagt, das letzte Mal vor 10-20 Seiten, so als ob ich mir nichts beibringen muss, ich verstehe alles ganz gut.....
Das Vorhandensein eines konstanten Signals in den Daten bedeutet fast sofort Generalisierung, und Rauschen wird zu Fehlern. Wenn kein Signal vorhanden ist, kommt es zu einer Memorisierung, bei der der Klassifizierungsfehler einfach aus der Überschneidung von Stichproben mit unterschiedlichen Bezeichnungen und gleichen Merkmalswerten besteht. Das zweite Modell hat keinen prädiktiven Wert. Das ist die Antwort auf mein Rebus. Und sie wird durch Tests mit synthetischen und realen Daten bestätigt.
Regelmäßigkeiten haben eine schwankende Wahrscheinlichkeit, die zyklisch sein oder auch ganz verschwinden kann. Ich arbeite mit großen Zeitspannen und habe diese Phänomene beobachtet.
Ich würde sagen, dass es möglich ist, ein Modell für 2008-2017 (10 Jahre) zu trainieren, das bis heute funktioniert. Ein solches Modell wird nur wenige Signale haben - der Recall liegt bei maximal 30 %, aber das bedeutet auch, dass es nur wenige Muster für zehn Jahre gibt, die auch für die nächsten Jahre (Testmuster) funktionieren würden.
Um welche Art von Mustern es sich dabei handelt - zyklisch oder einmalig (vielleicht mit einem Zyklus von zehn Jahren) - lässt sich jedoch noch nicht feststellen, so dass es unmöglich ist, ein Modell auszuwählen, das auch weiterhin funktionieren wird.
Im Idealfall müssen zyklische Muster mit einer Häufigkeit von mindestens einmal alle drei Monate gefunden werden, und dann können wir davon ausgehen, dass das Modell in der Lage ist, aus dem Abwärtstrend herauszukommen.
Ein Paket solcher Modelle, die auf verschiedene zyklische Muster trainiert wurden, wird den Drawdown reduzieren.
Das Wichtigste ist also das Ausgangssignal + Ziel + Prädiktoren mit zyklischer positiver Regelmäßigkeit in Bezug auf das Ziel.
Ihr Ansatz - Schütteln und Sieben - ähnelt der Arbeit eines Goldsuchers - natürlich kann man viel Interessantes und Ungelerntes finden, aber wie kann man sicher sein, dass es stabil ist?
Ich möchte das Datum selbst knacken, und ich habe Ideen in dieser Richtung, aber jetzt möchte ich in die Richtung der Erhöhung der Wahrscheinlichkeit der Stabilität des Modells graben.
Ich habe ein Grundverständnis geschrieben, ohne das es sich nicht lohnt, überhaupt etwas zu tun. Und sei es nur, um jeden Punkt zu bestätigen (falls Sie ihn nicht beim ersten Mal verstanden haben 🙂 )
Ich bestreite Ihre Beschreibungen und den Ansatz im Allgemeinen nicht - ich selbst habe ihn vor langer Zeit im Wesentlichen beschrieben, wenn auch mit einer anderen Umsetzung.
Meine künstlichen Experimente haben gezeigt, dass es oft ausreicht, Zeilen mit 10 einfachen Regelmäßigkeiten herauszuziehen (in meinem Fall ein Quantensegment, in dem der Prädiktorwert fiel), dass die gesamte Stichprobe die Wahrscheinlichkeit um 15-20% in Richtung eins verschiebt, während die Stichprobe um 35% reduziert wird. Dies kann mit Methoden des maschinellen Lernens nicht erreicht werden. Im Grunde handelt es sich dabei um das Auslaugen unbrauchbarer/widersprüchlicher Daten. Wir wollen dies jedoch näher am aktuellen Datum tun, d. h. nicht durch statistische Kenntnis der Historie, sondern durch einige Methoden zur Auswahl nur falscher/widersprüchlicher Muster.
Wenn wir eine Aufgabe stellen, nach der das Modell auf allen Instrumenten funktionieren soll, dann ist das Testen möglich, aber es gibt noch weniger solcher stabilen Muster. Und nur durch die Geschichte zu rasen oder, noch schlimmer, synthetische Muster zu nehmen, halte ich nicht für effektiv. Es ist allenfalls möglich, aus täglichen Inkrementen synthetische Muster zu erstellen, indem man die Tage mischt, aber das ist mir noch nicht möglich. Haben Sie es schon versucht?
Ich bin nicht ganz auf dem Laufenden, aber ich frage mich, ob ein Preis durch ein Diagramm dargestellt werden kann und ob dies irgendwelche Vorteile gegenüber der üblichen zweidimensionalen Darstellung hat.
Man könnte Mandelbrots Darstellung des Preises als einen Wald von ternären Bäumen nehmen, bei dem jede Bewegung in drei Teile aufgeteilt ist (zwei Bewegungen in dieselbe Richtung und eine Korrektur dazwischen).
Der Vorteil ist der Zugang zur Erfassung von Statistiken über die fraktale Struktur der Preise. Die Nachteile sind die Komplexität der Algorithmen und die Schwierigkeit, nicht in die Zukunft zu schauen.
Und was hat das mit den Matrizen und Beispielen für "parallele" Plattformen zu tun, die ich oben genannt habe?
Zum Beispiel nehme ich Matrizen aus dem Link zu keras, rufen Sie für sie:
und erhalte Nullen.
Das Kontrollbeispiel passt nicht.
Die kategoriale Kreuzentropie wird in Klassifikationsmodellen verwendet, bei denen es mehr als zwei Klassen gibt. Und nach Softmax. Softmax wandelt eine Menge von Werten in eine Menge von Wahrscheinlichkeiten um, deren Summe 1 ist.
Versuchen Sie ein Kontrollbeispiel wie dieses:
pred: 0.1, 0.1, 0.2, 0.5, 0.1
wahr: 0, 0, 1, 0, 0, 0
Kann man sie als assoziative Regeln darstellen?
Ich habe nicht darüber nachgedacht, halte es aber für unwahrscheinlich, da die Reihenfolge der Bewegungen bei Preisen wichtig ist.
Für alle Fälle ein Bild zur Veranschaulichung der Idee von Mandelbrot. Jede Kursbewegung wird, wenn möglich, in drei Bewegungen aufgeteilt (durch Auswahl der maximalen Korrektur innerhalb der Bewegung) und wird dann zu einem Knoten im Baum. Gibt es innerhalb der Bewegung keine Korrektur (oder ist sie kleiner als ein bestimmter Wert), wird sie zu einem Blatt des Baums.