Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3005

 
Maxim Dmitrievsky #:
Es war ein Aufruf zum Nachdenken, bevor man so einen Unsinn macht, wie die anfänglichen Reihen in Graphen, Quanten, Ebenen, Sinuskurven oder was auch immer man sonst erfunden hat, umzuwandeln.
Dass die Aufgabe nicht richtig gestellt ist, sage ich hier schon seit langem, das letzte Mal vor 10-20 Seiten, es gibt mir also nichts beizubringen, ich verstehe alles selbst ganz gut...

Und um die Aufgabe zu transformieren, muss man die Daten transformieren...

Während Sie mir also sagen, ich solle darüber nachdenken, habe ich bereits darüber nachgedacht und ziehe meine Optionen in Betracht.
 
mytarmailS #:
Die Tatsache, dass die Aufgabe nicht richtig eingestellt ist, das habe ich hier schon lange gesagt, das letzte Mal vor 10-20 Seiten, so als ob ich mir nichts beibringen muss, ich verstehe alles ganz gut.....

Und um die Aufgabe zu transformieren, muss man die Daten transformieren...

Während du mir also sagst, ich solle nachdenken, habe ich bereits darüber nachgedacht und gehe die Optionen durch.
Und wieder werden Sie sich etwas einprägen, anstatt zu verallgemeinern.
 
Maxim Dmitrievsky #:
Das Vorhandensein eines konstanten Signals in den Daten bedeutet fast sofort Generalisierung, und Rauschen wird zu Fehlern. Wenn kein Signal vorhanden ist, kommt es zu einer Memorisierung, bei der der Klassifizierungsfehler einfach aus der Überschneidung von Stichproben mit unterschiedlichen Bezeichnungen und gleichen Merkmalswerten besteht. Das zweite Modell hat keinen prädiktiven Wert. Das ist die Antwort auf mein Rebus. Und sie wird durch Tests mit synthetischen und realen Daten bestätigt.

Bei Vorhandensein von Mustern (Wavelets, Shaplets usw.), aber in Abwesenheit eines Signals, funktioniert nur die Unterteilung in trainiert und untrainiert. Das Trainierbare wird klassifiziert, das Untrainierbare wird gefiltert. In diesem Fall funktioniert gutes Auswendiglernen als Filter und Generalisierung als Verallgemeinerung von Mustern.

Wenn es keine ausgeprägten, hartnäckigen Muster gibt (wie auf dem Markt), aber wenn es Ineffizienzen gibt, muss der Ansatz noch verfeinert werden, weil Ineffizienzen nicht immer durch Muster beschrieben werden können. Hier muss man das eine vom anderen trennen: was man sich merken und was man verallgemeinern muss. Algorithmisch.

Die Umwandlung der Daten verändert zwar ihre Darstellung, löst aber nicht das Problem an sich, da letztlich die ursprüngliche Reihe gehandelt wird.

Regelmäßigkeiten haben eine schwankende Wahrscheinlichkeit, die zyklisch sein oder auch ganz verschwinden kann. Ich arbeite mit großen Zeitspannen und habe diese Phänomene beobachtet.

Ich würde sagen, dass es möglich ist, ein Modell für 2008-2017 (10 Jahre) zu trainieren, das bis heute funktioniert. Ein solches Modell wird nur wenige Signale haben - der Recall liegt bei maximal 30 %, aber das bedeutet auch, dass es nur wenige Muster für zehn Jahre gibt, die auch für die nächsten Jahre (Testmuster) funktionieren würden.

Um welche Art von Mustern es sich dabei handelt - zyklisch oder einmalig (vielleicht mit einem Zyklus von zehn Jahren) - lässt sich jedoch noch nicht feststellen, so dass es unmöglich ist, ein Modell auszuwählen, das auch weiterhin funktionieren wird.

Im Idealfall müssen zyklische Muster mit einer Häufigkeit von mindestens einmal alle drei Monate gefunden werden, und dann können wir davon ausgehen, dass das Modell in der Lage ist, aus dem Abwärtstrend herauszukommen.

Ein Paket solcher Modelle, die auf verschiedene zyklische Muster trainiert wurden, wird den Drawdown reduzieren.

Das Wichtigste ist also das Ausgangssignal + Ziel + Prädiktoren mit zyklischer positiver Regelmäßigkeit in Bezug auf das Ziel.


Ihr Ansatz - Schütteln und Sieben - ähnelt der Arbeit eines Goldsuchers - natürlich kann man viel Interessantes und Ungelerntes finden, aber wie kann man sicher sein, dass es stabil ist?

Ich möchte das Datum selbst knacken, und ich habe Ideen in dieser Richtung, aber jetzt möchte ich in die Richtung der Erhöhung der Wahrscheinlichkeit der Stabilität des Modells graben.

 
Aleksey Vyazmikin #:

Ihr Ansatz - Schütteln und Sieben - ist wie die Arbeit eines Goldsuchers - natürlich kann man eine Menge Interessantes und Ungelerntes finden, aber wie kann man sicher sein, dass es stabil ist?

Ich selbst mag es, das Datum zu schütteln, und habe Ideen in dieser Richtung, aber jetzt möchte ich in die Richtung der Erhöhung der Wahrscheinlichkeit der Stabilität des Modells graben.

Ich habe ein Grundverständnis geschrieben, ohne das es sich nicht lohnt, überhaupt etwas zu tun. Und sei es nur, um jeden der Punkte zu bestätigen (falls man es nicht beim ersten Mal verstanden hat 🙂 )

Um die Stabilität zu überprüfen, Tests, Tests und nochmals Tests, sonst nichts. MO ist dafür am besten geeignet.

Denn theoretische Nörgler reden viel über Tsos und anderen Unsinn, ohne die Grundlagen von MO überhaupt zu verstehen, wie es scheint. Diese Unterhaltung ist nichts für geistige und moralische Schwächlinge, es ist einfacher zu jammern :).
 
Maxim Dmitrievsky #:
Ich habe ein Grundverständnis geschrieben, ohne das es sich nicht lohnt, überhaupt etwas zu tun. Und sei es nur, um jeden Punkt zu bestätigen (falls Sie ihn nicht beim ersten Mal verstanden haben 🙂 )

Um die Stabilität zu überprüfen, Tests, Tests und nochmals Tests, sonst nichts. MO ist dafür am besten geeignet.

Ich bestreite Ihre Beschreibungen und den Ansatz im Allgemeinen nicht - ich selbst habe ihn vor langer Zeit im Wesentlichen beschrieben, wenn auch mit einer anderen Umsetzung.

Meine künstlichen Experimente haben gezeigt, dass es oft ausreicht, Zeilen mit 10 einfachen Regelmäßigkeiten herauszuziehen (in meinem Fall ein Quantensegment, in dem der Prädiktorwert fiel), dass die gesamte Stichprobe die Wahrscheinlichkeit um 15-20% in Richtung eins verschiebt, während die Stichprobe um 35% reduziert wird. Dies kann mit Methoden des maschinellen Lernens nicht erreicht werden. Im Grunde handelt es sich dabei um das Auslaugen unbrauchbarer/widersprüchlicher Daten. Wir wollen dies jedoch näher am aktuellen Datum tun, d. h. nicht durch statistische Kenntnis der Historie, sondern durch einige Methoden zur Auswahl nur falscher/widersprüchlicher Muster.

Wenn wir eine Aufgabe stellen, nach der das Modell auf allen Instrumenten funktionieren soll, dann ist das Testen möglich, aber es gibt noch weniger solcher stabilen Muster. Und nur durch die Geschichte zu rasen oder, noch schlimmer, synthetische Muster zu nehmen, halte ich nicht für effektiv. Es ist allenfalls möglich, aus täglichen Inkrementen synthetische Muster zu erstellen, indem man die Tage mischt, aber das ist mir noch nicht möglich. Haben Sie es schon versucht?

 
mytarmailS #:
Ich bin nicht ganz auf dem Laufenden, aber ich frage mich, ob ein Preis durch ein Diagramm dargestellt werden kann und ob dies irgendwelche Vorteile gegenüber der üblichen zweidimensionalen Darstellung hat.
Wer kennt sich damit aus?

Man könnte Mandelbrots Darstellung des Preises als einen Wald von ternären Bäumen nehmen, bei dem jede Bewegung in drei Teile aufgeteilt ist (zwei Bewegungen in dieselbe Richtung und eine Korrektur dazwischen).

Der Vorteil ist der Zugang zur Erfassung von Statistiken über die fraktale Struktur der Preise. Die Nachteile sind die Komplexität der Algorithmen und die Schwierigkeit, nicht in die Zukunft zu schauen.

 
Stanislav Korotky #:

Und was hat das mit den Matrizen und Beispielen für "parallele" Plattformen zu tun, die ich oben genannt habe?

Zum Beispiel nehme ich Matrizen aus dem Link zu keras, rufen Sie für sie:

und erhalte Nullen.

Das Kontrollbeispiel passt nicht.

Die kategoriale Kreuzentropie wird in Klassifikationsmodellen verwendet, bei denen es mehr als zwei Klassen gibt. Und nach Softmax. Softmax wandelt eine Menge von Werten in eine Menge von Wahrscheinlichkeiten um, deren Summe 1 ist.

Versuchen Sie ein Kontrollbeispiel wie dieses:

pred: 0.1, 0.1, 0.2, 0.5, 0.1

wahr: 0, 0, 1, 0, 0, 0

 
Aleksey Vyazmikin #:

Es ist höchstens möglich, aus den Tagesschritten Kunststoffe zu machen, indem man die Tage mischt - aber das ist mir noch nicht möglich. Haben Sie das schon versucht?

Ich verstehe nicht, worauf solche Annahmen beruhen, und auch hier geht es um die Arbeit mit Merkmalen, nicht um die Verbesserung der Lernmethode. Es ist also sekundär.

Das ist wie in der Schule. Man kann aus einem Lehrbuch unterrichten und aus einem anderen. Die Informationen werden sich im Wesentlichen nicht ändern, genau wie bei Transformationen. Aber es fliegt in den einen Kopf hinein und aus dem anderen heraus :)

Es ist schwierig, mit Kunststoffen zu arbeiten, wenn das Endziel nicht klar ist. Es ist besser, damit einige Eigenschaften von Sequenzen zu testen, sie in verschiedene Teile zu mischen und zu sehen, wie sich die Ergebnisse verändern. Zum Beispiel: Was wäre wenn? Um Offsets in den Daten noch auszurichten.
Es ist im Allgemeinen nützlich, um die Verallgemeinerbarkeit zu verbessern, indem es die Erinnerung an die ursprünglichen Daten verringert, aber es ist immer noch unvollständig, wenn es darum geht, einen fertigen TS zu erstellen. Ein ähnliches Ergebnis kann mit den Originaldaten erzielt werden, wenn ein Ensemble verschiedener Modelle trainiert wird, das einfache bis hin zu linearen Modellen umfasst.

Nun, Sie kennen die ungefähre Antwort, dass es immer noch unmöglich ist, dadurch etwas Hervorragendes zu erhalten, aber es ist möglich, es zu verbessern.

 
Aleksey Nikolayev #:

Wir können Mandelbrots Darstellung des Preises als einen Wald aus ternären Bäumen nehmen, in dem jede Bewegung in drei Teile unterteilt ist (zwei Bewegungen in dieselbe Richtung und eine Korrektur dazwischen).

Der Vorteil ist der Zugang zur Sammlung von Statistiken über die fraktale Struktur des Preises. Die Nachteile sind die Komplexität der Algorithmen und die Schwierigkeit, nicht in die Zukunft zu schauen.

Kann sie in Form von assoziativen Regeln dargestellt werden?
 
mytarmailS #:
Kann man sie als assoziative Regeln darstellen?

Ich habe nicht darüber nachgedacht, halte es aber für unwahrscheinlich, da die Reihenfolge der Bewegungen bei Preisen wichtig ist.

Für alle Fälle ein Bild zur Veranschaulichung der Idee von Mandelbrot. Jede Kursbewegung wird, wenn möglich, in drei Bewegungen aufgeteilt (durch Auswahl der maximalen Korrektur innerhalb der Bewegung) und wird dann zu einem Knoten im Baum. Gibt es innerhalb der Bewegung keine Korrektur (oder ist sie kleiner als ein bestimmter Wert), wird sie zu einem Blatt des Baums.


Grund der Beschwerde: