Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1806

 

Hallo Leute

Ich verwende Deep Reinforcement Learning (mit Python) und das Lernen findet bereits statt (wie gezeigt):

Trabalho de aprendizado por reforço profundo


Heute verwende ich gleitende Durchschnitte nur noch als Marktbeobachtung zum Lernen.

Dieses Modell führt mehrere Aktionen durch (kaufen, verkaufen und warten). So konvergiert das Modell nach dem Training bei vielen Aktionen und "wartet" nur noch auf die besten Aktionen.

Bei diesem Modell ist das Training jedoch sehr langsam, da es alle Ticks verwendet.

Was schlagen Sie als Marktbeobachtungsdaten vor, um die Genauigkeit zu verbessern und Verluste zu verringern?

Ich entschuldige mich für meine Übersetzungsfehler.

 
ipsec:

Was schlagen Sie als Marktbeobachtungsdaten vor, um die Genauigkeit zu verbessern und Verluste zu verringern?


1) Erstellen Sie ein Marktmodell und trainieren Sie einen Agenten darin, dies wird die Dimensionalität reduzieren und das Training beschleunigen, auch hier wurde es so gemacht

2) Auswahl der Merkmale, es ist, wie man sagt, eine kreative Aufgabe, wenn es eine Menge von ihnen gibt, dann wird es auch helfen, die Dimensionalität zu reduzieren, es gibt eine Menge von ihnen von Clustering zu pca, umap usw.

Wenn wir Unterstützungs- und Widerstandsniveaus nehmen und uns entscheiden, nur dann zu kaufen oder zu verkaufen, wenn sich der Preis auf diesem Niveau befindet, können wir die Trainingsstichprobe um Größenordnungen reduzieren.

Sie können alle Punkte miteinander kombinieren.

 
ipsec:

Hallo Leute

Ich verwende Deep Reinforcement Learning (mit Python) und das Lernen findet bereits statt (wie gezeigt):


Heute verwende ich gleitende Durchschnitte nur noch als Marktbeobachtung zum Lernen.

Dieses Modell führt mehrere Aktionen durch (kaufen, verkaufen und warten). So konvergiert das Modell nach dem Training in vielen Aktionen, um nur noch mit den besten Aktionen zu "warten".

Bei diesem Modell ist das Training jedoch sehr langsam, da es alle Ticks verwendet.

Was schlagen Sie als Marktbeobachtungsdaten vor, um die Genauigkeit zu verbessern und Verluste zu verringern?

Verzeihen Sie meine Übersetzungsfehler

Verringern Sie die Zecken auf einen akzeptablen Fehler.

Ermitteln Sie die Bereiche, in denen der Fehler den zulässigen Fehler überschreitet, wenn alle Häkchen entfernt werden.

Trainieren Sie das Modell, um solche Bereiche zu finden, wenn es das kann, natürlich))))

 
Maxim Dmitrievsky:

Nun, das sind Zustandsraummodelle, die auch hin und wieder funktionieren.

Und Sie können das Ziel mit einer Trendwende verbinden. Die Aufgabe besteht nicht darin, zu profitieren, sondern zu erkennen und vorherzusagen. Es ist klar, dass es sich um völlig unterschiedliche Aufgaben handelt, NS kann nicht gleichzeitig erkennen und vorhersagen)))) Zielgewinn, Bilanz erkennt Wendepunkte indirekt, ohne direkte Anerkennung.

Nehmen wir tägliche, 4-stündige, stündliche (oder andere) Zickzack-Umkehrungen und betrachten wir zum Beispiel jeden (alle) Zeitrahmen 120 Balken und 120 Ticks vor und nach dem Wendepunkt. Täglich und 4h beobachten nur bis zur nächsten und vorherigen Umkehrung oder wissen nicht, wie man es besser macht. Dann sollte natürlich etwas manuell geschrieben werden, um die Daten vorzubereiten.

Oder gibt es etwas Ähnliches.

 
Valeriy Yastremskiy:

Oder Sie können das Ziel an einen Trendwechsel binden. Die Aufgabe besteht nicht darin, zu profitieren, sondern zu erkennen und vorherzusagen. Es ist klar, dass es sich dabei um völlig unterschiedliche Aufgaben handelt, NS kann nicht gleichzeitig erkennen und vorhersagen)))) Zielgewinn, Bilanz erkennt Wendepunkte indirekt, ohne direkte Anerkennung.

Nehmen wir tägliche, 4-stündige, stündliche (oder andere) Zickzack-Umkehrungen und betrachten wir zum Beispiel jeden (alle) Zeitrahmen 120 Balken und 120 Ticks vor und nach dem Wendepunkt. Täglich und 4h beobachten nur bis zur nächsten und vorherigen Umkehrung oder wissen nicht, wie man es besser macht. Dann sollte natürlich etwas manuell geschrieben werden, um die Daten vorzubereiten.

Oder gibt es etwas Ähnliches?

Sie lässt sich sehr leicht durch das Vorhandensein einer Regelmäßigkeit zwischen den Zickzackbrüchen, d. h. durch eine Entropiereduktion, überprüfen. Wenn es einen Unterschied zu jemandem gibt, dann können Sie nachschauen. Aber ich habe solche Dinge nicht gefunden. Es gibt spezielle Pakete, die in der Medizin zur Analyse der DNA und zur Ableitung von Arzneimittelformeln verwendet werden. Rearrangement-Entropie, zum Beispiel, oder kompliziertere Fälle mit Approximatoren, Optimierern wie q-learning
 
ipsec:

Hallo Leute

Ich verwende Deep Reinforcement Learning (mit Python) und das Lernen findet bereits statt (wie gezeigt):


Heute verwende ich gleitende Durchschnitte nur noch als Marktbeobachtung zum Lernen.

Dieses Modell führt mehrere Aktionen durch (kaufen, verkaufen und warten). So konvergiert das Modell nach dem Training in vielen Aktionen, um nur noch mit den besten Aktionen zu "warten".

Bei diesem Modell ist das Training jedoch sehr langsam, da es alle Ticks verwendet.

Was schlagen Sie als Marktbeobachtungsdaten vor, um die Genauigkeit zu verbessern und Verluste zu verringern?

Entschuldigung für meine Übersetzungsfehler.

Ich denke, Deep Reinforcement wird nur für multivariate Aufgaben verwendet, nicht für 1-5-dimensionale, wie z.B. Finanzmärkte. Sie können also einfachere und schnellere Methoden wie REINFORCE mit einem neuronalen Netz oder einem linearen Approximator ausprobieren.

 
Maxim Dmitrievsky:
Dies lässt sich sehr leicht durch das Vorhandensein von Regelmäßigkeiten zwischen Zickzackbrüchen, d. h. Entropiereduktion, überprüfen. Wenn es einen Unterschied zu jemandem gibt, dann können Sie nachschauen. Aber ich habe solche Dinge nicht gefunden. Es gibt spezielle Pakete, die in der Medizin zur Analyse der DNA und zur Ableitung von Arzneimittelformeln verwendet werden. Zum Beispiel die Permutationsentropie oder kompliziertere Fälle mit Approximatoren, Optimierern wie dem q-learning.

Nein, die Regelmäßigkeit der Frakturen funktioniert nicht)))) Etwas, das vor einem Bruch liegt, muss ohne Rücksicht auf die Regelmäßigkeit erfasst werden. Im Allgemeinen besteht die Chance, diejenigen Brüche zu erfassen, die die gleichen Unterschiede zu SB vor dem Bruch aufweisen. Mit normalen Paketen ist das nicht möglich. Und ich glaube nicht, dass es etwas Sinnvolles für einen Bruch in der Mitte des Trends gibt, außer eine zu lange Trenddauer))))

 
Valeriy Yastremskiy:

Nein, die Regelmäßigkeit der Frakturen funktioniert nicht)))) Im Allgemeinen besteht die Chance, diejenigen Frakturen zu erfassen, die dieselben Unterschiede zur SB vor der Fraktur aufweisen. Mit normalen Paketen ist das nicht möglich. Und ich glaube nicht, dass es irgendetwas Sinnvolles für einen Bruch in der Mitte des Trends gibt, außer dass der Trend zu lang ist))))

Nun, ich verstehe, in Analogie zur TF-Korrelation. Kann versuchen

 
Maxim Dmitrievsky:

Ich denke, Deep Reinforcement wird nur für multivariate Aufgaben verwendet, nicht für 1-5-dimensionale, wie z.B. Finanzmärkte. Sie können also einfachere und schnellere Methoden wie REINFORCE mit einem neuronalen Netz oder einem linearen Approximator ausprobieren.

Wenn Sie sich verschiedene TFs ansehen, erhalten Sie mehr Dimensionen))))

 
Maxim Dmitrievsky:

Ich verstehe, in Analogie zur TF-Korrelation. Wir können es versuchen.

Ja. Nur TFs sollten alle gesehen werden, es ist unmöglich zu bestimmen, welche auf einmal benötigt werden. Vielleicht wären ein oder zwei TFs besser, vielleicht werden aber auch alle benötigt))). Es ist schwierig, das zu durchdenken.))

Grund der Beschwerde: