Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2110

 
elibrarius:
Wenn es einzigartig ist, ist es schief. Zum Beispiel gibt es 100 Zeichenfolgen, von denen 10 eindeutig sind, 2 sind 45 Zeichenfolgen und 8 sind 1. Geteilt durch 5 Quanten, ist es möglich, dass nur 5 durch 1 ausgewählt werden und die 2 repräsentativsten (je 45) übersprungen werden.

Verschiedene Ansätze arbeiten bei verschiedenen Prädiktoren unterschiedlich effektiv, deshalb möchte ich verschiedene Algorithmen haben, um zu verstehen, wie man sie besser auswählen kann. Ich werde meine Forschung teilen, wenn Sie den Code in MT5 übersetzen können.

 
Aleksey Vyazmikin:

Bei einer gleichmäßigen Verteilung würde ich zunächst ein Array mit eindeutigen Werten erstellen und es zum Ausschneiden verwenden.

Es gibt aber auch andere Methoden zur Aufteilung des Netzes:

Uniform - teilen Sie einfach den Wertebereich, z. B. Werte in einer Spalte von 0 bis 100, Schrittmenge = 100/255 = 0,39 nur nicht in Zeilen, sondern in Werten. D.h. 0,0.39,0.78 .... 99.61

Dann können Sie diese Werte verwenden, um die tatsächlich in der Spalte vorhandenen zu finden und Duplikate zu entfernen.


UniformAndQuantiles - suchen Sie einfach die Hälfte der 255/2 = 127 Quanten mit Methode 1 und 128 mit Methode 2 und kombinieren Sie sie in einem Array.

Die übrigen 3 Methoden sind kompliziert - ich habe sie mir nicht angeschaut.

 
Aleksey Vyazmikin:

Dies sind die Sampling-Quantisierungsmethoden für CatBoost - dies sind die Grenzen, nach denen die Aufzählung/Lernverfahren dann ablaufen.

Meine Experimente zeigen, dass das Raster für jeden Prädiktor separat ausgewählt werden sollte, dann wird ein Qualitätsgewinn beobachtet, aber CatBoost kann das nicht, und ich kann kein Raster erstellen, und ich muss Raster erstellen und in eine CSV-Datei hochladen und dann durch sie iterieren, um das Zielverhalten in ihnen zu bewerten. Ich denke, dies ist ein sehr vielversprechender Chip, muss aber den Code in MQL übersetzen.

1) So funktioniert es. Es nimmt eine separate Spalte sortiert und teilt sie in Quanten auf.

2) Das ist genau das, was es tut.

 

Uniform - teilen Sie einfach den Wertebereich, z. B. Werte in einer Spalte von 0 bis 100, Schrittweite = 100/255 = 0,39 nur nicht in Zeilen, sondern in Werten. D.h. 0,0.39,0.78 .... 99.61

Anschließend können Sie diese Werte verwenden, um die tatsächlichen Werte in der Spalte zu finden und Duplikate zu entfernen.


UniformAndQuantiles - suchen Sie einfach die Hälfte der 255/2 = 127 Quanten mit Methode 1 und 128 mit Methode 2 und kombinieren Sie sie in einem Array.

Die anderen 3 Methoden sind kompliziert - ich habe mich nicht damit befasst.

Diese sind komplex und wir sind daran interessiert :)

Und auf UniformAndQuantiles Ich weiß, die Theorie, aber wie man es im wirklichen Leben verstehe ich nicht - wie man den Bereich, in dem so quantum und so quantiles definieren. Hier verstehe ich nicht - oder bis zur Mitte durch eine Methode, und danach durch eine andere - aber es ist verrückt.

 
Aleksey Vyazmikin:

Die Wahl der richtigen Aufschlüsselung hat einen erheblichen Einfluss auf das Ergebnis.

Hier ein Beispiel für den Rückruf - bis zu 50 % Streuung - für mich ist das signifikant.

Wenn ich die Grenzen von 8 bis 512 in 512er-Schritten erhöhe - wenn auch nicht in der Reihenfolge des Histogramms -, sind die Namen ein wenig hinderlich.


Ich experimentiere noch mit der Maschenauswahl, aber es ist bereits offensichtlich, dass es verschiedene Prädiktoren gibt, für die man verschiedene Maschen braucht, um der Logik zu folgen und nicht nur zu passen.

Nehmen Sie 65535 Quanten und machen Sie sich nicht die Mühe. Die Berechnungen werden so genau wie möglich sein.

 
Aleksey Vyazmikin:

Das sind die komplexen, an denen ich interessiert bin :)

Und bei UniformAndQuantiles kenne ich die Theorie, aber ich verstehe nicht, wie man das in der Praxis macht - wie man den Bereich definiert, in dem wir quantisieren und wo wir quantisieren. Hier verstehe ich nicht - oder bis zur Mitte durch eine Methode, und nach einer anderen - aber es ist verrückt.

Ja

 
elibrarius:

1) So funktioniert es. Es nimmt eine separate Spalte, sortiert sie und unterteilt sie in Quanten.

2) Das ist genau das, was es tut- wie kommst du darauf?

Es weiß nicht, wie es die Beziehung zwischen dem Ziel und der Menge der Werte bei der Quantifizierung einschätzen soll. Es teilt das Gitter in eine bestimmte Anzahl von Segmenten auf, wenn möglich für alle Prädiktoren, und das ist nicht immer notwendig. Aber CatBoost weiß, wie man mit gefütterten (separat vorbereiteten) Quantisierungsrastern arbeitet, was ich verwende.

 
elibrarius:

Nehmen Sie 65535 Quanten und machen Sie sich keine Sorgen. Die Berechnungen werden so genau wie möglich sein.

Nein, es wird ein passendes, nicht ein sinnvolles Modell sein!

 
elibrarius:

Ja

Das ist schon seltsam.

 
Aleksey Vyazmikin:

Es weiß nicht, wie es die Beziehung zwischen dem Ziel und der Wertemenge bei der Quantifizierung einschätzen soll. Das Gitter wird, wenn möglich, für alle Prädiktoren in eine bestimmte Anzahl von Abschnitten unterteilt, was jedoch nicht immer erforderlich ist. Aber CatBoost weiß, wie man mit dem eingereichten (separat vorbereiteten) Quantisierungsgitter arbeitet, das ich verwende.

Und wissen Sie wie?

Grund der Beschwerde: