Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1534

 
Aleksey Vyazmikin:

Indikatoren aus der Stichprobe, an der die Schulung durchgeführt wurde.

Wie sieht es mit der Stichprobe außerhalb der Ausbildung aus? Die nächsten sechs Monate zum Beispiel?

 
Maxim Dmitrievsky:

Sie haben also einen Logloss von ~1, was bedeutet, dass das Modell völlig ausflippt bei dem, was passiert.

Ich bin blind, wo ist der negative Logloss? Ich habe einen Logloss für das gesamte Modell angegeben.

Maxim Dmitrievsky:

Möchten Sie ein separates Logloss für eine einzelne Eingabe finden? D.h. die Menge an Informationen, die zwischen den Werten auf dem Blatt und den Zielwerten liegt?

Ich bin mir nicht sicher, ob logloss das Richtige ist, ich möchte Qualitätsinformationen finden und logloss sucht eher nach der Quantität des gesamten Modells, vielleicht reicht auch die Quantität - ich weiß es nicht. Haben Sie eine Idee, wie man das macht?

Maxim Dmitrievsky:

Die "Nichtstun"-Klasse ist im Vergleich zu den anderen eindeutig unausgewogen, was, wie ich oben schrieb, aufgrund des 3-Klassen-Modells ein solches Problem sein kann. Der Rest der Indikatoren ist deprimierend.

Ja, unausgewogen, aber was soll man machen... Man könnte natürlich auch zwei Stichproben machen, indem man die Stichprobe in Vektoren aufteilt, aber auch hier würde ein Teil der nützlichen Informationen verloren gehen. Im Allgemeinen stimme ich zu, dass die Stichprobe nicht ausgewogen ist, aber ich weiß nicht, wie man das machen kann, ohne Informationen zu verlieren. Ich habe versucht, Linien mit einer kleinen Anzahl von Zielen zu duplizieren, aber der Effekt ist negativ.

 
Aleksey Vyazmikin:

Ich bin blind, wo ist der negative Logloss? Ich habe einen Logloss für das gesamte Modell angegeben.

Ich bin mir nicht sicher, was logloss ist, ich möchte Qualitätsinformationen finden, und logloss sucht eher nach der Quantität des gesamten Modells, vielleicht reicht auch die Quantität - ich weiß es nicht. Haben Sie eine Idee, wie man das macht?

Ja, es ist nicht ausgewogen, aber was soll man machen... Man könnte natürlich zwei Stichproben machen - die Stichprobe in Vektoren aufteilen, aber auch hier würde ein Teil der Informationen, die nützlich sein könnten, verloren gehen. Im Allgemeinen stimme ich zu, dass die Stichprobe nicht ausgewogen ist, aber ich weiß nicht, wie man das machen kann, ohne Informationen zu verlieren. Ich habe versucht, Linien mit einer kleinen Anzahl von Zielen zu duplizieren - der Effekt ist negativ.

Nicht negativ, sondern tendiert zu eins, d. h. zum Maximum. Sie sollte gegen Null tendieren.

logloss zeigt an, wie gut Ihre Merkmale mit dem Ziel korrelieren, grob gesagt, d.h. 0 bedeutet volle Korrelation, d.h. sie beschreiben das Ziel gut. 1 ist überhaupt keine Beschreibung, d. h. sie sind völlig uninformativ. Dies ist insofern ein guter Indikator, als er uns sagt, ob es überhaupt eine Korrelation gibt. Es gibt überhaupt keine Korrelation.

Ich weiß nicht, machen Sie es zu einer normalen 2 Klasse und nicht 3.

 
elibrarius:

Und bei einer Probe außerhalb der Ausbildung, was? Die nächsten sechs Monate zum Beispiel?

Und Probenahme außerhalb der Ausbildung ist ein No-Go... Habe ich nicht, habe für den 1. März 2019 trainiert und beschlossen, dass ich alle Informationen aus 2014 nutzen sollte.

Aber ich beschloss, selbst zu sehen, was diese Bäume geben, steckte es in EA und machte drei Durchgänge mit 3 verschiedenen Bäumen vom 1. März 2019 bis zum 15. September 2019.

1. Erster Teilungsschritt


2. Zwanzigster Teilschritt


3. Achtundvierzigster Schritt der Aufspaltung

Und im Allgemeinen bin ich selbst überrascht, dass alle drei Modelle zu positiven Ergebnissen führen!

Interessanterweise ist das 2. Modell glatter, während das 3. Modell bereits Mühe hat, ins Plus zu kommen.

Interessanterweise hat sich die Genauigkeit der Modelle nicht wesentlich verschlechtert und manchmal sogar verbessert, wie die folgende Tabelle mit den prozentualen Veränderungen im Vergleich zur Trainingsstichprobe zeigt


Über Vollständigkeit und Logloss kann ich nichts sagen - man muss die Indikatoren nehmen und die Stichprobe machen.

Und ja, die meisten Modelle drehen eine Schleife, wenn sie auf Null trainieren, da diese Klasse im Vergleich zu den anderen beiden wirklich überwiegt und Nullen dann leichter zu finden sind - das ist es, was die Dinge durcheinander bringt.

 
Maxim Dmitrievsky:

ist nicht negativ, sondern tendiert gegen eins, d.h. zum Maximum. Sie sollte gegen Null tendieren.

Der Logloss zeigt an, wie stark Ihre Merkmale mit dem Ziel korrelieren, grob gesagt, d.h. 0 bedeutet volle Korrelation, d.h. sie beschreiben das Ziel gut. 1 ist überhaupt keine Beschreibung, d. h. sie sind völlig uninformativ. Dies ist insofern ein guter Indikator, als er uns sagt, ob es überhaupt eine Korrelation gibt. Es gibt überhaupt keine Korrelation.

Ich weiß nicht, machen Sie es zu einer normalen Note 2 statt zu einer Note 3.

Ich bin mir nicht sicher, ob Logloss in Multiklasse eine ist... Im Allgemeinen kann ich nicht herausfinden, wie ich die Formel selbst umsetzen kann - ich verstehe diese Chiffren aus öffentlichen Quellen nicht. Und ich würde gerne Logloss sehen, nicht das endgültige, sondern für die gesamte Probe, wie sie sich verändert und wo sie durchhängt. Und wie ich es verstanden habe, ist es mit einer ausgewogenen Stichprobe korrekter...

 
Aleksey Vyazmikin:

Ich bin mir nicht sicher, ob Logloss für Multiklassifizierung gleich eins ist... Im Allgemeinen kann ich nicht verstehen, wie ich die Formel selbst umsetzen kann - ich verstehe diese Chiffren aus öffentlichen Quellen nicht. Und ich würde gerne Logloss sehen, nicht das endgültige, sondern für die gesamte Probe, wie sie sich verändert und wo sie durchhängt. Und so wie ich es verstehe, ist es in einer ausgewogenen Stichprobe in größerem Maße korrekt...

Ich will uns nicht den Kopf darüber zerbrechen... große Unternehmen wie Yandex machen das schon. Sie sagen: Mach das und es wird dir gut gehen. Tun Sie es einfach und tun Sie es nicht allein. Sie werden in Rhetorik und unterschiedlichen Ansätzen ertrinken.

Es zeigt die Veränderung entlang des Gefälles, indem es Bäume aufbaut
 
Aleksey Vyazmikin:

Und die Probenahme außerhalb der Ausbildung, sozusagen... Habe ich nicht, habe für den 1. März 2019 trainiert und beschlossen, dass ich alle Informationen aus 2014 nutzen sollte.

Aber ich beschloss, selbst zu sehen, was diese Bäume geben, steckte es in EA und machte drei Durchgänge mit 3 verschiedenen Bäumen vom 1. März 2019 bis zum 15. September 2019.

1. Erster Teilungsschritt


2. Zwanzigster Teilschritt


3. Achtundvierzigster Schritt des Splittings

Und im Allgemeinen bin ich selbst überrascht, dass alle drei Modelle zu positiven Ergebnissen führen!

Interessanterweise ist das 2. Modell glatter, während das 3. Modell bereits Mühe hat, ins Plus zu kommen.

Interessanterweise hat sich die Genauigkeit der Modelle nicht wesentlich verschlechtert, manchmal sogar verbessert. Die folgende Tabelle zeigt die prozentualen Veränderungen im Verhältnis zur Trainingsstichprobe


Über Vollständigkeit und Logloss kann ich nichts sagen - man muss die Indikatoren erschießen und die Probenahme durchführen.

Und ja, die meisten Modelle drehen eine Schleife, wenn sie auf Null trainieren, da diese Klasse im Vergleich zu den anderen beiden wirklich überwiegt und Nullen dann leichter zu finden sind - das ist es, was die ganze Sache verdirbt.

Nicht schlecht! Erhöhen Sie das Volumen und schon kann etwas verdient werden)
 
Maxim Dmitrievsky:

Das habe ich bekommen. Gerade verschoben alle Bot-Logik zu Python, Wald mit Boost ersetzt. Ich kann den Fehler nicht finden, anscheinend gibt es keine Peeks. Je nach Einstellung kann acuras auf bis zu 0,7-0,8 erhöht werden, während die Anzahl der Trades reduziert wird.

Scaffold hat ungefähr die gleiche Fehlerspanne, aber es handelt sich nicht um Acuras, sondern um Klassifizierungsfehler. Und in Trayne verhält es sich ähnlich, sogar noch besser. Aber bei der Prüfung ist es viel schlimmer.

Lernen:

Lernen ist 10 Mal größer


Was liegt vor der Haustür? Reine Preise?
 
elibrarius:
Was liegt auf dem Weg dorthin? Reine Preise?

Inkremente

Ich werde den Stecker dieses Wochenende fertigstellen und ihn testen. Ich plane, das Modell in die Cloud hochzuladen und die Signale vom Terminal abzurufen. Ich plane, das Modell in die Cloud zu stellen und Signale vom Terminal zu beziehen. Ich kann Ihnen den Client auf MT5 schicken
 

Ein einfacher und interessanter Ansatz für die Beschreibung von Mustern für MoD

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

A simple algorithm to detect complex chart patterns
A simple algorithm to detect complex chart patterns
  • Kahler Philipp
  • www.quanttrader.com
Finding complex chart patterns has never been an easy task. This article will give you a simple indicator for complex chart pattern recognition. You will have the freedom to detect any pattern with any pattern length. Not just 2-bar candlestick formations, but complex stuff like V-Tops spread over 20 bars. Defining a chart pattern I am using a...