Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 937

 

Ja, Sie können viele Klassen haben. Aber ich habe selten mit Modellen mit mehr als 2 Klassen gearbeitet, es ist immer schwierig und problematisch, vor allem, wenn eine Klasse die anderen überwiegt. Man kann es versuchen, aber ich hoffe nicht auf ein gutes Ergebnis, um ehrlich zu sein.

Jetzt ist es etwas kompliziert - ein Baum ist ein Filter, der weiß, wo man nicht long gehen kann, ein anderer Baum weiß, wo man long gehen kann, und es fehlen 2 ähnliche Bäume für Shorts. Vielleicht wird die Kombination all dieser Informationen in einem Baum die Nachteile der drei Klassen aufwiegen, und das Puzzle wird sich zusammenfügen :)

 
Dr. Trader:

Ja, Sie können viele Klassen haben. Aber ich habe selten mit Modellen mit mehr als 2 Klassen gearbeitet, es ist immer schwierig und problematisch, vor allem, wenn eine Klasse die anderen überwiegt. Man kann es versuchen, aber ich hoffe nicht auf ein gutes Ergebnis, um ehrlich zu sein.

Jetzt ist es etwas kompliziert - ein Baum ist ein Filter, der weiß, wo man nicht long gehen kann, ein anderer Baum weiß, wo man long gehen kann, und es fehlen 2 ähnliche Bäume für Short-Positionen. Vielleicht werden durch die Kombination all dieser Informationen in einem Baum die Nachteile der drei Klassen überwunden, und das Rätsel wird gelöst :)

Man darf gespannt sein, wie das Ergebnis ausfallen wird!

Ich weiß nicht, vielleicht sollte ich neue Ziele mit dummen Gewinnmitnahmen festlegen, dann gäbe es vielleicht mehr Einstiege. Es ist überhaupt nicht klar, mit den Zielen, jetzt viele von ihnen (mit vielen Einträgen) sind stumpf fangen die Umkehr, während ich nicht möchten, um sie zu betreten - ich denke, es gibt keine Gewissheit der Umkehr, aber es gibt Gewissheit der Beendigung der Trend-Bewegung, und man kann erwarten, flach - dh wir bekommen Lärm Ziele dort. Bei einer Datei mit einer geringen Anzahl von Einstiegen sollte es saubere Ziele geben, aber wir werden auch auf verschiedene Arten von Einstiegen stoßen - Einstiege aus einem Flat, Einstiege nach einer Korrektur für die Fortsetzung der Bewegung und Einstiege für eine Umkehrung (z. B. während der Bildung eines Pin Bar auf dem Stunden-TF). Außerdem gibt es so etwas wie ein "offenes Einstiegsfenster", wenn der Einstieg während einer angemessenen Anzahl von Takten hintereinander erlaubt ist - auch dort können Unfallgeräusche auftreten. Ich denke, ich sollte die Ziele aufteilen, um das gleiche Bild zu zeigen.

 
Roffild:

Haben Sie mit der kfold alglib experimentiert? Verbessert sie die Ergebnisse? In einem Ihrer alten Beiträge habe ich gesehen, dass die Probe nicht gemischt wird. Muss das überhaupt sein?

Können Sie anhand derselben Daten feststellen, was weniger übertrainiert - Wald oder mlp? Ich habe den Verdacht, dass der Forest bei Regressionsaufgaben schief arbeitet und Fehler schief (sehr klein) liefert, bei Klassifikationsnormen.

2. Ich habe gesehen, dass es Leute gibt, die sich für OpCl interessieren. Wurde daran gedacht, NS umzuschreiben? Ich habe zum Beispiel GA ganz aufgegeben, da es sich um einen alptraumhaften Unsinn handelt, alles wird jetzt in einem Thread auf einem Kern trainiert. Sie könnten es auf Cl beschleunigen (wenn auch nicht so schnell). Oder, wenn Sie auf Spark trainieren, ist es sowieso parallel und es hat keinen Sinn.

3. mehr oder weniger verstanden haben, was Sie auf den Git setzen und wie Sie es anwenden. Sehr interessante Arbeit, Respekt! :)

 

Hallo)


Ich habe den Code gescannt, auf die Waschmaschine gelegt und sie zum Einlernen eingeschaltet.

Dann habe ich den Code dreimal auf der Nähmaschine genäht, um das neuronale Netz eingehend zu trainieren.

Das Ergebnis ist, dass sich der Code bis zur Unkenntlichkeit verändert hat, und jetzt frage ich mich, wie ich ihn im Handel verwenden soll...

 

Ist der Superbot schon fertig?

Ich warte schon seit zwei Jahren.

 
Maxim Dmitrievsky:

Gibt es irgendwelche Schlussfolgerungen darüber, wer weniger übertrainiert ist - der Wald oder die MLP?

In einem der Pakete befindet sich ein Demo-Beispiel für das prädiktive NS (MLP). Ein relativ unkomplizierter NS, nebenbei bemerkt. Es ist also unwirklich, sie neu zu trainieren. Egal, wie man es umprogrammiert, alles funktioniert.

Die Umschulung hängt also in erster Linie von der Aufgabe ab, die den NS gestellt wird. Nun, und über die Angemessenheit der Komplexität der MLP für diese Aufgabe.

 
Maxim Dmitrievsky:

Ich spreche speziell über alglib und über Tests mit denselben Daten aus verschiedenen Modellen

Ein NS ist ein NS. Es macht keinen Unterschied, ob alglib oder was auch immer. Wenn sich die NS zurückbilden, bedeutet dies, dass sie für die gestellte Aufgabe unzureichend sind und entweder die Aufgabe oder die NS-Struktur geändert werden muss. Und machen Sie sich keine Mühe). Wie ein Stabsfeldwebel zu sagen pflegte - f... (Über die Wälder kann ich nichts sagen, bei ihnen kann ich es nicht.)

Zu den Wäldern kann ich nichts sagen, ich arbeite nicht mit ihnen.

 

Was passiert, wenn wir den Baum auf ein Nicht-Ziel anstatt auf einen Prädiktor trainieren? Werden wir in der Lage sein, auf der Grundlage einer guten Ausbildung nicht-signifikante Prädiktoren zu identifizieren? Das heißt, wenn das Testmodell die Prädiktoren gut erkennt, dann enthalten die anderen Prädiktoren bereits genügend Informationen und der Prädiktor ist redundant und kann verworfen werden. Was aber, wenn es nicht um den Prädiktor geht, sondern um die Redundanz der einzigartigen Kombinationen selbst?

Ich habe mich zum Beispiel entschieden, die Stundenzahl als Ziel zu wählen.

Das Ergebnis für die Trainingsstichprobe


Das Ergebnis auf dem Prüfmuster


Sie sehen, dass 10 Uhr gut vorhergesagt wird. Können wir davon ausgehen, dass zu dieser Zeit andere Bedingungen herrschen als im Rest der Stichprobe? Ich glaube schon. Ich werde versuchen, die restlichen Stunden zu gruppieren, vielleicht können wir auf diese Weise die Besonderheiten des Preisverhaltens in diesen Zeitbereichen besser erkennen.

 
Aleksey Vyazmikin:

Was passiert, wenn wir den Baum auf ein Nicht-Ziel anstatt auf einen Prädiktor trainieren? Werden wir in der Lage sein, auf der Grundlage einer guten Ausbildung nicht-signifikante Prädiktoren zu identifizieren? Das heißt, wenn das Testmodell die Prädiktoren gut erkennt, dann enthalten die anderen Prädiktoren bereits genügend Informationen und der Prädiktor ist redundant und kann verworfen werden. Was aber, wenn es nicht um den Prädiktor geht, sondern um die Redundanz der einzigartigen Kombinationen selbst?

Ich habe mich zum Beispiel entschieden, die Stundenzahl als Ziel zu wählen.

Das Ergebnis für die Trainingsstichprobe


Das Ergebnis auf dem Prüfmuster


Sie sehen, dass 10 Uhr gut vorhergesagt wird. Können wir davon ausgehen, dass zu dieser Zeit andere Bedingungen herrschen als im Rest der Stichprobe? Ich glaube schon. Ich werde versuchen, die restlichen Stunden zu gruppieren, vielleicht kann ich dann die Besonderheiten des Preisverhaltens in diesen Zeitbereichen besser erkennen.

Vielleicht liegt es daran, dass die 10-Uhr-Position die erste ist, nach einer großen Pause ab der 24-Uhr-Position? Ist das der Grund für die gute Vorhersage? Gibt es außer der geringen Volatilität noch andere Besonderheiten der 24 Stunden?
 
Yuriy Asaulenko:

Ein Tag ist wahrscheinlich nicht genug). Das ist eigentlich eine Spezialität). Sie wird seit Jahren, ja sogar ein Leben lang, untersucht.

NS, nicht erinnernd, aber weit verbreitet in DSP. Die Frage der Anwendung von NS in DSP ist die richtige Formulierung des Problems für NS. Eine Anwendung von NS ist beispielsweise die Filterung, einschließlich der adaptiven Filterung.

Übrigens, NS wird gut funktionieren, wenn Sie ihm eine ganz bestimmte Aufgabe geben, nicht bringen diese, ich weiß nicht, was.

Ich komme immer wieder dazu.

Ich beschäftige mich seit 5 Jahren mit diesem Thema und konnte mir nicht einmal vorstellen, dass man es in einem Forum anwenden kann.

Kurz gesagt, NS ist ein gewöhnlicher adaptiver nicht-rekursiver Filter.

Es gibt viele Varianten.

Mit Lehrer, ohne Lehrer, usw.

Prädiktoren sind digitale Filterkoeffizienten. Das ist urkomisch, weil es elementar ist und du die Wissenschaft mit Füßen trittst... Das ist alles so alt wie die Zeit. (Das ist alles so alt wie die 1950er Jahre.)

Sagen Sie mir - haben Sie schon einen Blindversuch gemacht, oder nutzen Sie Input/Output mit Training?

//Blind ist, wenn man nicht weiß, was die Ausgabe ist und es nichts gibt, womit man sie vergleichen kann... Sie sagen, dass es in diesem Fall vor allem darum geht, den Lärm zu reduzieren.

// Und wenn Sie ein Sehender sind, wird die Vorhersage mit einem Fehlervektor berechnet, der herausgefiltert wird. Es kommt jedoch zu einer Verzögerung bei der Bearbeitung, mindestens um einen Tick.

Grund der Beschwerde: