Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 952

 
Dr. Trader:

Bei der letzten Datei hatte ich dies mit dem Baum :

2016, Ausbildung


y_pred

y_true-101
-113392388444472
010803767146029
17413376787415


2015, test:


y_pred

y_true-101
-19552392625429
011495721317509
18581403776835

bei der Vorhersage von -1: -1 wird tatsächlich etwas häufiger auftreten als 1. Aber 0 wird die häufigste von allen sein, und sie werden wahrscheinlich alle mit Verlusten enden. Ähnliches gilt für die Klasse "1".


Das Problem mit dem Baum kam zum Vorschein. Die Genetik wählte den Baumparameter cp = 0, und dies gibt dem Baum die Erlaubnis für eine Reihe von Zweigen. Leider hätten wir diesen Parameter auf einen kleinen Wert ungleich Null beschränken müssen.

Ist es möglich, die Zahl in Form von Wahrscheinlichkeiten darzustellen, wie bisher? Vielleicht gibt es in den Testdaten mehr signifikante Zweige?

Dr. Trader:

Ich glaube nicht, dass es in den Daten genügend Prädiktoren gibt, um "0" zu klassifizieren. Sie brauchen zum Beispiel Indikatoren für die Ebenheit.

Im Allgemeinen ist es schlecht um den Baum bestellt. Das Holz von SanSanych ist viel besser.


Schlechte Modelleinstellungen und infolgedessen Übertraining.

Er nahm nur eine Datei 2016 (übrigens gab es 2015 einen Prädiktor weniger - ich habe ihn korrigiert, ich kann ihn erneut herunterladen), und dieses Jahr 2016 war der Trend nach oben!

Der Baum klammert sich an die Daten der oberen TFs, und es gibt im Wesentlichen nur wenige Statistiken über sie, und deshalb kann es zu einem Kasoon in der Geschichte kommen, wenn sich der globale Bewegungsvektor ändert (2015 nach oben und 2016 nach unten) oder es eine totale Flaute gibt (2017).

Was die Wohnung betrifft, haben wir Ziele, die den Markteintritt aus der Wohnung sowie für die Umkehrung arbeiten, können wir versuchen, sie in irgendeiner Weise zu trennen?

Die Wohnung wird durch Prädiktoren wie Levl gut identifiziert, das einzige Problem ist, dass der Baum sie nicht miteinander verbinden kann, zumindest nicht bei einer TF.

 

Sie haben da einen profitablen Roboter gebaut :)

Einstieg in Long - nur bei Vorhersage "1" (in blau), davon >90% Gewinn (in grün).
Leerverkauf - nur bei Vorhersage "-1" (in rot), wovon wiederum >90% Gewinn (grün) sein werden.
Vorhersagen von "0" bedeuten, keine neuen Positionen zu eröffnen und auf ein besseres Timing zu warten, so dass es überhaupt keine Rolle spielt, wie hoch die tatsächliche Genauigkeit vor der Vorhersage dieser Klasse ist.

Es ist jedoch besser, den Wald mit einer Datei aus dem Jahr 2015 zu trainieren und ihn dann mit einer Datei aus dem Jahr 2016 zu überprüfen. Im Jahr 2015 fehlt nur eine Säule, sie sollte auch aus dem Jahr 2016 entfernt werden, damit das Klappern nicht verwechselt wird.

 
Aleksey Vyazmikin:

Kann die Zahl wie bisher in Form von Wahrscheinlichkeiten dargestellt werden?

Nein, dies ist ein anderer Baum-Lernmodus, der nur für 2 Klassen geeignet ist. Oder für Regression.

 
SanSanych Fomenko:

Er hat keinen einzigen Prädiktor, der sich auf seine Zielvariable bezieht - alles nur Rauschen. Und er sitzt in der Klapperkiste und statt auf Lärm zu achten, postet er hier Dateien mit Müll.

Ja, die Zielvorgaben haben keinen eindeutigen Bezug zu den Prognosen, sie zeigen lediglich das finanzielle Ergebnis eines Markteintritts zu einem bestimmten Zeitpunkt.

Glauben Sie, dass das Ergebnis besser sein wird, wenn die Logik der Eingaben an die Indikatoren einiger Prädiktoren gebunden ist, d.h. wenn wir bei der МА-Kreuzung eingeben, definieren wir das Ergebnis (1 oder -1) und geben Informationen über die Tatsache der MA-Kreuzung in die Prädiktoren?

 
Aleksey Vyazmikin:

Der Baum klammert sich an die Daten der oberen TFs, aber es gibt nicht genügend Statistiken über sie, und deshalb kann es in der Geschichte zu einem Kasoon kommen, wenn sich der globale Bewegungsvektor ändert (2015 nach oben und 2016 nach unten) oder es eine totale Flaute gibt (2017).

Was die Wohnung betrifft, haben wir Ziele, die den Markteintritt aus der Wohnung sowie für die Umkehrung arbeiten, können wir versuchen, sie in irgendeiner Weise zu trennen?

Die Wohnung wird von Prädiktoren wie Levl gut erkannt, das einzige Problem ist, dass der Baum sie nicht miteinander verbinden kann, zumindest bei einer TF.

Es ist klar, dass wir bereits verschiedene flache Indikatoren haben, aber der Baum kann sie nicht miteinander verbinden. Das war's dann wohl, das ist die Grenze der Möglichkeiten des Baumes.

Gestern habe ich die Ergebnisse fast genauso genau erhalten, allerdings mit weniger Einträgen in den Geschäften. Was ich heute bekommen habe, ist nicht viel besser. Irgendetwas ist schief gelaufen, und ich werde darüber nachdenken, welche Einstellungen korrigiert werden können.

 
Aleksey Vyazmikin:

Ja, die Ziele sind nicht eindeutig mit den Prädiktoren verknüpft, sie zeigen lediglich das finanzielle Ergebnis eines Markteintritts zu einem bestimmten Zeitpunkt.

Glauben Sie, dass das Ergebnis besser sein wird, wenn die Logik der Eingaben mit den Indikatoren einiger Prädiktoren verbunden ist, d.h. wenn wir bei der MA-Kreuzung eingeben, bestimmen wir das Ergebnis (1 oder -1) und wenn wir Informationen über die Tatsache der MA-Kreuzung in die Prädiktoren geben?

Und das ist meine Meinung: Unsinn im Input ist Unsinn im Output! Das sind die ersten Zeilen in den Statistik-Lehrbüchern.

 
Dr. Trader:

Sie haben da einen profitablen Roboter gebaut :)

Eine Long-Position wäre nur bei einer Vorhersage von 1" (in blau) möglich, wovon >90% profitabel wären (in grün).
Leerverkauf - nur bei Vorhersage "-1" (in rot), wovon wiederum >90% Gewinn sein werden (in grün).
Die Vorhersage "0" bedeutet, keine neuen Positionen zu eröffnen und auf ein besseres Timing zu warten, so dass es nicht wirklich darauf ankommt, wie hoch die tatsächliche Genauigkeit ist, bevor eine Vorhersage dieser Klasse getroffen wird.

Es ist jedoch besser, den Wald mit einer Datei aus dem Jahr 2015 zu trainieren und ihn dann mit einer Datei aus dem Jahr 2016 zu überprüfen. Im Jahr 2015 fehlt nur eine Säule, sie sollte auch im Jahr 2016 entfernt werden, damit es nicht zu Verwechslungen kommt.

Ich habe nichts gebaut - ich habe eine fertige Datei genommen und randomForest gebaut, aber ich war zu faul, sie in zwei Dateien aufzuteilen. Alexey hat es für mich getan und ein tolles Ergebnis vorgelegt, das meine "Leistungen" vollständig abdeckt.

 
Dr. Trader:

Oh, ich verstehe, es gibt bereits verschiedene flache Indikatoren, aber der Baum weiß nicht, wie er sie miteinander verknüpfen soll. Das war's dann wohl, das ist die Grenze der Möglichkeiten des Baumes.

Ich hatte gestern fast die gleichen Ergebnisse in Bezug auf die Genauigkeit, aber mit einer geringeren Anzahl von Einträgen in Geschäften. Was ich heute bekommen habe, ist nicht viel besser. Irgendetwas ist schief gelaufen, ich werde prüfen, welche Einstellungen korrigiert werden können.

Ja, ich denke, dass wir einen Baum brauchen, der uns helfen kann - um wahrscheinliche Beziehungen zwischen Prädiktoren aufzuzeigen und um Bedingungen für wahrscheinliche Vergleiche für die Entscheidungsfindung festzulegen.

Wie kann man dem Baum erklären, dass der globale Trend nach oben und unten geht? Natürlich kann ich das gleiche Werkzeug verwenden, einen Kanal zeichnen, ein Perzentil erstellen, d.h. klar angeben, wohin der Trendvektor gerichtet ist, aber der Baum kann diesen Prädiktor einfach ignorieren, während er meiner Meinung nach die gesamte Gruppe durch den globalen Trendvektor in mindestens zwei unterteilen sollte.

Ich weiß nicht, vielleicht sollten wir die Stichprobe von Situationen anpassen (in Teile teilen), darauf trainieren und dann zwangsweise denselben globalen Trend im Expert Advisor identifizieren und je nach Vektor auf den einen oder anderen Baum hören.

 
SanSanych Fomenko:

Was hat das mit meiner Meinung zu tun: Müll rein, Müll raus! So lauten die ersten Zeilen in den Statistik-Lehrbüchern.

Es geht nicht um Unsinn - der Input ist tatsächlich eine Reihe von Wahrscheinlichkeiten für den Ausgang von Ereignissen, diese Wahrscheinlichkeiten werden durch Prädiktoren beeinflusst, und der Output ist das Ergebnis vieler verschiedener und unabhängiger Ereignisse, obwohl das Ergebnis dasselbe sein kann. Ich werde über eine klare Eingabe nachdenken und alle Varianten ohne Signal zur Eingabe entfernen - es wird interessant sein, das Ergebnis zu sehen. Obwohl ich hier immer noch keine Rückmeldung von den Teilnehmern bekomme - sollten wir die Eingabe in Prädiktoren explizit kennzeichnen, wenn unterschiedliche Eingabestrategien verwendet werden?

 

Wir sind alle auf der Suche nach Einstiegspunkten, aber vielleicht sollten wir versuchen, eine Wohnung zu finden?

Vielleicht hat jemand einen Indikator oder ein Skript zur Erkennung von Wohnungen in der Vergangenheit?

Ich denke, wir können einen Regressionskanal mit einem Bereich von 100 nehmen, ihn auf jedem Balken verschieben und wenn die Steigung größer/kleiner als X ist, können wir den Bereich, der durch den Kanal beschrieben wird, als flach betrachten. Was meinen Sie dazu?

Grund der Beschwerde: