Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading

Aleksei Kuznetsov 2020.08.12 10:21 #19631

Aleksey Vyazmikin:

Vielleicht habe ich vorhin nicht klargestellt, dass bei kleinen Stichproben mindestens 1 % und bei großen Stichproben 100 % der Indikatoren im Blatt verbleiben sollten, so dass die Aufteilung natürlich nicht so weit geht, dass für keine Klasse ein Fehler im Blatt auftritt.

Sie scheinen den letzten Schritt misszuverstehen - ich sehe ihn als eine statistische Auswertung der verbleibenden 1%-Stichprobe - in dieser Stichprobe beobachten wir, dass sich das Ergebnis mit Splits durch verschiedene Prädiktoren verbessert, wir erhalten z.B. Unterrauminformationen:

Wenn A>x1, dann wird Ziel 1 zu 40% richtig sein, was 60% der Unterstichprobe entspricht.

Wenn B>x2, dann wird Ziel 1 mit 55% richtig identifiziert, was 45% der Teilstichprobe entspricht.

Wenn A<=x1, dann wird Ziel 1 zu 70% richtig definiert, was 50% der Teilstichprobe entspricht.

Jeder dieser Splits hat einen Signifikanzfaktor (ich habe noch nicht entschieden, wie er berechnet werden soll), und der letzte Split hat ebenfalls einen.

und so weiter, sagen wir bis zu 5-10 Prädiktoren, dann bei der Anwendung, wenn wir den letzten Split erreichen, addieren wir die Koeffizienten (oder verwenden eine kompliziertere Methode der Summierung), und wenn die Summe der Koeffizienten den Schwellenwert übersteigt, dann wird das Blatt als 1 eingestuft, sonst als Null.

Eine einfache Möglichkeit, dies umzusetzen, besteht darin, einen Wald bis zum vorletzten Split zu erstellen und dann die bereits ausgewählten Prädiktoren aus der Stichprobe auszuschließen, so dass neue Prädiktoren ausgewählt werden. Oder Sie filtern nach der Erstellung des Baums die Stichprobe nach Blättern und gehen jeden Prädiktor für sich durch, um die beste Aufteilung zu finden, die das Kriterium der Vollständigkeit und Genauigkeit erfüllt.

Und das Ergebnis der Trainingsstichprobe wird sich verbessern, wenn die andere Klasse "0" keine Aktion und nicht die gegenteilige Eingabe bedeutet, andernfalls kann es sowohl eine Verbesserung als auch eine Verschlechterung geben.

Das Trainingsergebnis wird immer noch zwischen einem Baum liegen, der auf N und N+1 Tiefen trainiert wurde, z.B. 6 und 7. Wenn auf Stufe 6 der Fehler 20 % und auf Stufe 7 der Fehler 18 % beträgt, wird Ihre Methode einen Fehler zwischen den beiden Werten ergeben, z. B. 19 %. Glauben Sie, dass der Gewinn von 1 % die Zeit wert ist?
Zuvor wurde ein einfacher Weg beschrieben - einige Bäume auf Stufe 6 und einige auf Stufe 7 zu trainieren. Dies würde eine Neufassung des Codes erfordern.
Jetzt habe ich einen einfacheren Weg gefunden, da man nichts umschreiben muss. Erstellen Sie einfach einen Zufallswald mit einem beliebigen Paket bis Stufe 6 und einen weiteren Wald bis Stufe 7, und bilden Sie dann den Durchschnitt.

Wir brauchen uns keine Sorgen zu machen, denn dieAusbildungsmuster sind immer perfekt.

Großartiger EA im Backtest! Gibt es ein Muster Fragen von Anfängern MQL4

Aleksey Vyazmikin 2020.08.12 14:42 #19632

elibrarius:
Trotzdem wird das Trainingsergebnis zwischen einem auf N und N+1 Tiefe trainierten Baum liegen, zum Beispiel 6 und 7. Wenn auf Stufe 6 der Fehler 20 % und auf Stufe 7 der Fehler 18 % beträgt, liefert Ihre Methode den dazwischen liegenden Fehler, z. B. 19 %. Glauben Sie, dass der Gewinn von 1 % die Zeit wert ist?
Zuvor wurde ein einfacher Weg beschrieben - einige Bäume auf Stufe 6 und einige auf Stufe 7 ausbilden. Dies würde eine Neufassung des Codes erfordern.
Jetzt habe ich einen einfacheren Weg gefunden, da man nichts umschreiben muss. Erstellen Sie einfach einen Zufallswald mit einem beliebigen Paket bis Stufe 6 und einen weiteren Wald bis Stufe 7, und bilden Sie dann den Durchschnitt.

Die Ausbildungsprobe sollte uns nicht beunruhigen - sie ist immer in Ordnung.

Der Gewinn beträgt in der Regel mehr als 1 %.

Natürlich kann man Wälder randomisieren, aber wie bekommt man es hin, dass sie bis zum vorletzten Split gleich sind? Nehmen wir an, Sie trainieren 10 Bäume bis zum 6. Split, und Sie trainieren weitere 10 auf die gleiche Weise, aber bis zum 7.

[Archiv!] Jede Anfängerfrage, um FOREX - Trends, Prognosen Wo soll der TC

Aleksei Kuznetsov 2020.08.12 15:19 #19633

Aleksey Vyazmikin:

Der Gewinn beträgt in der Regel mehr als 1 %.

Natürlich kann man Zufallswälder haben, aber wie stellt man es an, dass sie bis zum vorletzten Split gleich sind? Nehmen wir an, wir unterrichten 10 Bäume bis zum 6. Split, und unterrichten die anderen 10 auf die gleiche Weise, aber bis zum 7.

Niemals. Deshalb sind sie zufällig, da wir für das Training zufällige Spalten verwenden. Die Mittelwertbildung führt dann zu guten Ergebnissen.
Sie können versuchen, den Anteil der Spalten = 1 zu setzen. Das heißt, dass alle Spalten an der Erstellung des Baums beteiligt sind und nicht nur zufällige 50% aller Spalten. Alle Bäume werden gleich sein, also setze auch 1 Baum im Wald. Insgesamt wird ein Wald mit einem Baum auf 6, der andere auf 7 Tiefenstufen trainiert.
Wenn Sie mehr als 2 Bäume benötigen, entfernen Sie unabhängig voneinander einige Spalten aus der Menge und trainieren zusätzliche Wälder auf allen verbleibenden Spalten.

Außerdem sollte die Anzahl der Zeilen, die am Training teilnehmen, ebenfalls auf 1 gesetzt werden, d.h. alle, damit das Training gleich ist. So wird alles Zufällige aus dem Random Forest entfernt.

Gibt es ein Muster Was soll in den Diskussion zum Artikel "Random