Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1964

 
Aleksey Vyazmikin:

Vielleicht habe ich vorhin nicht klargestellt, dass bei kleinen Stichproben mindestens 1 % und bei großen Stichproben 100 % der Indikatoren im Blatt verbleiben sollten, so dass die Aufteilung natürlich nicht so weit geht, dass für keine Klasse ein Fehler im Blatt auftritt.

Sie scheinen den letzten Schritt misszuverstehen - ich sehe ihn als eine statistische Auswertung der verbleibenden 1%-Stichprobe - in dieser Stichprobe beobachten wir, dass sich das Ergebnis mit Splits durch verschiedene Prädiktoren verbessert, wir erhalten z.B. Unterrauminformationen:

Wenn A>x1, dann wird Ziel 1 zu 40% richtig sein, was 60% der Unterstichprobe entspricht.

Wenn B>x2, dann wird Ziel 1 mit 55% richtig identifiziert, was 45% der Teilstichprobe entspricht.

Wenn A<=x1, dann wird Ziel 1 zu 70% richtig definiert, was 50% der Teilstichprobe entspricht.

Jeder dieser Splits hat einen Signifikanzfaktor (ich habe noch nicht entschieden, wie er berechnet werden soll), und der letzte Split hat ebenfalls einen.

und so weiter, sagen wir bis zu 5-10 Prädiktoren, dann bei der Anwendung, wenn wir den letzten Split erreichen, addieren wir die Koeffizienten (oder verwenden eine kompliziertere Methode der Summierung), und wenn die Summe der Koeffizienten den Schwellenwert übersteigt, dann wird das Blatt als 1 eingestuft, sonst als Null.


Eine einfache Möglichkeit, dies umzusetzen, besteht darin, einen Wald bis zum vorletzten Split zu erstellen und dann die bereits ausgewählten Prädiktoren aus der Stichprobe auszuschließen, so dass neue Prädiktoren ausgewählt werden. Oder Sie filtern nach der Erstellung des Baums die Stichprobe nach Blättern und gehen jeden Prädiktor für sich durch, um die beste Aufteilung zu finden, die das Kriterium der Vollständigkeit und Genauigkeit erfüllt.

Und das Ergebnis der Trainingsstichprobe wird sich verbessern, wenn die andere Klasse "0" keine Aktion und nicht die gegenteilige Eingabe bedeutet, andernfalls kann es sowohl eine Verbesserung als auch eine Verschlechterung geben.

Das Trainingsergebnis wird immer noch zwischen einem Baum liegen, der auf N und N+1 Tiefen trainiert wurde, z.B. 6 und 7. Wenn auf Stufe 6 der Fehler 20 % und auf Stufe 7 der Fehler 18 % beträgt, wird Ihre Methode einen Fehler zwischen den beiden Werten ergeben, z. B. 19 %. Glauben Sie, dass der Gewinn von 1 % die Zeit wert ist?
Zuvor wurde ein einfacher Weg beschrieben - einige Bäume auf Stufe 6 und einige auf Stufe 7 zu trainieren. Dies würde eine Neufassung des Codes erfordern.
Jetzt habe ich einen einfacheren Weg gefunden, da man nichts umschreiben muss. Erstellen Sie einfach einen Zufallswald mit einem beliebigen Paket bis Stufe 6 und einen weiteren Wald bis Stufe 7, und bilden Sie dann den Durchschnitt.


Wir brauchen uns keine Sorgen zu machen, denn dieAusbildungsmuster sind immer perfekt.

 
elibrarius:
Trotzdem wird das Trainingsergebnis zwischen einem auf N und N+1 Tiefe trainierten Baum liegen, zum Beispiel 6 und 7. Wenn auf Stufe 6 der Fehler 20 % und auf Stufe 7 der Fehler 18 % beträgt, liefert Ihre Methode den dazwischen liegenden Fehler, z. B. 19 %. Glauben Sie, dass der Gewinn von 1 % die Zeit wert ist?
Zuvor wurde ein einfacher Weg beschrieben - einige Bäume auf Stufe 6 und einige auf Stufe 7 ausbilden. Dies würde eine Neufassung des Codes erfordern.
Jetzt habe ich einen einfacheren Weg gefunden, da man nichts umschreiben muss. Erstellen Sie einfach einen Zufallswald mit einem beliebigen Paket bis Stufe 6 und einen weiteren Wald bis Stufe 7, und bilden Sie dann den Durchschnitt.


Die Ausbildungsprobe sollte uns nicht beunruhigen - sie ist immer in Ordnung.

Der Gewinn beträgt in der Regel mehr als 1 %.

Natürlich kann man Wälder randomisieren, aber wie bekommt man es hin, dass sie bis zum vorletzten Split gleich sind? Nehmen wir an, Sie trainieren 10 Bäume bis zum 6. Split, und Sie trainieren weitere 10 auf die gleiche Weise, aber bis zum 7.

 
Aleksey Vyazmikin:

Der Gewinn beträgt in der Regel mehr als 1 %.

Natürlich kann man Zufallswälder haben, aber wie stellt man es an, dass sie bis zum vorletzten Split gleich sind? Nehmen wir an, wir unterrichten 10 Bäume bis zum 6. Split, und unterrichten die anderen 10 auf die gleiche Weise, aber bis zum 7.

Niemals. Deshalb sind sie zufällig, da wir für das Training zufällige Spalten verwenden. Die Mittelwertbildung führt dann zu guten Ergebnissen.
Sie können versuchen, den Anteil der Spalten = 1 zu setzen. Das heißt, dass alle Spalten an der Erstellung des Baums beteiligt sind und nicht nur zufällige 50% aller Spalten. Alle Bäume werden gleich sein, also setze auch 1 Baum im Wald. Insgesamt wird ein Wald mit einem Baum auf 6, der andere auf 7 Tiefenstufen trainiert.
Wenn Sie mehr als 2 Bäume benötigen, entfernen Sie unabhängig voneinander einige Spalten aus der Menge und trainieren zusätzliche Wälder auf allen verbleibenden Spalten.

Außerdem sollte die Anzahl der Zeilen, die am Training teilnehmen, ebenfalls auf 1 gesetzt werden, d.h. alle, damit das Training gleich ist. So wird alles Zufällige aus dem Random Forest entfernt.
 

Es ist eine Herausforderung, die Handelslogik für diese ns zu entwickeln.

Bis jetzt haben wir folgendes gefunden.


und die ns-Architektur variiert über einen weiten Bereich

die Hauptsache ist, dass es richtig gemacht wird

 
Maxim Dmitrievsky:

Es ist eine Herausforderung, die Handelslogik dafür zu entwickeln. ns

Bis jetzt haben wir folgendes gefunden.


und die ns-Architektur variiert über einen weiten Bereich

die Hauptsache ist, die richtige Belohnung zu wählen

Wieder auf die NS mit Verstärkungen genommen? Sie scheinen die Belohnung zu nutzen

 

Ich schlage vor, diese Daten zu testen. Es gibt definitiv ein Muster, und es ist klar , was man an streben sollte.

ps, um das .txt aus dem Namen zu entfernen

Dateien:
test.zip.001.txt  15360 kb
test.zip.002.txt  13906 kb
 

In 1,5 Monaten. Vollständiges Selbstlernen ohneEingreifen

Ich werde später noch mehr nachforschen... zu viele Parameter

 
Maxim Dmitrievsky:

In 1,5 Monaten. Vollständiges Selbstlernen ohneEingreifen

Ich werde später noch mehr nachforschen... zu viele Parameter

Nicht schlecht.)
 
Maxim Dmitrievsky:

In 1,5 Monaten. Vollständiges Selbstlernen ohneEingreifen

Ich werde später noch mehr nachforschen... zu viele Parameter

Handelt es sich dabei um neue Handelsdaten oder wie kann man sie überhaupt verstehen?

 
mytarmailS:

Handelt es sich also um neue Handelsdaten oder wie ist das überhaupt zu verstehen?

Sie lassen es einfach laufen und es handelt, es lernt, während Sie gehen