Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2215

 

Zurück zur Frage der Visualisierung des CatBoost-Modells, um dessen Perspektive zu analysieren.

So sieht das Modell bei der Trainingsstichprobe aus:

Die x-Achse ist der Wahrscheinlichkeitswert der logistischen Funktion, und die y-Achse ist der Prozentsatz über ein Intervall von 0,05 Werten:

- Razdel(blau) - alle Werte in der Probe.

- Ziel=1(Magnet) - Ziel 1 Werte

- Ziel=0(aqua) - Zielwerte 0

- Balans+(hellblau) - das Finanzergebnis, das zu dem Gewinn geführt hat, im Vergleich zu allen Gewinnen und Verlusten; dieser Wert wird so skaliert, dass er in das Diagramm passt

- Balans-(brick) - finanzielles Ergebnis, das zum Verlust geführt hat, unter Berücksichtigung aller Gewinne und Verluste, dieser Wert wird skaliert, um in das Diagramm zu passen

- Kreise - dies ist der skalierte Gleichgewichtswert - wir konzentrieren uns auf einen Nullwert ab dem Nullwert der x-Koordinate - zur Veranschaulichung

Vertikale Aqua-Linie - Höchstwert Ziel=0

Vertikale Magnetlinie - maximaler Wert Target=1

Vertikale Linie in Rot - bedingte Teilung von 0,5 für die Klassifizierung auf 1 und Standardwert 0 in CatBoost - zur Verdeutlichung.

Ich gehe davon aus, dass das Modell die Klassen umso sicherer trennt, je weiter die Aqua- und Magnetlinien von der roten vertikalen Linie entfernt sind. Es lohnt sich auch, die Gleichgewichtslinien zu beobachten, die während des Trainings ebenfalls auf beiden Seiten verteilt werden - dies ist besonders für Modelle von Bedeutung, bei denen Gewinn und Verlust unterschiedliche Werte haben können. So kann ein Modell zum Beispiel kleine Verluste gut filtern, aber bei großen Verlusten verlieren, obwohl der Wert für die Klassifizierungsgenauigkeit mehr als 0,5 betragen wird.

Weiter sehen wir uns das Testmuster an

Wir können sehen, dass die vertikalen Linien - rot und Magnetit - näher zusammengerückt sind, aber ihre relative Position hat sich nicht verändert, was bereits gut ist (es kommt vor, dass der Magnetit in der Zone von <0,5 liegt). Die Saldenlinien sind näher zusammengerückt, was enttäuschend ist. Nach der 0,5-Wahrscheinlichkeit gibt es einen Verlustbereich, was darauf schließen lässt, dass das Modell von unzureichender Qualität ist.

Außerdem können wir uns die Ergebnisse der Testprobe ansehen.

Auf der rechten Seite (Wahrscheinlichkeit über 0,5) sieht die Situation besser aus als bei der Testprobe. Dies kann darauf hindeuten, dass die Testprobe ein seltenes Ereignis ist und es beim Training nur wenige ähnliche Beispiele gab, oder dass das Modell nicht vollständig trainiert ist. Für die letztgenannte Annahme spricht die Tatsache, dass es Regionen gibt, in denen die BalancelinieBalans+, die auf ein positives finanzielles Ergebnis hinweist, die LinieBalans- schneidet, was auch bei der Betrachtung der Kreise zu erkennen ist, die das Delta zwischen Gewinn und Verlust in einer bestimmten Wahrscheinlichkeitszone angeben, in derWahrscheinlichkeitszone unter 0,5.

Nun, schauen wir uns den Saldo der Untersuchungsprobe an.

Sie können deutlich sehen, dass sich der Charakter des Marktes verändert hat, was auf 2/3 des Diagramms zu sehen ist - wir sollten das Modell weiter studieren.

Und hier ist ein Beispiel für ein eindeutig schlechtes Modell

Bereits bei der Teststichprobe ist eine starke Verschiebung des gesamten Körpers nach links zu erkennen, d. h. das Modell weiß nur sehr wenig über die Stichprobe - die Vollständigkeit ist gering, und die Spitze der Ziel-1-Kumulierung liegt hinter dem linken Teil der Wahrscheinlichkeit. Es ist erwähnenswert, dass es immer noch einen Lerngewinn gibt.

Schauen wir uns das Test- und Prüfungsbeispiel an

Bereits auf dem Testmuster können wir sehen, dass alle Linien außerhalb der Wahrscheinlichkeit 0,5 sehr nahe beieinander liegen, und auf dem Testmuster können wir sehen, wie die Gleichgewichtslinien ihre Plätze getauscht haben.

 
mytarmailS:


Im Grunde habe ich ein leeres Netz (ich trainiere es nur, damit es initialisiert werden kann, weil es nicht selbst geschrieben ist, sondern aus einem Paket stammt)


Ich kann mir eine beliebige Abstraktion, ein beliebiges Ziel vorstellen und eine Fitnessfunktion schreiben.

Dann soll die Genetik beginnen, die Gewichte des Netzes so zu verändern, dass ich (das Netz) beim Zug und im Test etwas erhalte, das meinem Ziel ähnlich ist.


Und das ist tausendmal" tiefgründiger als die Erstellung der Tags und die Anpassung der Regression oder Klassifizierung.

Sie gingen 2 Jahre zurück, als wir das Training von Neuronen mit dem mt5-Optimierer verdammten

Und ich habe solche Bots geschrieben. Es handelt sich um eine allgemeine Optimierung mit einer Reihe von Parametern.

überprüfen Sie es.

https://www.mql5.com/ru/articles/497

Нейронные сети - от теории к практике
Нейронные сети - от теории к практике
  • www.mql5.com
В наше время, наверное, каждый трейдер слышал о нейронных сетях и знает, как это круто. В представлении большинства те, которые в них разбираются, это какие-то чуть ли не сверхчеловеки. В этой статье я постараюсь рассказать, как устроена нейросеть, что с ней можно делать и покажу практические примеры её использования. Понятие о нейронных сетях...
 
Maxim Dmitrievsky:

Sie gingen 2 Jahre zurück, als es eine Verurteilung des Neuronentrainings durch den mt5-Optimierer gab

Und ich habe solche Bots geschrieben. Es handelt sich um eine allgemeine Optimierung mit vielen Parametern.

weiter lesen.

https://www.mql5.com/ru/articles/497

Ich habe es mit Max Profit versucht, ich kann es mit etwas anderem trainieren


Hören Sie, wenn Sie nicht zu faul sind, versuchen Sie, catbust auf max profit zu trainieren, ich bin nicht sicher, wie es dort funktioniert

Sie müssen die X-Daten und das Y-Ziel gleichzeitig eingeben.

vielleicht sind all diese "Anpassungen" nur eine kosmetische Änderung bestehender Funktionen

 
Aleksey Vyazmikin:

Zurück zur Frage der Visualisierung des CatBoost-Modells, um dessen Perspektive zu analysieren.

Ich denke, es ist besser, solche großen Forschungsarbeiten in einem Blog zu veröffentlichen und eine Kopie hier einzustellen. Sechs Monate später werden Sie es hier nicht mehr finden...
 
elibrarius:
Ich denke, große Studien wie diese sollten gebloggt und hierher kopiert werden. In sechs Monaten werden Sie es hier nicht mehr finden...

Vielleicht - ich benutze nur keinen Blog, deshalb kam mir das nicht in den Sinn.

Ich denke, dass ich alle diese Punkte aus dem Diagramm (20 pro Kurve) in eine Stichprobe aufnehmen und versuchen kann, daraus zu lernen - vielleicht können wir auf diese Weise mit einer höheren Wahrscheinlichkeit Modelle mit potenzieller Stabilität identifizieren.

 
Aleksey Vyazmikin:

Vielleicht - ich benutze den Blog nur nicht, deshalb kam mir das nicht in den Sinn.

Ich denke, dass ich all diese Punkte aus dem Diagramm (20 pro Kurve) in eine Stichprobe aufnehmen und versuchen kann, daraus zu lernen - vielleicht können wir auf diese Weise mit höherer Wahrscheinlichkeit Modelle mit potenzieller Stabilität identifizieren.

Was ist das Ziel? Wie ist jedes Beispiel zu kennzeichnen? Oder durch Selbststudium?
 
elibrarius:
Was wird das Ziel sein? Wie sind die einzelnen Beispiele zu kennzeichnen? Oder durch Selbststudium?

Das Ziel wäre das finanzielle Ergebnis des Modells in der Untersuchungsstichprobe.

 
mytarmailS:

Ich versuche nur, den Gewinn zu maximieren, ich könnte für etwas anderes trainieren.


Hören Sie, wenn Sie nicht zu faul sind, versuchen Sie, katbust auf max profit zu trainieren, ich bin nicht sicher, dass es dort funktioniert

Sie müssen die X-Daten und das Y-Ziel gleichzeitig eingeben.

vielleicht sind all diese "Anpassungen" nur kosmetische Änderungen an bestehenden Funktionen

zu faul, neue Kennzahlen zu schreiben... und es wird definitiv nicht der maximale Gewinn sein, sondern etwas Sinnvolleres

z.B. Lyapunov-Stabilität ))

 
Maxim Dmitrievsky:

Ich bin zu faul, um neue Metriken zu schreiben... und es wird dann bestimmt nicht der maximale Gewinn sein, sondern etwas Sinnvolleres

wie die Lyapunovsche Stabilität )))

Sie brauchen kein ebenes Feld und keine Dichte))). In unserer Branche ist das selten.

 
Aleksey Vyazmikin:

Zurück zur Frage der Visualisierung des CatBoost-Modells, um dessen Perspektive zu analysieren.

Ja, die Verteilungen zeigen normalerweise alles. Sie können diese einfach für Schilder machen\es gibt keine Boosts und sofort sehen

Grund der Beschwerde: