Zurück zur Frage der Visualisierung des CatBoost-Modells, um dessen Perspektive zu analysieren.
So sieht das Modell bei der Trainingsstichprobe aus:
Die x-Achse ist der Wahrscheinlichkeitswert der logistischen Funktion, und die y-Achse ist der Prozentsatz über ein Intervall von 0,05 Werten:
- Razdel(blau) - alle Werte in der Probe.
- Ziel=1(Magnet) - Ziel 1 Werte
- Ziel=0(aqua) - Zielwerte 0
- Balans+(hellblau) - das Finanzergebnis, das zu dem Gewinn geführt hat, im Vergleich zu allen Gewinnen und Verlusten; dieser Wert wird so skaliert, dass er in das Diagramm passt
- Balans-(brick) - finanzielles Ergebnis, das zum Verlust geführt hat, unter Berücksichtigung aller Gewinne und Verluste, dieser Wert wird skaliert, um in das Diagramm zu passen
- Kreise - dies ist der skalierte Gleichgewichtswert - wir konzentrieren uns auf einen Nullwert ab dem Nullwert der x-Koordinate - zur Veranschaulichung
Vertikale Aqua-Linie - Höchstwert Ziel=0
Vertikale Magnetlinie - maximaler Wert Target=1
Vertikale Linie in Rot - bedingte Teilung von 0,5 für die Klassifizierung auf 1 und Standardwert 0 in CatBoost - zur Verdeutlichung.
Ich gehe davon aus, dass das Modell die Klassen umso sicherer trennt, je weiter die Aqua- und Magnetlinien von der roten vertikalen Linie entfernt sind. Es lohnt sich auch, die Gleichgewichtslinien zu beobachten, die während des Trainings ebenfalls auf beiden Seiten verteilt werden - dies ist besonders für Modelle von Bedeutung, bei denen Gewinn und Verlust unterschiedliche Werte haben können. So kann ein Modell zum Beispiel kleine Verluste gut filtern, aber bei großen Verlusten verlieren, obwohl der Wert für die Klassifizierungsgenauigkeit mehr als 0,5 betragen wird.
Weiter sehen wir uns das Testmuster an
Wir können sehen, dass die vertikalen Linien - rot und Magnetit - näher zusammengerückt sind, aber ihre relative Position hat sich nicht verändert, was bereits gut ist (es kommt vor, dass der Magnetit in der Zone von <0,5 liegt). Die Saldenlinien sind näher zusammengerückt, was enttäuschend ist. Nach der 0,5-Wahrscheinlichkeit gibt es einen Verlustbereich, was darauf schließen lässt, dass das Modell von unzureichender Qualität ist.
Außerdem können wir uns die Ergebnisse der Testprobe ansehen.
Auf der rechten Seite (Wahrscheinlichkeit über 0,5) sieht die Situation besser aus als bei der Testprobe. Dies kann darauf hindeuten, dass die Testprobe ein seltenes Ereignis ist und es beim Training nur wenige ähnliche Beispiele gab, oder dass das Modell nicht vollständig trainiert ist. Für die letztgenannte Annahme spricht die Tatsache, dass es Regionen gibt, in denen die BalancelinieBalans+, die auf ein positives finanzielles Ergebnis hinweist, die LinieBalans- schneidet, was auch bei der Betrachtung der Kreise zu erkennen ist, die das Delta zwischen Gewinn und Verlust in einer bestimmten Wahrscheinlichkeitszone angeben, in derWahrscheinlichkeitszone unter 0,5.
Nun, schauen wir uns den Saldo der Untersuchungsprobe an.
Sie können deutlich sehen, dass sich der Charakter des Marktes verändert hat, was auf 2/3 des Diagramms zu sehen ist - wir sollten das Modell weiter studieren.
Und hier ist ein Beispiel für ein eindeutig schlechtes Modell
Bereits bei der Teststichprobe ist eine starke Verschiebung des gesamten Körpers nach links zu erkennen, d. h. das Modell weiß nur sehr wenig über die Stichprobe - die Vollständigkeit ist gering, und die Spitze der Ziel-1-Kumulierung liegt hinter dem linken Teil der Wahrscheinlichkeit. Es ist erwähnenswert, dass es immer noch einen Lerngewinn gibt.
Schauen wir uns das Test- und Prüfungsbeispiel an
Bereits auf dem Testmuster können wir sehen, dass alle Linien außerhalb der Wahrscheinlichkeit 0,5 sehr nahe beieinander liegen, und auf dem Testmuster können wir sehen, wie die Gleichgewichtslinien ihre Plätze getauscht haben.
Im Grunde habe ich ein leeres Netz (ich trainiere es nur, damit es initialisiert werden kann, weil es nicht selbst geschrieben ist, sondern aus einem Paket stammt)
Ich kann mir eine beliebige Abstraktion, ein beliebiges Ziel vorstellen und eine Fitnessfunktion schreiben.
Dann soll die Genetik beginnen, die Gewichte des Netzes so zu verändern, dass ich (das Netz) beim Zug und im Test etwas erhalte, das meinem Ziel ähnlich ist.
Und das ist tausendmal" tiefgründiger als die Erstellung der Tags und die Anpassung der Regression oder Klassifizierung.
Sie gingen 2 Jahre zurück, als wir das Training von Neuronen mit dem mt5-Optimierer verdammten
Und ich habe solche Bots geschrieben. Es handelt sich um eine allgemeine Optimierung mit einer Reihe von Parametern.
überprüfen Sie es.
https://www.mql5.com/ru/articles/497
Ich habe es mit Max Profit versucht, ich kann es mit etwas anderem trainieren
Hören Sie, wenn Sie nicht zu faul sind, versuchen Sie, catbust auf max profit zu trainieren, ich bin nicht sicher, wie es dort funktioniert
Sie müssen die X-Daten und das Y-Ziel gleichzeitig eingeben.
vielleicht sind all diese "Anpassungen" nur eine kosmetische Änderung bestehender Funktionen
Ich denke, große Studien wie diese sollten gebloggt und hierher kopiert werden. In sechs Monaten werden Sie es hier nicht mehr finden...
Vielleicht - ich benutze nur keinen Blog, deshalb kam mir das nicht in den Sinn.
Ich denke, dass ich alle diese Punkte aus dem Diagramm (20 pro Kurve) in eine Stichprobe aufnehmen und versuchen kann, daraus zu lernen - vielleicht können wir auf diese Weise mit einer höheren Wahrscheinlichkeit Modelle mit potenzieller Stabilität identifizieren.
Was wird das Ziel sein? Wie sind die einzelnen Beispiele zu kennzeichnen? Oder durch Selbststudium?
Das Ziel wäre das finanzielle Ergebnis des Modells in der Untersuchungsstichprobe.
zu faul, neue Kennzahlen zu schreiben... und es wird definitiv nicht der maximale Gewinn sein, sondern etwas Sinnvolleres
z.B. Lyapunov-Stabilität ))
Sie brauchen kein ebenes Feld und keine Dichte))). In unserer Branche ist das selten.
Ja, die Verteilungen zeigen normalerweise alles. Sie können diese einfach für Schilder machen\es gibt keine Boosts und sofort sehen