Veränderung der Leistung in Abhängigkeit von der Verschiebung des Schwellenwerts "Wahrscheinlichkeit" für die Klassifizierung 0/1 von 0,45 auf 0,65
Im Wesentlichen Genauigkeit
Die Histogramme zeigen, dass der Anstieg der Klassifizierungsgenauigkeit recht gleichmäßig mit einer Verschiebung der Wahrscheinlichkeitsschwelle für die Klassifizierung einhergeht, was bei den Gewinnen nicht der Fall ist.
Es stellt sich heraus, dass wir nicht nur die Klassifizierungseffizienz berücksichtigen sollten, sondern auch abschätzen müssen, wie die Gewinne zwischen den Regeln (Blättern) verteilt sind und wie hoch ihre Empfindlichkeitsschwelle ist. Mit anderen Worten: Egal, wie man es betrachtet, man muss die einzelnen Regeln herausziehen und eine Schätzung abgeben.
Es herrscht eine allgemeine Verwirrung über die Terminologie.
Wie sieht es mit der Kreuzvalidierung aus? Alle Sabbets sind beteiligt, daher ist die Validierung besser als der Test.
Wie auch immer, ja, wie auch immer. Mein Test ist der 2. Teil der Teilstichprobe, aber ich werde ihn dann als Validierung bezeichnen
Die Gewinne sind bei 0,65 geringer, weil es weniger Abschlüsse gibt. Zum Beispiel werden statt 100 nur noch 10 Geschäfte getätigt. Sie können das Los erhöhen
Erhöhen Sie den Schwellenwert, wenn das Modell schlecht wird, gibt es immer weniger Abschlüsse auf den neuen Daten, die Wahrscheinlichkeiten bewegen sich um Null, es ist ein guter Zeitpunkt für eine Umschulungum die Schwellenwerte anzuheben, muss der Fehler niedrig sein, sonst gibt es überhaupt keine Signale
Die Gewinne sind bei 0,65 geringer, weil es auch weniger Geschäfte gibt. Zum Beispiel werden wir anstelle von 100 nur 10 Trades haben.
Die Anzahl der Trades und der gewinnbringenden Trades variiert ganz reibungslos (ein Trade ist ein Trade/2 nach MT-Logik)
Der Verlust ist nur nicht pro Handel stabil, da der Stop-Loss nicht festgelegt ist.
Ich schlage meine Terminologie vor (ich bleibe vorerst dabei):
1. Trainingsstichprobe - diejenige, in der die Modellerstellung stattfindet
2. Testmuster - zur Kontrolle der Qualität der Modellschulung, einschließlich der Unterbrechung der Schulung
3. Untersuchungsstichprobe - wird zur Schätzung der Modellqualität verwendet, unabhängig von der Ausbildung
Ja, das ist verständlich. Es ist nur so, dass Signale wegen fehlender Wiederholungsverbindungen in den Blättern verschwinden, besonders wenn ihr großer Gesamtaktivierungsanteil sich in der Nähe von 0,5 bewegte und wie 0,1+0,05+0,08+0,25+0,03 aussieht - eine der Summen ist herausgefallen und das war's, es passiert keine Aktivierung.
Das bedeutet, dass der Algorithmus nicht richtig auf neue Daten verallgemeinert werden kann, man muss ihn weiter verdrehen) - grob gesagt - neu trainieren
10% Fehler pro Test und Spur für ~10k Beispiele, steigt gleichmäßig mit Zunahme
bei diesem Fehler begannen die Modelle mit der Arbeit an neuen Daten
bei der Validierung anders vorgehen, muss man die Optionen durchgehenIch gebe keine Algorithmen mehr preis, ich kommuniziere nur noch
О! Das ist der Deal! Fast wie meine! Ich habe dir gesagt, dass es nicht nötig ist, auf alle Arten von Bieren und Zauberern zu hören :)
Es bedeutet, dass der Algorithmus nicht gut auf die neuen Daten verallgemeinert werden kann, man muss ihn weiter verdrehen) - grob gesagt - neu trainieren
Ich drehe und wende mich also, ich will mir nichts vormachen :)
Ich werde jetzt eine neue Dosis von Prädiktoren hinzufügen...