Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1305

 

Veränderung der Leistung in Abhängigkeit von der Verschiebung des Schwellenwerts "Wahrscheinlichkeit" für die Klassifizierung 0/1 von 0,45 auf 0,65

Im Wesentlichen Genauigkeit

Die Histogramme zeigen, dass der Anstieg der Klassifizierungsgenauigkeit recht gleichmäßig mit einer Verschiebung der Wahrscheinlichkeitsschwelle für die Klassifizierung einhergeht, was bei den Gewinnen nicht der Fall ist.

Es stellt sich heraus, dass wir nicht nur die Klassifizierungseffizienz berücksichtigen sollten, sondern auch abschätzen müssen, wie die Gewinne zwischen den Regeln (Blättern) verteilt sind und wie hoch ihre Empfindlichkeitsschwelle ist. Mit anderen Worten: Egal, wie man es betrachtet, man muss die einzelnen Regeln herausziehen und eine Schätzung abgeben.

 
elibrarius:
Säge)
Es herrscht eine allgemeine Verwirrung über die Terminologie.

Wie sieht es mit der Kreuzvalidierung aus? Alle Sabbets sind beteiligt, daher ist die Validierung besser als der Test.

Wie auch immer, ja, wie auch immer. Mein Test ist der 2. Teil der Teilstichprobe, aber ich werde ihn dann als Validierung bezeichnen

 
Aleksey Vyazmikin:

Veränderung der Leistung in Abhängigkeit von der Verschiebung des Schwellenwerts "Wahrscheinlichkeit" für die Klassifizierung 0/1 von 0,45 auf 0,65

Im Wesentlichen Genauigkeit

Die Histogramme zeigen, dass der Anstieg der Klassifizierungsgenauigkeit recht gleichmäßig mit einer Verschiebung der Wahrscheinlichkeitsschwelle für die Klassifizierung einhergeht, was bei den Gewinnen nicht der Fall ist.

Es stellt sich heraus, dass wir nicht nur die Klassifizierungseffizienz berücksichtigen sollten, sondern auch abschätzen müssen, wie die Gewinne zwischen den Regeln (Blättern) verteilt sind und wie hoch ihre Empfindlichkeitsschwelle ist. Wie man es auch dreht und wendet, man muss die einzelnen Regeln heranziehen und sie einschätzen.

Die Gewinne sind bei 0,65 geringer, weil es weniger Abschlüsse gibt. Zum Beispiel werden statt 100 nur noch 10 Geschäfte getätigt. Sie können das Los erhöhen

 
Aleksey Vyazmikin:

Veränderung der Leistung in Abhängigkeit von der Verschiebung des Schwellenwerts "Wahrscheinlichkeit" für die Klassifizierung 0/1 von 0,45 auf 0,65

Im Wesentlichen Genauigkeit

Die Histogramme zeigen, dass der Anstieg der Klassifizierungsgenauigkeit recht gleichmäßig mit einer Verschiebung der Wahrscheinlichkeitsschwelle für die Klassifizierung einhergeht, was bei den Gewinnen nicht der Fall ist.

Es stellt sich heraus, dass wir nicht nur die Klassifizierungseffizienz berücksichtigen sollten, sondern auch abschätzen müssen, wie der Gewinn zwischen den Regeln (Blättern) verteilt ist und wie hoch ihre Empfindlichkeitsschwelle ist. Egal, wie man es dreht und wendet, man muss die einzelnen Regeln herausziehen und ihnen eine Schätzung geben.

Erhöhen Sie den Schwellenwert, wenn das Modell schlecht wird, gibt es immer weniger Abschlüsse auf den neuen Daten, die Wahrscheinlichkeiten bewegen sich um Null, es ist ein guter Zeitpunkt für eine Umschulung

um die Schwellenwerte anzuheben, muss der Fehler niedrig sein, sonst gibt es überhaupt keine Signale
 
elibrarius:

Die Gewinne sind bei 0,65 geringer, weil es auch weniger Geschäfte gibt. Zum Beispiel werden wir anstelle von 100 nur 10 Trades haben.

Die Anzahl der Trades und der gewinnbringenden Trades variiert ganz reibungslos (ein Trade ist ein Trade/2 nach MT-Logik)

Der Verlust ist nur nicht pro Handel stabil, da der Stop-Loss nicht festgelegt ist.

 
elibrarius:
Säge)
Insgesamt ist die Terminologie verwirrend

Ich schlage meine Terminologie vor (ich bleibe vorerst dabei):

1. Trainingsstichprobe - diejenige, in der die Modellerstellung stattfindet

2. Testmuster - zur Kontrolle der Qualität der Modellschulung, einschließlich der Unterbrechung der Schulung

3. Untersuchungsstichprobe - wird zur Schätzung der Modellqualität verwendet, unabhängig von der Ausbildung

 
Maxim Dmitrievsky:

Erhöhen Sie den Schwellenwert. Wenn sich das Modell verschlechtert, gibt es immer weniger Abschlüsse auf den neuen Daten, die Wahrscheinlichkeiten werden um Null kreisen.

Sie brauchen einen niedrigen Fehler, um die Schwellenwerte anzuheben, sonst gibt es überhaupt keine Signale.

Ja, das ist verständlich. Es ist nur so, dass Signale wegen fehlender Wiederholungsverbindungen in den Blättern verschwinden, besonders wenn ihr großer Gesamtaktivierungsanteil sich in der Nähe von 0,5 bewegte und wie 0,1+0,05+0,08+0,25+0,03 aussieht - eine der Summen ist herausgefallen und das war's, es passiert keine Aktivierung.

 
Aleksey Vyazmikin:

Ja, das ist verständlich. Nur Signale verschwinden wegen des Mangels an Reproduktionsverbindungen in den Blättern, vor allem, wenn ihr großer Gesamtaktivierungsanteil um 0,5 rotierte und wie die Summe von 0,1+0,05+0,08+0,25+0,03 aussah - fiel eine der Summen heraus und alle, keine Aktivierung erfolgt.

Das bedeutet, dass der Algorithmus nicht richtig auf neue Daten verallgemeinert werden kann, man muss ihn weiter verdrehen) - grob gesagt - neu trainieren

 
Maxim Dmitrievsky:

10% Fehler pro Test und Spur für ~10k Beispiele, steigt gleichmäßig mit Zunahme

bei diesem Fehler begannen die Modelle mit der Arbeit an neuen Daten

bei der Validierung anders vorgehen, muss man die Optionen durchgehen

Ich gebe keine Algorithmen mehr preis, ich kommuniziere nur noch

О! Das ist der Deal! Fast wie meine! Ich habe dir gesagt, dass es nicht nötig ist, auf alle Arten von Bieren und Zauberern zu hören :)

 
Maxim Dmitrievsky:

Es bedeutet, dass der Algorithmus nicht gut auf die neuen Daten verallgemeinert werden kann, man muss ihn weiter verdrehen) - grob gesagt - neu trainieren

Ich drehe und wende mich also, ich will mir nichts vormachen :)

Ich werde jetzt eine neue Dosis von Prädiktoren hinzufügen...

Grund der Beschwerde: