Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2107
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
So sollte es sein. Ein Ausgleich nach NS-Klassen ist erforderlich. Die Bäume kommen schon zurecht.
Nun, das ist nicht immer der Fall - ich habe schon einmal darüber geschrieben.
Es sieht so aus, als hätte ich einen profitablen Expert Advisor (Trainingsansatz) in meinem Artikel verbrannt:
Das Diagramm zeigt das finanzielle Ergebnis des Modells am Ende eines jeden Monats, wenn man das erste Modell auf 12 Monate trainiert und dann die Historie jedes neuen Monats hinzufügt - indem man den Futures-Si-Kontrakt auf USDRUB_TOM klebt.
Nun, sie kommen nicht immer zurecht - ich habe schon einmal darüber geschrieben.
Ja, sie fügen den Prädiktorindizes im Wesentlichen Rauschen hinzu. Dies kann sich auf die Quantisierungsgrenzen auswirken, indem die Auswahl der Bereiche mit Einsen erhöht wird, aber der Idee nach sollte derselbe Effekt mit der Hinzufügung von Duplikaten eintreten, nur dass ich davon ausgehe, dass Duplikate durch den CatBoost-Algorithmus vor Beginn des Trainings ausgeschnitten werden (muss überprüft werden), dann ist dies eine Option.
Wahrscheinlicher ist, dass die Quantisierung dieses Rauschen aufhebt. Wenn eine Spalte 10000 verschiedene Werte hat, ergibt sich bei einer Quantisierung auf 255 Quanten ein Durchschnitt von 40 verschiedenen Werten in einem Quantum. Oder ein anderes Beispiel - wenn es ursprünglich 1000 Beispiele gab, fügen Sie Rauschen hinzu, um 10000 Beispiele zu erhalten, und quantisieren Sie sie dann auf 255 verschiedene Quanten/Werte - meiner Meinung nach unnötige Arbeit mit diesem Zusatz von Rauschen.
Ich habe mir den Code vor kurzem angesehen - ich habe keine doppelte Entfernung gesehen. Im Gegenteil, aus 40 verschiedenen Proben werden Duplikate entfernt und zu einem Quantum zusammengeführt.
Ich denke, dass eine größere Tiefe der Bäume ebenso hilfreich ist wie eine bessere Balance.
Sie können auch versuchen, die Tiefe zu erhöhen. Sie sollten auch die Lernrate parallel verringern - dies verbessert die Ergebnisse bei unausgewogenen Stichproben.
Vielmehr wird dieses Rauschen durch die Quantisierung unterdrückt. Wenn eine Spalte 10000 verschiedene Werte enthält, ergibt eine Quantisierung auf 255 Quanten einen Durchschnitt von 40 verschiedenen Werten in einer einzigen Quantisierung. Oder ein anderes Beispiel - wenn es ursprünglich 1000 Beispiele gab, fügen Sie Rauschen hinzu, um 10000 Beispiele zu erhalten, und quantisieren Sie sie dann auf 255 verschiedene Quanten/Werte - meiner Meinung nach unnötige Arbeit mit diesem Zusatz von Rauschen.
Es gibt verschiedene Quantisierungsmethoden, die unter anderem die Verdichtung von Objekten im Bereich berücksichtigen.
Als ich mir den Code kürzlich ansah, konnte ich keine Entfernung von Duplikaten feststellen. Im Gegenteil, von 40 verschiedenen Beispielen werden Duplikate hergestellt, indem sie zu 1 Quantum kombiniert werden.
Wenn Sie den Prozess der Quantisierung (Grenzeinstellung) im Code gefunden haben, können Sie diesen Code veröffentlichen? Dort muss es Funktionen geben?
Was hat die Verbesserung der Tiefenwirkung damit zu tun?
Sie haben eine große Punktwolke der einen Klasse und ein paar Muster der anderen nebeneinander (oder vielleicht sogar darin), die nie ausgeführt werden.
Die zweite Klasse muss auf eine vernünftige Größe aufgebläht werden, oder es müssen Einklassen-Klassifizierungsalgorithmen verwendet werden.
Was hat die Verbesserung der Tiefenwirkung damit zu tun?
Sie haben eine große Punktwolke einer Klasse und ein paar Beispiele einer anderen Klasse nebeneinander (oder vielleicht sogar darin), die nie ausgeführt werden.
Die zweite Klasse muss auf ein vernünftiges Maß aufgeblasen werden
Eine Erhöhung der Tiefe wird dazu beitragen, Bereiche mit einer geringen Anzahl von Proben in den Blättern hervorzuheben. Eine andere Sache ist, dass der Prozentsatz der Blätter mit Nullen gleich bleiben kann, und dann werden nachfolgende Bäume diese Einheiten wieder verdecken. Beim Training solcher Stichproben kann man sehen, wie der Recall in der Mitte des Trainings auf Null sinkt und dann wieder auf kleine Prozentsätze zurückgeht.
Können Sie aufblasen, wenn ich eine Probe abgebe? Wenn die Methode funktioniert, dann werde ich darüber nachdenken, wie ich sie in MT5 implementieren kann.
Eine Erhöhung der Tiefe wird dazu beitragen, Bereiche mit einer geringen Anzahl von Proben in den Blättern hervorzuheben. Eine andere Sache ist, dass der Prozentsatz der Blätter mit Nullen gleich bleiben kann, und dann werden nachfolgende Bäume diese Einheiten wieder verdecken. Beim Training solcher Stichproben kann man sehen, wie der Recall in der Mitte des Trainings auf Null sinkt und dann wieder auf kleine Prozentsätze zurückgeht.
Können Sie aufblasen, wenn ich eine Probe abgebe? Wenn die Methode funktioniert, dann werde ich darüber nachdenken, wie ich sie in MT5 implementieren kann.
Ich kann das. Das ist alles Quatsch mit Blättern und so. Die Klassen müssen ausgewogen sein.
Hier ist ein Beispiel - aufgeteilt in 3 Teile, ich verstehe, dass nur train.csv geändert werden muss?
Zielspalte "Ziel_100" - die letzten 4 Spalten sind für die Ausbildung nicht relevant (Sie können sich dort auf die Datumsspalte konzentrieren) - Sie brauchen sie, um die Bilanz zu erstellen.
Es sieht so aus, als hätte ich einen profitablen Expert Advisor (Trainingsansatz) in meinem Artikel verbrannt:
Das Diagramm zeigt das finanzielle Ergebnis des Modells am Ende eines jeden Monats, wenn man das erste Modell auf 12 Monate trainiert und dann die Historie jedes neuen Monats hinzufügt - indem man den Futures-Si-Kontrakt auf USDRUB_TOM klebt.
die gewinnbringende Bilanz geht im gleichen Winkel nach oben
oder geometrisch bei Reinvestition