Diskussion zum Artikel "Gradient Boosting (CatBoost) für die Entwicklung von Handelssystemen. Ein naiver Zugang" - Seite 4
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Auch wenn es Überschneidungen gibt, ist es immer noch ein ziemlich komplexes Thema, so dass verschiedene Erklärungen zu diesem Thema auf den Punkt kommen werden. ))))
Und es werden nur wenige Fragen gestellt - auch hier, als Maxim den Trick mit dem teilweisen Gedächtnisverlust zeigte :)
Das ist lustig, ich dachte, wenn die Erwartung so niedrig ist, es ist ein Tester Gral. Ich lief es auf Saber, auf einem benutzerdefinierten Symbol, fast das gleiche Ergebnis.
Überprüft 17 Jahr, gibt es einen ähnlichen Aufwärtstrend, es ist Entwässerung.
Ist es so ein Glücksfall der Geschichte oder kann man so ein Bild auch für die letzten Jahre bekommen? Ich weiß, dass es auf dem Test verliert, aber es war ein ganz anderer Markt dort.
Ich habe 4 sko geprüft, das Ergebnis ist signifikant. Das Komische ist, dass ich noch nie Sharpe's über 3 gesehen habe, gibt es so etwas?Ich bin nicht sicher, ob ich die Frage verstehe. Ist das ein gutes Training? Das ist bei allen so.
Das ist kein Problem, das Problem ist die Verallgemeinerung für neue Daten.
Zu den Daten von Saber: Soweit ich weiß, ist nicht jedes Währungspaar geeignet, und er optimiert, d. h. er geht über die Modelle hinweg.
Rein theoretisch... wenn man eine Zufallsstichprobe nimmt und lange Zeit nachtrainiert, kann man ein gutes Modell finden. In der Praxis habe ich X2 oos +- bekommen, d.h. bei neuen Daten hat es zeitlich so lange funktioniert wie traine\valid. Manchmal ein wenig mehr.
Es ist wünschenswert, es irgendwo in der Wolke zu tun, der Laptop erlaubt es nicht
Ich bin mir nicht sicher, ob ich die Frage verstehe. Ist das eine gute Ausbildung? Bei jedem von ihnen.
Das ist kein Problem, das Problem ist die Generalisierung für neue Daten.
Zu den Saber-Daten: Soweit ich weiß, ist nicht jedes Währungspaar geeignet, und er führt eine Optimierung durch, d. h. er geht die Modelle durch.
Rein theoretisch... wenn man eine Zufallsstichprobe nimmt und lange Zeit nachtrainiert, kann man ein gutes Modell finden. In der Praxis habe ich X2 oos +- bekommen, d.h. bei neuen Daten hat es zeitlich so lange funktioniert wie traine\valid. Manchmal ein bisschen mehr.
Es ist wünschenswert, es irgendwo in der Wolke zu tun, der Laptop erlaubt es nicht
Ich verstehe die Begriffe nicht, es randomisiert die TK-Parameter, macht Durchläufe und versucht, den Bereich der besten Parametersätze für das TK-Ergebnis zu finden. Das ist Optimierung. Da gibt es kein Modell. Es gibt Modelle in NS mit MO.
Was ich an den Begriffen nicht verstehe, ist, dass die TK-Parameter zufällig gewählt werden, Durchläufe gemacht werden und versucht wird, den Bereich mit den besten Parametersätzen für das TK-Ergebnis zu finden. Das ist Optimierung. Es gibt kein Modell. Es gibt Modelle in NS mit MO.
Ein TS mit einer Reihe von Parametern ist ein Modell.
Und es werden nur wenige Fragen gestellt - auch hier, als Maxim einen Trick mit teilweisem Gedächtnisverlust zeigte :)
Welche Art von Gedächtnisverlust?
Was hat es mit dem Gedächtnisverlust auf sich?
Hier schaffen wir ein Gedächtnis für vergangene Bewegungen mit einer Etikettenbindung:
Der letzte Schritt besteht darin, zusätzliche Spalten mit versetzten Zeilen durch look_back depth zu erstellen, was bedeutet, dass zusätzliche (verzögerte, verzögerte) Merkmale zum Modell hinzugefügt werden.
Weitere Vermischung:
Unter der Annahme, dass die Durchmischung gleichmäßig ist, bedeutet dies, dass wir beim Training Spalteninformationen über die Hälfte der Stichprobe über frühere und aktuelle Rückkehrer erhalten haben. In einem relativ kleinen Zeitraum, in dem es möglich ist, die Volatilität auf diese Weise anzupassen, funktioniert das Modell aufgrund des Wissens über den Markt, aber sobald sich dieser signifikant ändert, kann das Modell nicht mehr funktionieren. Hier schien es mir eher ein Gedächtniseffekt zu sein als die Identifizierung eines allgemeinen Musters. Maxim, korrigieren Sie mich, wenn Sie es anders sehen.
Hier erstellen wir eine Erinnerung an vergangene Bewegungen mit einer Bindung an einen Tag:
Weiteres Mischen:
Unter der Annahme, dass die Durchmischung gleichmäßig ist, bedeutet dies, dass wir beim Training Informationen über vergangene und gegenwärtige Renditen in Spalten für die Hälfte der Stichprobe erhalten haben. In einem relativ kleinen Zeitraum, in dem es möglich ist, die Volatilität auf diese Weise anzupassen, funktioniert es aufgrund des Wissens über den Markt, aber sobald sich dieser signifikant verändert, kann das Modell nicht mehr funktionieren. In diesem Fall schien es mir eher ein Gedächtniseffekt zu sein, als ein allgemeines Muster zu erkennen. Maxim, korrigieren Sie mich, wenn Sie es anders sehen.
Wenn man sich die Merkmale selbst ansieht - sie haben eine serielle Korrelation (Autokorrelation), wenn man sich die Bezeichnungen ansieht - das Gleiche. Serielle Korrelation führt zu einer falschen Modellschätzung, zu falschem Training. Ein grobes Beispiel (oder auch nicht) ist das Übertraining für die Volatilität, ja. Shuffling ist eine primitive Methode, um die Serialität ein wenig aufzubrechen, und das Shuffling von Train und Test ist eine Art Ausgleich der Daten in beiden Sets. Dieses Problem muss ernsthafter und nicht auf so primitive Weise angegangen werden, und dem wollte ich den nächsten Artikel widmen. Denn es ist ein separates, ziemlich großes Thema.
Es wäre ein interessanter Artikel, wenn er die Frage lösen würde, ob es überhaupt möglich ist, Proben auf der Grundlage ihrer Ähnlichkeit zu mischen.
Soweit ich verstanden habe, ist es möglich, wenn die Proben ähnlich sind, aber wenn sie sich deutlich unterscheiden, ist es nicht möglich. In unserem Fall arbeiten wir mit einem sich verändernden Markt, und die Frage nach der Möglichkeit der Vermischung wird durch das Zeitintervall bestimmt.... Ich würde gerne ein spezifisches numerisches Kriterium für die Bewertung der Ähnlichkeit zweier Proben mit einem Test der Theorie über die Zulässigkeit ihrer Vermischung sehen. Informationen zum Nachdenken.
Hier erstellen wir eine Erinnerung an vergangene Bewegungen mit einer Bindung an einen Tag:
Weiteres Mischen:
Unter der Annahme, dass die Durchmischung gleichmäßig ist, bedeutet dies, dass wir beim Training Informationen über vergangene und gegenwärtige Renditen in Spalten für die Hälfte der Stichprobe erhalten haben. In einem relativ kleinen Zeitraum, in dem es möglich ist, die Volatilität auf diese Weise anzupassen, funktioniert es aufgrund des Wissens über den Markt, aber sobald sich dieser signifikant verändert, kann das Modell nicht mehr funktionieren. In diesem Fall schien es mir eher ein Gedächtniseffekt zu sein, als ein allgemeines Muster zu erkennen. Maxim, korrigieren Sie mich, wenn Sie es anders sehen.
Wenn man sich die Vorzeichen selbst ansieht, weisen sie eine serielle Korrelation (Autokorrelation) auf, und wenn man sich die Beschriftungen ansieht, gilt dasselbe. Die serielle Korrelation führt zu einer falschen Schätzung des Modells, zu einem falschen Training. Ein grobes Beispiel (oder vielleicht auch nicht) ist das Übertraining für die Volatilität. Shuffling ist eine primitive Methode, um die Serialität ein wenig aufzubrechen, und das Shuffling von Train und Test ist eine Art Ausgleich der Daten in beiden Sets. Dieses Problem muss ernsthafter und nicht auf so primitive Weise angegangen werden, und dem wollte ich den nächsten Artikel widmen. Denn es ist ein eigenes, ziemlich großes Thema.
Das Mischen von train und test ist meiner Meinung nach nicht notwendig, wie ich oben geschrieben habe.
Es handelt sich einfach um N Inkremente innerhalb eines Schiebefensters. Das Mischen der Zuggarnitur verändert den Baum in keiner Weise