Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2563

 
Maxim Dmitrievsky #:

dann müssen Sie genauer sein.

Ich überlege, einen Artikel zu schreiben, in dem ich genauer erkläre, was ich tue.

Ich wollte hier ähnliche Ansätze diskutieren, aber es stellte sich heraus, dass kein Interesse bestand.

Kurz gesagt, ich gehe in Etappen vor:

1. Mit Hilfe von CatBoost speichere ich verschiedene Arten von Quantentabellen mit unterschiedlicher Anzahl von "Quanten" (erzwungene Pre-Splits).

2. ich analysiere jedes Quantum durch das Skript auf Stabilität und Vorhersagekraft des Indikators.

2.1 Überschreiten des Schwellenwerts für Vollständigkeit und Genauigkeit in der gesamten Stichprobe.

2.2 Bewertung der Stabilität der Abweichung des Zielindikators des Prädiktors vom Zielindikator im Stichprobenbereich - Ich nehme 7 Punkte und sortiere nach RMS aus.

3. ich wähle die besten Quanten aus allen Tabellen für jeden Prädiktor aus, wobei ich berücksichtige, dass sie sich in dem Bereich, für den die Quantisierung stattgefunden hat, nicht überschneiden.

4. Ich erstelle eine neue Stichprobe (zwei Typen kombiniert über alle Quanten und keine), bei der der Prädiktor aus den Quanten ein Signal von 0 oder 1 hat.

5. Ich schließe Prädiktoren aus, die in der Stichprobe ein ähnliches Signal aufweisen.

6. Das Modell lehren.

Wenn wir nach Punkt 5 auch eine Robustheitsprüfung der Test- und Prüfungsstichprobe durchführen und nur die Prädiktoren auswählen, die ein zufriedenstellendes Ergebnis zeigen, dann verbessern sich die Trainingsergebnisse erheblich. Dies ist eine Art von Betrug, aber ob es sich lohnt oder nicht, muss man ausprobieren. Ich gehe davon aus, dass je länger die Indikatoren stabil sind, desto wahrscheinlicher ist es, dass sie auch weiterhin stabil sind.

Wenn Sie Fragen zu einer bestimmten Phase haben, fragen Sie, ich werde versuchen, mehr Informationen zu geben.

P.S. Sie könnten auch einfach die Quantentabelle der Stichprobe speichern, ineffiziente Prädiktoren ausschließen und mit einer regulären Stichprobe trainieren - auch das wird den Lernprozess verbessern.
 
Aleksey Vyazmikin #:

Ich überlege, einen Artikel zu schreiben, in dem ich genauer erkläre, was ich tue.

Ich wollte hier ähnliche Ansätze diskutieren, aber es stellte sich heraus, dass kein Interesse bestand.

Kurz gesagt, ich gehe in Etappen vor:

1. Mit Hilfe von CatBoost speichere ich verschiedene Arten von Quantentabellen mit unterschiedlicher Anzahl von "Quanten" (erzwungene Pre-Splits).

2. ich analysiere jedes Quantum durch das Skript auf Stabilität und Vorhersagekraft des Indikators.

2.1 Überschreiten des Schwellenwerts für Vollständigkeit und Genauigkeit in der gesamten Stichprobe.

2.2 Bewertung der Stabilität der Abweichung des Zielindikators des Prädiktors vom Zielindikator im Stichprobenbereich - Ich nehme 7 Punkte und filtere nach dem RMS aus.

3. ich wähle die besten Quanten aus allen Tabellen für jeden Prädiktor aus, wobei ich berücksichtige, dass sie sich in dem Bereich, für den die Quantisierung stattgefunden hat, nicht überschneiden.

4. Ich erstelle eine neue Stichprobe (zwei Typen kombiniert über alle Quanten und keine), bei der der Prädiktor aus den Quanten ein Signal von 0 oder 1 hat.

5. Ich schließe Prädiktoren aus, die in der Stichprobe ein ähnliches Signal aufweisen.

6. Das Modell lehren.

Wenn wir nach Punkt 5 auch eine Robustheitsprüfung der Test- und Prüfungsstichprobe durchführen und nur die Prädiktoren auswählen, die ein zufriedenstellendes Ergebnis gezeigt haben, dann verbessern sich die Trainingsergebnisse erheblich. Dies ist eine Art von Betrug, aber ob es sich lohnt oder nicht, muss man ausprobieren. Ich gehe davon aus, dass je länger die Indikatoren stabil sind, desto wahrscheinlicher ist es, dass sie auch weiterhin stabil sind.

Wenn Sie Fragen zu einem bestimmten Schritt haben - fragen Sie, ich werde versuchen, mehr Informationen zu geben.

P.S. Sie können auch einfach die Quantentabelle der Stichprobe speichern, ineffiziente Prädiktoren ausschließen und mit einer regulären Stichprobe trainieren - auch das wird den Lernprozess verbessern.

Was sind Quantentabellen? Baumpartitionierungstabellen? So etwas habe ich noch nie gemacht.

besser ein Artikel mit Beispielen
 
Maxim Dmitrievsky #:

Was sind Quantentabellen? Baumpartitionierungstabellen? Ich habe noch nie eine gemacht.

besserer Artikel mit Beispielen

Quantentabellen partitionieren einen Prädiktor in Grenzen/Bereiche, die dann in das Lernen einbezogen werden. Ja, ich habe schon oft darüber geschrieben.

 
Aleksey Vyazmikin #:

Quantentabellen sind eine Partitionierung des Prädiktors in Grenzen/Bereiche, die dann in das Lernen einbezogen werden. Ja, ich habe schon oft darüber geschrieben.

Oh, ich verstehe. Es scheint, dass die Quantisierung der Chips nur dazu dient, das Lernen zu beschleunigen. Oder ist es eine schwere Aufgabe? Ich bin nur ein Verfechter des klassischen Ansatzes und bringe ein bisschen meine eigenen Perversionen ein.
 
Vladimir Baskakov #:
Ihr habt noch nichts Nützliches gezeigt, sondern nur geplappert. Nerds

Beobachten Sie weiter.

 
Aleksey Vyazmikin #:

Quantentabellen sind eine Partitionierung des Prädiktors in Grenzen/Bereiche, die dann in das Lernen einbezogen werden. Ja, darüber habe ich schon oft geschrieben.

Es geht darum, was wir quantifizieren, wie und zu welchem Zweck.

 
Aleksey Nikolayev #:

Es geht darum, was wir quantifizieren, wie wir es quantifizieren und zu welchem Zweck.

Ich habe einmal die Quantisierung durch Equity Monotonicity Plots ausprobiert, wenn ein Prädiktor anstelle der Zeit verwendet wird. Ich habe nichts besonders Gutes gesehen.

 
Hat jemand versucht, das Montichol-Paradoxon auf den Handel/die Entscheidungsfindung anzuwenden?
 
Maxim Dmitrievsky #:
Ah, ich hab's. Es scheint, dass die Quantisierungsfunktion nur dazu dient, das Lernen zu beschleunigen. Oder ist es eine schwere Aufgabe? Ich bin nur ein Verfechter des klassischen Ansatzes und bringe ein bisschen meine eigenen Perversionen ein.

Die Lernbeschleunigung ist einer der Vorteile, aber es gibt auch den Effekt der Aggregation ähnlicher Prädiktorzustände. Grob gesagt, behandle ich einen Partitionierungsabschnitt als einen separaten binären Prädiktor, der das Rauschen aus dem Basisprädiktor entfernt.

Zusätzlich zum Effekt des verbesserten Lernens kann ich die Anzahl der Bäume im Modell reduzieren, die ähnliche Ergebnisse liefern, und somit das Rauschen im Modell verringern.

Ich experimentiere mit starren Rahmentabellen, d.h. die Partitionierung basiert nicht auf Daten, sondern auf bestimmten Kriterien, z.B. Fibonacci-Levels...

 
Aleksey Nikolayev #:

Es geht um das Quantum, das Wie und den Zweck.

Das ist es, was ich geschrieben habe - dass es darum geht, ein konsistentes Muster zu identifizieren, das einen statistischen Vorteil in einem bestimmten Bereich bietet. Und wir quantifizieren Prädiktoren - jeden Prädiktor.

Und "wie" man das macht, ist eine offene Frage - bisher nur eine Suche nach vorgefertigten Tabellen, die auf empirischen Annahmen oder dem statistischen Partitionierungsalgorithmus CatBoost basieren.

In Abbildung 3 "Quanten" - höchstwahrscheinlich gewählt mittleren Bereich, der einige stat Vorteil hat.