Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1533

 
Maxim Dmitrievsky:

Ich schrieb oben. Das Grundmodell auf der einen Hälfte der Teile, das zweite Korrekturmodell auf der anderen Hälfte

dann genügen 5-10 Fouls, und noch mehr

Was oben geschrieben wurde, ist klar.

Ich verstehe nur nicht, was "5-10 Fouls" bedeutet.

 
Aleksey Vyazmikin:

Was oben geschrieben wurde, ist klar.

Ich verstehe nur nicht, was "5-10 Fouls" bedeutet.

Aufteilung des Datensatzes in gleiche Abschnitte, z. B. 5 Stück

1,3,4 zusammenführen und das Hauptmodell an ihnen unterrichten

2,5 kombinieren. Trainieren Sie das 1. Modell an ihnen und erhalten Sie die Ergebnisse.

Trainieren Sie das 2. Modell auf diesen 2,5 mit den Ergebnissen des 1. Modells und korrigieren Sie unrentable Trades.

Führen Sie beide Modelle auf dem gesamten Datensatz und auf neuen Daten durch und sehen Sie sich die Ergebnisse an.

 
Aleksey Vyazmikin:

Was genau soll neu berechnet werden?

Wie in einem Portfolio üblich - Gewichtung (Vermögenswerte, Systeme). In Ihrem Fall könnte es zum Beispiel sein, 0 - virtuelles Blatt Signal Handel, 1 - real und Sie können -1 - Signal Umkehrung hinzufügen. Jedes Portfolio entspricht einem Vektor der Länge 0, 1 oder -1. Die Optimierung erfolgt z.B. für jeden letzten Monat nach Gewinn mit Abzügen für Drawdown und Portfoliovolumen.

 
Maxim Dmitrievsky:

Aufteilung des Datensatzes in gleich große Abschnitte, z. B. 5 Stück

Kombinieren Sie 1,3,4 und trainieren Sie das Hauptmodell auf diese Weise

2,5 kombinieren. Führen Sie das 1. Modell an ihnen durch, um Ergebnisse zu erhalten.

Trainieren Sie das 2. Modell auf diesen 2,5 mit den Ergebnissen des 1. Modells und korrigieren Sie unrentable Trades.

Führen Sie beide Modelle mit dem gesamten Datensatz und den neuen Daten aus und sehen Sie sich die Ergebnisse an.

Ah, jetzt verstehe ich, ich wollte nur die Stichprobe verwechseln und das zweite Modell sozusagen dort trainieren, wo das erste nicht trainiert wurde. Ich muss darüber nachdenken, wie es umgesetzt werden kann, aber wahrscheinlich nicht in diesem Projekt, außer um das zweite Modell im Jahr 2019 zu unterrichten, aber dann gibt es keinen Platz, um die Ergebnisse außerhalb der Ausbildung zu überprüfen.

 
Aleksey Nikolayev:

Wie in einem Portfolio üblich - Gewichtung (Vermögenswerte, Systeme). In Ihrem Fall könnte es zum Beispiel sein, 0 - virtuelles Blatt Signal Handel, 1 - real und Sie können -1 - Signal Umkehrung hinzufügen. Jedes Portfolio entspricht einem Vektor der Länge 0, 1 oder -1. Die Optimierung erfolgt z.B. für jeden letzten Monat nach Gewinn mit Abzügen für Drawdown und Portfoliovolumen.

Hier stellt sich die Frage, wie oft die Koeffizienten geändert werden - wenn sie selten sind, hinken wir dem Trend hinterher, wenn sie häufig sind, haben wir eine schreckliche Anpassung, da die Strategie selbst Drawdowns zulässt, während das Blatt möglicherweise nie ein Signal während eines Quartals gibt, was diesen Ansatz erschwert.

 
Maxim Dmitrievsky:

Es scheint, als ob das Testgerät repariert wurde, kein Peeken mehr, Ergebnisse:

EURUSD train+valid, 10k Balken


EURUSD testet 50k Barren

Dasselbe Modell, trainiert auf EURUSD, aber getestet auf GBPUSD, 50k Bars

Das gleiche Modell wurde auch für USDCHF trainiert.

Das scheint sinnvoll zu sein. Es gibt sozusagen einen Wachstumstrend.)

Vielleicht habe ich etwas übersehen, aber auf Anhieb ist es deutlich besser als der Wald von alglib (obwohl ich eine Menge anderer Dinge hinzugefügt habe, um es zu verbessern)

Es läuft schnell, es gibt eine Menge Signale, wir können versuchen, ein Portfolio zu erstellen. In welchem Zeitraum wird die Stichprobe durchgeführt?

 
Aleksey Vyazmikin:

Zügig laufen, viele Signale, Sie können versuchen, ein Portfolio zu machen. Und wie groß ist die Zeitspanne der Stichprobe?

Eineinhalb Jahre und 15 Minuten oder so.

Ich muss den Drawdown und alles andere reinigen, das werde ich tun.

 
Maxim Dmitrievsky:

Eineinhalb Jahre und 15 Minuten oder so.

Nun, es ist ein Probelauf, ich muss den Drawdown und alles andere bereinigen, und das werde ich auch tun.

Es scheint eine Menge Handel zu geben, als ob der Spread nicht alles auffrisst... Wie auch immer, das Potenzial ist vorhanden - viel Glück!

 

Ich beschloss, ein wenig auf die Dynamik der metrischen Indikatoren der Modelle während der Aufteilung zu schauen, nahm 1, 20 und 48 Schritte (die letzte verarbeitet), erhielt ich die folgende Übersichtstabelle.

Indikatoren aus der für die Ausbildung verwendeten Stichprobe.

Die Ergebnisse scheinen mir interessant zu sein; zunächst einmal sollte ich beachten, dass wir mit Bäumen arbeiten, die nur 52%-53% Genauigkeit liefern, was für das Modell als Ganzes sehr niedrig ist.Wir sind jedoch nicht am gesamten Modell interessiert, denn für den Handel ist es wichtiger, in die richtige Richtung einzusteigen, als einen Einstieg zu verpassen, und deshalb sollten wir uns in erster Linie für die Genauigkeit der Klassifizierung interessieren, und wir können sehen, dass die Genauigkeit der Klassen "-1" und "1" zu einem bestimmten Zeitpunkt um 4 % und 3 % höher war als in der ursprünglichen Version, während die Genauigkeit der Klasse "0" nur um 1-2 % abnahm, aber gleichzeitig die Vollständigkeit der Klassen "-1" und "1" abnahm und die Vollständigkeit der Klasse "0" mit ihr wuchs.

In diesem Stadium wurden etwa 10 % der Wurzelprädiktoren aus der Stichprobe entfernt - einer bei jedem Schritt -, aber das Modell ist nicht zusammengebrochen und sogar die einzelnen, für uns wichtigen Indikatoren haben sich verbessert.

Natürlich kann man mehr Informationen über die Dynamik erhalten, wenn man alle 48 Splits verarbeitet, vielleicht gibt es Lücken in den Indikatoren, oder im Gegenteil, alle Indikatoren bewegen sich in dem ausgewählten Vektor. Aber das Wichtigste ist meiner Meinung nach, dass der Handel seine eigene Methode der Modellerstellung braucht, deren Prinzip nicht darin besteht, zu versuchen, die gesamte Struktur zu beschreiben, sondern einen Teil der Struktur besser zu verstehen als andere Teile, und nun ein gutes Modell, in allen Methoden, die ich kenne, wird das Modell durch Entropie oder Logloss geschätzt, d.h. für das Lernen des gesamten Modells - Wissen über Null und Eins, wenn Sie so wollen, während wir nur mehr über die Eins wissen müssen.

Wie ich bereits gezeigt habe, verbessert der Baum nach Blättern und meine Methode der Auswahl nach Blättern die Klassifizierungsgenauigkeit der Trainingsstichprobe im Vergleich zum herkömmlichen Modell um 20-25 %.

Die Frage ist, wie wir den Prozess beschleunigen können. Ich suche nach interessierten Personen, mit denen wir zusammenarbeiten können, um die Funktionsweise des R-Skripts, das jetzt Bäume erzeugt, zu überdenken und über eine Verbesserung und Beschleunigung der Methodik nachzudenken.

 
Aleksey Vyazmikin:

Ich beschloss, mir die Dynamik der metrischen Indikatoren der Modelle während der Aufteilung ein wenig anzusehen, nahm 1, 20 und 48 Schritte (den letzten verarbeiteten), und es ergab sich die folgende zusammenfassende Tabelle.

Indikatoren aus der für die Ausbildung verwendeten Stichprobe.

Die Ergebnisse scheinen mir interessant zu sein; zunächst einmal sollte ich beachten, dass wir mit Bäumen arbeiten, die nur 52%-53% Genauigkeit liefern, was für das Modell als Ganzes sehr niedrig ist.Wir sind jedoch nicht am gesamten Modell interessiert, denn für den Handel ist es wichtiger, in die richtige Richtung einzusteigen, als einen Einstieg zu verpassen, und deshalb sollten wir uns in erster Linie für die Genauigkeit der Klassifizierung interessieren, und wir können sehen, dass die Genauigkeit der Klassen "-1" und "1" zu einem bestimmten Zeitpunkt um 4 % und 3 % höher war als in der ursprünglichen Version, während die Genauigkeit von "0" nur um 1-2 % geringer war, aber gleichzeitig nimmt die Vollständigkeit von "-1" und "1" ab, während die Vollständigkeit von "0" gleichzeitig zunimmt.

In diesem Stadium wurden etwa 10 % der Wurzelprädiktoren aus der Stichprobe entfernt - einer bei jedem Schritt -, aber das Modell ist nicht zusammengebrochen und sogar die einzelnen, für uns wichtigen Indikatoren haben sich verbessert.

Natürlich kann man mehr Informationen über die Dynamik erhalten, wenn man alle 48 Splits verarbeitet, vielleicht gibt es Lücken in den Indikatoren, oder im Gegenteil, alle Indikatoren bewegen sich in dem ausgewählten Vektor. Aber das Wichtigste ist meiner Meinung nach, dass der Handel seine eigene Methode der Modellerstellung braucht, deren Prinzip nicht darin besteht, zu versuchen, die gesamte Struktur zu beschreiben, sondern einen Teil der Struktur besser zu verstehen als andere Teile, und nun ein gutes Modell, in allen Methoden, die ich kenne, wird das Modell durch Entropie oder Logloss geschätzt, d.h. für das Lernen des gesamten Modells - Wissen über Null und Eins, wenn Sie so wollen, während wir nur mehr über die Eins wissen müssen.

Nun, wie ich bereits gezeigt habe, verbessert der Baum nach Blättern und meine Methode der Auswahl nach Blättern die Klassifizierungsgenauigkeit der Trainingsstichprobe um 20-25 % im Vergleich zum herkömmlichen Modell.

Die Frage ist, wie ich den Prozess beschleunigen kann. Ich suche nach interessierten Personen, mit denen ich zusammenarbeiten kann, um die Funktionsweise des R-Skripts zu überdenken, das derzeit Bäume erzeugt, und um über eine Verbesserung und Beschleunigung der Methodik nachzudenken.

Sie haben also einen Logloss von ~1, das Modell ist also im Fluss.

Möchten Sie einen separaten Logloss für eine einzelne Eingabe finden? D.h. die Menge an Informationen, die zwischen den Werten auf dem Blatt und den Zielwerten liegt?

Die "Nichtstun"-Klasse ist im Verhältnis zu den anderen eindeutig unausgewogen, da ich oben geschrieben habe, dass dies aufgrund des 3-Klassen-Modells ein Problem darstellen könnte. Andere Indikatoren sind deprimierend.