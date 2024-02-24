Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 388
Ich habe bereits Prädiktoren, so seltsam das auch sein mag. Ich habe einen fertigen Bot, den ich in weniger als einem Monat gebaut habe. Das Wichtigste - Prädiktoren, das steht außer Frage, ja. Nun, das ist, wer hat Erfahrung in was... Zum Beispiel, mit meiner entzündeten Phantasie Prädiktoren können auf der Stelle abgeholt werden, habe ich als Analyst für 5 Jahre gearbeitet :) Meiner Meinung nach ist die Auswahl von Prädiktoren keine so schwierige Aufgabe wie das Studium von NS-Architekturen, die Hauptsache ist, dass man sich hinsetzt und auswählt, das dauert 2-3 Wochen :)
Und in Zahlen?
Für die Trainingsstichprobe, die Teststichprobe und die Validierungsstichprobe.
Das Wichtigste: eine neue Datei, die ursprünglich von den drei vorherigen getrennt war.
Diese vier Werte sollten sich nicht allzu sehr voneinander unterscheiden. Weichen sie um mehr als 10 % voneinander ab (z. B. 30 % Abweichung und 35 % Abweichung), sollten Sie sie vergessen.
Und was ich auf dem realen Konto habe, spielt überhaupt keine Rolle - die Signale sterben nach einem Jahr oder sogar nach zwei Jahren.
Was ist mit der Tatsache, dass Inkremente in keiner Weise Trends anzeigen?
Ja, das tun sie.
Entweder sagt das Modell den Anstieg oder die Richtung voraus - dafür sind Klassifizierungsmodelle da.
Mir sind keine Klassifizierungsmodelle bekannt, die Bewegungen in den Nachrichten erkennen. Und das ist bei GARCH der Sinn des Modells - die eingetretene Bewegung herauszuarbeiten. Fat Tails - dies ist die Bewegung in den Nachrichten, wenn Trends brechen und scharfe Umkehrungen auftreten.
Nun, Sie können den Anstieg in verschiedenen Zeiträumen beobachten.
Es gibt interessante GARCH-Modelle für verschiedene Zeitrahmen. Die Bedeutung ist die folgende.
Angenommen, wir sagen den Zuwachs auf H1 voraus. Das Modell benötigt Eingangsdaten, die die Verteilung charakterisieren. Als solche Eingangsdaten (in der Regel die Volatilität) nehmen wir nicht die vorherige Stunde, sondern die Minuten innerhalb der aktuellen Stunde.
Meiner Meinung nach ist es wichtig, die gesamte Geschichte in Intervalle mit gleichem Verhalten zu unterteilen. Zum Beispiel, hier ist ein Bild von EURUSD Schlusskurs für 5 Jahre, können Sie sehen, dass es einen Trend bis etwa 2Q14, dann den Rest von 14 und Anfang 15 ist ein anderer, und danach die dritte begann und ist noch im Gange. Der Versuch, die Durchschnittstemperatur im Krankenhaus zu ermitteln und sie zur Diagnose des Zustands eines einzelnen Patienten zu verwenden, ist meiner Meinung nach falsch.
Wenn wir zum Beispiel den aktuellen Trend irgendwo vom Anfang des 15. Jahrhunderts bis heute nehmen und zumindest die Trends und die Periodizität isolieren/extrapolieren, erhalten wir imho ein recht glaubwürdiges Ergebnis. Hier ist das Bild, in grün ist die Schlusskursvorhersage für die nächsten paar Wochen.
Ich brauche nicht so viele nutzlose Stichproben, es gibt genug Training und Tests, ich wähle die Parameter über GA aus, dann wähle ich die Ergebnisse, die am ähnlichsten zu back und forward sind. Sie werden nie ein Modell für den gesamten Kursverlauf trainieren, außerdem bieten Sie 3 unabhängige Zeiträume an, und der Handel am 4. ist unsinnig, wenn Sie am Markt handeln, da sich der Markt in dieser Zeit verändert. Stellen Sie also sicher, dass das Modell in dem Bereich außerhalb der Trainingsstichprobe nicht überangepasst ist, und das war's.
Ich trainiere jede Woche neu, bisher steht die zweite Woche bei +35%. Worum es geht, es ist echtes Geld )
Und was ist das echte Geld wert ist nichts, es gibt Signale, die in einem Jahr oder sogar zwei sterben ...
Bitte sagen Sie mir, welche Prädiktoren Sie verwenden?
Wollen Sie ernsthaft ein Marktmodell für die nächsten Jahre schaffen...?
Nein, natürlich nicht.
Ich bin damit beschäftigt, einige Garantien für die Zukunft zu bekommen.
Ich habe auch zwei Grundstücke.
Das erste Diagramm: Drei Stichproben werden zufällig entnommen und gelernt-geprüft-geprüft. Der letzte Abschnitt, der auf den ersten folgt, ist ein sequentieller Lauf, vorzugsweise mit einem Prüfer.
Völlig vergessen, obwohl ich das schon oft geschrieben habe.
Der oben beschriebene Schritt ist der zweite Schritt.
Der erste Schritt ist die Auswahl von Prädiktoren, die für die Zielvariable "relevant" sind. Ich kann nachweisen, dass sehr gute Ergebnisse mit denjenigen Prädiktoren erzielt werden, bei denen Prädiktoren, die nichts mit der Zielvariablen zu tun haben - das Rauschen -, überwiegen. Die Trainingsergebnisse sind bei Lärm sehr gut. Und es ist mir gelungen, bei allen drei oben genannten Teilen einen Fehler von weniger als 10 % zu erreichen, nämlich nur 3 %! Und dann habe ich beim zweiten Teil einen völlig zufälligen Fehler.
Wenn Sie damit beginnen, die Rauschprädiktoren auszusortieren, steigt der Fehler während des Trainings an, sinkt aber im zweiten Abschnitt. Wenn man die Rauschprädiktoren weglässt, erhält man ungefähr den gleichen Fehlerwert. Bei meinen Prädiktoren liegt er bei etwas weniger als 30 %.