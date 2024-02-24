Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 179
Meinen Sie die PCA-Komponentenanalyse oder etwas anderes? Ich kann mich nicht mehr an alle Beispiele erinnern, die ich hier veröffentlicht habe :)
Wenn es um PKA geht, kann man aus Müll sowieso kein Bonbon machen. Man muss ziemlich gute Prädiktoren mit schlechten mischen, dann kann die PCA die schlechten von den guten aussieben.
Sie unterschätzen die positiven Ergebnisse Ihrer Erfahrung. Es gibt keine Grale. Es gibt jedoch ein umfassendes Instrument zur Bekämpfung solcher Übel wie Übertraining.
Der allererste Schritt besteht darin, den absoluten Müll auszusortieren - das ist es, was einen entscheidenden Einfluss auf das Übertraining hat. Und in diesem ersten Schritt ist die PCA sehr nützlich. Nach diesem Schritt bleiben die für die Zielvariable relevanten Prädiktoren übrig, und alle Fantasie verschwindet. Überschätzen Sie aber nicht die Bedeutung dieses Schrittes - es ist der erste Schritt. Danach sind die nächsten Schritte erforderlich:
Und Ihre Experimente mit der rfa werden sich als äußerst nützlich erweisen.
PS.
Beachten Sie, dass ich die Arbeit mit den Modellen selbst bewusst nicht erwähnt habe.
Sie unterschätzen die positiven Ergebnisse Ihrer Erfahrung. Es gibt keine Grale. Es gibt ein umfassendes Instrument zur Bekämpfung der Geißel des Übertrainings.
Der allererste Schritt besteht darin, den reinen Unsinn auszusortieren - und das ist es, was die Umschulung entscheidend beeinflusst. Und in diesem ersten Schritt ist die PCA sehr nützlich. Nach diesem Schritt bleiben die für die Zielvariable relevanten Prädiktoren übrig, und alle Fantasie verschwindet. Überschätzen Sie aber nicht die Bedeutung dieses Schrittes - es ist der erste Schritt. Danach sind die nächsten Schritte erforderlich:
Und Ihre Experimente mit der rfa werden sich als äußerst nützlich erweisen.
PS.
Über die Arbeit mit den Modellen selbst habe ich absichtlich geschwiegen.
Sie unterschätzen die positiven Ergebnisse Ihrer Erfahrung. Es gibt keine Grale. Es gibt ein umfassendes Instrument zur Bekämpfung der Geißel des Übertrainings.
Der allererste Schritt besteht darin, den reinen Unsinn auszusortieren - und das ist es, was die Umschulung entscheidend beeinflusst. Und in diesem ersten Schritt ist die PCA sehr nützlich. Nach diesem Schritt bleiben die für die Zielvariable relevanten Prädiktoren übrig, und alle Fantasie verschwindet. Überschätzen Sie aber nicht die Bedeutung dieses Schrittes - es ist der erste Schritt. Danach sind die nächsten Schritte erforderlich:
Und Ihre Experimente mit der rfa werden sich als äußerst nützlich erweisen.
PS.
Über die Arbeit mit den Modellen selbst habe ich absichtlich geschwiegen.
Erneutes Trainieren des Modells auf jeder Bar.... Bedeutet dies, dass ein einzelner Balken das gesamte Modell beeinflusst? Angesichts der Bedeutung jedes Taktes für das Lernen ist es verständlich, dass Sie immer wieder mit Umschulungen zu kämpfen haben...
Das Modell, das ich jetzt versuche, auf Vordermann zu bringen - das tue ich, ja, ich lerne mit jeder neuen Bar mehr. Um ehrlich zu sein, sehe ich keine großen Auswirkungen... Manchmal bleibt das Modell für Dutzende von Balken hintereinander dasselbe wie zuvor (der Mechanismus zum Schutz vor Modellüberanpassung). Aber wenn ein Banker in den Nachrichten etwas Falsches sagt und der Kurs sich in die falsche Richtung bewegt, besteht die Hoffnung, dass das Modell innerhalb von ein paar Takten alle jüngsten Änderungen aufholt. Es ist nicht sehr sinnvoll, das Modell an jeden Balken anzupassen, aber wenn es eine Möglichkeit gibt, schnell auf Veränderungen zu reagieren, ist es schade, sie nicht zu nutzen.
Können Sie mehr über PCA erklären? Wie beseitigt man Müll auf diese Weise?
Vor etwa hundert Seiten hat Sannych in diesem Thema einen Link zu dem Artikel "Hauptkomponentenanalyse" gepostet. Ich habe ihn benutzt, um einen Code zu erstellen, und ihn auch hier eingegeben. Sie müssen viele Seiten lesen, um sie zu finden.
Dieser Artikel hat mir auch gefallen, aber er enthält weder R noch MQL, sondern nur Excel. Aber es erklärt das Prinzip der Funktionsweise deutlicher. h ttp://www.chemometrics.ru/materials/textbooks/pca.htm
Darf ich mehr über PCA sagen? Wie kann man auf diese Weise den Müll aussortieren?
Sehen Sie , wie die Hauptkomponentenmethode funktioniert.
Es gibt aber auch einen interessanten Kommentar von darkAlert, der erklärt, warum diese Methode bei einigen Anwendungsaufgaben nicht funktioniert. Ich zitiere:
"Sie haben vergessen zu erwähnen, dass PCA (wie andere klassische multivariate Datenreduktionsmethoden) nur nach linearen Abhängigkeiten sucht..."
Für den Handel ist diese Methode nicht geeignet, da die Vorhersageeigenschaften in Form der Werte von Indizes und Oszillatoren, die den Eingängen zugeführt werden, von Natur aus nicht linear sind.
^GSPC stammt von http://finance.yahoo.com, ich denke, es ist zuverlässig.
UNRATE, PAYEMS, GDP stammen von FRED (wahrscheinlich https://fred.stlouisfed.org/), das ist der schwierige Teil, danke für die Warnung.
Ich würde später lieber den eurusd stündlich verwenden.
*Jemand hat etwas gerieben, es war eine Antwort auf die Tatsache, dass alle diese staatlichen Indizes manchmal neu berechnet werden und ihre historischen Werte ändern.
Du kannst, aber ich werde es nicht verraten)))
Die Bedeutung wird aus dem Gewicht der Verzweiflung berechnet. Das war's. Ob zu verwenden oder nicht,
, ob Dimensionsreduzierung notwendig ist, ob man nicht am Ende das Kind mit dem Bade ausschüttet,
gelten für abysmal oder Pre-Processing... eine andere Frage...
Ich bin nicht tun Preprocessing in einer viel einfacheren Weise mit einigen Daten gelöscht, die ich denke, ist nicht gut..... Denn es ist notwendig, jedes Signal an TC weiterzuleiten, ohne es zu löschen. Es gibt nur eine Idee, nämlich die Ausgangsvariable mit der Eingangsvariable in Einklang zu bringen. So, ein bisschen was passt schon :-) BUT
Wenn man berücksichtigt, dass die Ausgangsvariable durch die Menge des TZ-Gewinns gesteuert wird, dann kann man durch die Änderung dieses Parameters auf jeden Fall wissen, welche Qualität unsere Eingangsdaten haben. HM.... Lassen Sie mich das erklären. Es gibt eine Philosophie der Auswahl der Ausgangsvariablen Ein einfaches Beispiel: Wir haben zwei Signale:
Gewinn von 1 Pip für Blau. In meinen Setup-Bedingungen steht, dass die Signale mit mehr als 50 Pips mit einem markiert werden sollen. Dieses blaue Signal wird als 0 markiert, obwohl der Markt dazu neigt, nach oben zu gehen und dieses blaue Signal als 1 markiert werden könnte. Durch die Anpassung des Gewinnparameters können wir also weitere in unseren Outputsatz einbeziehen und ausschließen, um die maximale Generalisierungsfähigkeit zu erhalten..... Dies kann in einem Bereich von minus 100 Pips erfolgen. Mit der Brute-Force-Methode dauert es verdammt lange, selbst in 10er-Schritten sollte es mindestens zehnmal laufen...... Wie auch immer, die Frage bleibt offen.
Können Sie die PCA näher erläutern? Wie kann man auf diese Weise Müll aussortieren?
Ich bin nicht nur zu faul, um in diesem Thread einen Link für Sie zu finden, sondern ich brauche ihn auch nicht.
Wenn Sie so freundlich wären, diesen Thread zu lesen. Der PKA siebt den Müll nicht einfach so aus - es gibt da eine Nuance. Es ist also sinnvoll, danach zu suchen.
Das Modell, das ich jetzt versuche, auf Vordermann zu bringen - das tue ich, ja, ich lerne mit jeder neuen Bar mehr. Um ehrlich zu sein, sehe ich keine großen Auswirkungen... Manchmal bleibt das Modell für Dutzende von Balken hintereinander dasselbe wie zuvor (der Mechanismus zum Schutz vor Modellüberanpassung). Aber wenn ein Banker in den Nachrichten etwas Falsches sagt und der Kurs sich in die falsche Richtung bewegt, besteht die Hoffnung, dass das Modell innerhalb von ein paar Takten alle jüngsten Änderungen aufholt. Es ist nicht sinnvoll, das Modell an jeden Balken anzupassen, aber wenn es eine Möglichkeit gibt, schnell auf Veränderungen zu reagieren, sollten wir sie nutzen.
Ich habe immer wieder versucht, eine Idee voranzutreiben, die für mich offensichtlich ist: Es gibt kein einziges Werkzeug, das verwendet werden kann, ohne dass das Modell mit einem kleinen Fehler neu trainiert werden muss.
Man muss nach dem Motto vorgehen: den offensichtlichen Müll bereinigt, skaliert, vielleicht Voh-Soh, Prädiktoren ausgewählt, ein Modell ausgewählt..... und dann stellt sich heraus, dass alles verworfen werden muss, da das Ziel einfach ein totaler Blindgänger ist....
In meiner Praxis gibt es bei jedem Schritt buchstäblich 3-5% Fehler im Minus. Und wenn das Modell ursprünglich einen Fehler von mehr als 40 % aufwies und neu trainiert wurde, gelang es mir, das nicht trainierte Modell auf 20 % zu senken. Etwa sechs Monate Arbeit.
OK, gibt es hier irgendwelche Experten für MQLs???? Da wir alle hier sind :-)
Können Sie mir sagen, wie ich die eine Variable so optimieren kann, dass die andere auf 0 kommt? ???? Oder zumindest nahe bei Null .....
Generell Optimierung einer Variablen auf der Grundlage einer anderen Variablen....