Ist das Konzept des RL für Handelsaufgaben nicht überflüssig? Wir haben den Einfluss der Umwelt auf den Agenten, aber gibt es auch einen Einfluss des Agenten auf die Umwelt? Es ist möglich, diesen zweiten Einfluss künstlich einzuführen, aber ist das auch sinnvoll?
Zwei (oder drei) Ideen aus dem Artikel sind für uns keineswegs überflüssig - nämlich, dass die Verlustfunktion genau das widerspiegeln sollte, was wir brauchen, und dass sie glatt (und monoton) sein sollte. In unserem Fall sollte es der Gewinn sein, und er sollte gleichmäßig und monoton von den Modellparametern abhängen.
Die Glättung eines Analogons des Gewinns kann wahrscheinlich irgendwie erreicht werden (zum Beispiel durch so etwas wie Kernel-Glättung). Aber ich bezweifle sehr, dass die Monotonie gegeben ist.
Die Grundlage des finanziellen Ergebnisses des Handels ist die Preisbewegung - ein nicht-stationärer Zufallsprozess.
Versuchen wir, einen nicht-stationären Zufallsprozess durch irgendwelche Tricks in einen glatten und monotonen Prozess zu verwandeln? Vielleicht gehen wir auf Distanz? Vor allem, wenn man bedenkt, dass ein Klassifizierungsfehler von weniger als 20 %(!) außerhalb des Trainingssatzes extrem schwer zu erreichen ist. Vielleicht sollten wir zunächst daran arbeiten, den Klassifizierungsfehler zu verringern?
Lesen Sie den Artikel.
Was nützt uns dieser Artikel?
Er ist völlig zweifelhaft.
Und zwar aus folgendem Grund.
Ich kann mich an keine Veröffentlichung über KI (MO) erinnern, die die Zukunft vorhersagen würde. Sie bringen einem Modell bei, handgeschriebene Buchstaben zu schreiben. Dann versuchen sie, diese handgeschriebenen Buchstaben zu erkennen. Aber dem Modell wird PRINZIPIELL nicht beigebracht, vorherzusagen, welcher Buchstabe als nächstes geschrieben werden wird.
Das ist das Problem, das wir haben.
Wir versuchen, mit Hilfe von MO (dieselbe Arbeit, die wir mit Candlestick-Kombinationen gemacht haben) einige Muster in den Prädiktoren zu finden, die eine korrekte Vorhersage liefern werden. Es gibt jedoch keine Garantie dafür, dass die gefundenen Muster auch in Zukunft korrekte Vorhersagen liefern werden. "Richtige" Muster werden einen Fehler ergeben und "falsche" Muster werden das Richtige vorhersagen. Der Grund dafür liegt in den Klassifizierungsalgorithmen selbst, die die VERLÄSSLICHKEIT einer Klasse angeben, nicht ihren Wert. Wir verwenden die primitivste Regularisierung von 0,5 zur Einteilung in Klassen. Und wenn beim Training die Wahrscheinlichkeit eines "richtigen" Musters = 0,5000001 ist, warum nehmen wir dann diese Wahrscheinlichkeit als Klassenwert?
Um davon wegzukommen, fangen wir an, einen Gemüsegarten anzubauen, aber die Werte der Prädiktoren, unter denen wir nach Mustern suchen, sind entweder NICHT stationär oder pseudostationär und haben eine entfernte Beziehung zum Preis!
Die Glättung eines Analogons des Gewinns kann wahrscheinlich irgendwie erreicht werden (zum Beispiel durch so etwas wie Kernel-Glättung). Aber ich bezweifle sehr, dass sie monoton ist.
Ich verstehe nicht wirklich, was mit "Glattheit" gemeint ist und warum "Glattheit" notwendig ist....
Vielleicht können wir eine multikriterielle Optimierung verwenden, um die beste Lösung für dieses Problem zu finden.
Die Grundlage des finanziellen Ergebnisses des Handels ist die Preisbewegung - ein nicht-stationärer Zufallsprozess.
Versuchen wir, einen nicht-stationären Zufallsprozess mit einigen Tricks in einen glatten und monotonen Prozess zu verwandeln? Vielleicht gehen wir auf Distanz? Vor allem, wenn man bedenkt, dass ein Klassifizierungsfehler von weniger als 20 %(!) außerhalb der Trainingsmenge extrem schwer zu erreichen ist. Vielleicht sollten wir zunächst daran arbeiten, den Klassifizierungsfehler zu verringern?
Ich habe über die Eigenschaften der Verlustfunktion gesprochen, die durch das Training des Modells minimiert wird. Genauer gesagt, über ihre ideale Form.
Ich verstehe nicht wirklich, was die Glätte ausmacht und warum Glätte notwendig ist.
Es geht um die Grundlagen der Optimierung. Die Glätte ermöglicht eine Optimierung mit Hilfe eines Gradienten. Andernfalls bleiben nur brutale Algorithmen übrig.
Das sind die Grundlagen der Optimierung
Ja, das weiß ich, aber vor kurzem wurde über die Glätte der Kapitalkurve selbst gesprochen, so dass ich mich nicht wirklich mit diesen Diskussionen befasst habe, deshalb frage ich, was Sie meinen.
