Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 482

 
Aleksey Terentev:
Und ja, es gibt einen Grund für die Normalisierung. Er springt und normalisiert die Daten in verschiedenen Zeitintervallen unterschiedlich.

Ja, ich werde versuchen, das Problem irgendwann zu lösen.

 
Maxim Dmitrievsky:

Nein, ich habe bereits den Bildschirm zitiert, die Inkremente sind stationär und symmetrisch auf beiden Seiten von Null, so dass die Wahrscheinlichkeiten +- gleich sein werden


Maxim Maxim Dmitrievsky: Das mag sein, aber als ich versuchte, die Symmetrie im Preisverhalten aufzudecken, konnte ich sie nicht finden.

Mit Verlaub.
 
Andrey Kisselyov:
Wahrscheinlich wird es so sein, aber als ich versuchte, eine Symmetrie im Preisverhalten zu finden, konnte ich sie nicht erkennen.

Mit Verlaub.

Hier ist die Wahrscheinlichkeit im Wesentlichen 50/50 (über/unter Null) - ob es zu der Klasse gehört oder nicht, und alle anderen Werte sind Signalstärke. Selbst wenn also die Inkremente für Kauf und Verkauf nicht symmetrisch sind, sollte NS dies von selbst verstehen :)

 
Maxim Dmitrievsky:

Hier ist die Wahrscheinlichkeit im Wesentlichen 0 und 1 - ob es zur Klasse gehört oder nicht, und alle anderen Werte sind Signalstärke. Selbst wenn also die Inkremente für Kauf und Verkauf nicht symmetrisch sind, sollte der NS dies selbst verstehen :)

Meiner Meinung nach ist es in diesem Fall notwendig, wie ich oben sagte, einen dritten Zustand zu haben, eine bestimmte Grenze, bis zu der das Signal weder zum Kauf noch zum Verkauf gehört.

Herzliche Grüße.

 
Andrey Kisselyov:

Meiner Meinung nach ist es in diesem Fall notwendig, wie ich oben sagte, einen 3-Zustand zu haben, eine Grenze, bis zu der das Signal weder zum Kauf noch zum Verkauf gehört.

Herzliche Grüße.


dann werden wir beide Klassen mit der gleichen Wahrscheinlichkeit ansprechen

 
Maxim Dmitrievsky:

dann mit gleicher Wahrscheinlichkeit beiden Klassen zuzuordnen

NS sollte diese Grenze im Grunde selbst finden, sie muss nur im Code angegeben werden, und sie muss nicht unbedingt für beide Richtungen gleich wahrscheinlich sein.

Mit Verlaub.
 
Maxim Dmitrievsky:

Am Beispiel eines linearen Klassifikators. Angenommen, wir bringen einem Klassifikator etwas bei, indem wir 2 Ausgänge mit Preisschritten von 0 bis 1 eingeben, wobei 0,5 kein Signal ist (die Summe der Ausgänge ist immer gleich eins)

An diesem Satz ist etwas falsch. Wenn Sie einen Klassifikator unterrichten, wird der Lehrer nicht Inkremente von 0 bis 1 unterrichten, sondern eher bestimmte Werte wie -1 und 1 (fallender Preis / steigender Preis). Durch die Erstellung einer Trainingstabelle und eines Lehrers für das Modell werden die Inkremente auf -1 und 1 gerundet und alle Informationen über den Wert des Inkrements gehen verloren.

Im weiteren Verlauf wird das Modell trainiert, und einige Klassifizierungsmodelle können bei der Vorhersage in der Tat eine Klassenwahrscheinlichkeit anstelle der strengen Werte -1 und 1 angeben. Diese Wahrscheinlichkeit hat jedoch nichts mit dem Wert des Wachstums zu tun, sondern kann so interpretiert werden: "Der Preis wird mit einer Wahrscheinlichkeit von X % wahrscheinlich um einen unbekannten Wert des Wachstums steigen".


Maxim Dmitrievsky:

Und wenn wir ein neuronales Netz mit nichtlinearer Klassifizierung nehmen, sagen uns die Ausgaben etwas über die Signalstärke oder zeigen sie nur den Grad der Zugehörigkeit zu einer von 2 Klassen an und nicht mehr

Auch hier gibt es nur Grade der Zugehörigkeit zu 1 von 2 Klassen und nicht mehr. Die auf dem Bild gezeigte Anforderung wird nicht erfüllt. Wenn Sie den Wert des Wachstums wissen wollen, müssen Sie eine Reihe von Klassen mit verschiedenen Wachstumsstufen anlegen.



Anstelle der Klassifizierung kann auch eine Regression verwendet werden. Und es wird ein Regressionsmodell benötigt. Dann ist es möglich, Preiserhöhungen während des Trainings ohne Änderungen und Rundungen einzugeben, und wenn das Modell eine hohe Genauigkeit erreichen kann, wird es die Größe der Erhöhung anstelle von Wahrscheinlichkeiten und Klassen vorhersagen. Das ist sehr praktisch.

Obwohl ich in Forex mit der Regression nicht mehr erreicht habe als mit der einfachen Klassifizierung. Das Modell lieferte bei der Vorhersage sehr kleine Werte, obwohl es in mehr als 50 % der Fälle die Richtung erriet, aber es war nicht möglich, die Höhe des erwarteten Anstiegs anhand der Vorhersage zu schätzen. Das Ergebnis wurde wie bei den beiden Klassen behandelt - "der Preis wird wahrscheinlich um einen unbekannten Betrag steigen".

 
Maxim Dmitrievsky:

Helfen Sie mir, den Prozess zu verstehen :)

Am Beispiel eines linearen Klassifikators. Nehmen wir an, wir bringen dem Klassifikator etwas bei, indem wir Preisschritte von 0 bis 1 in 2 Ausgänge eingeben, wobei 0,5 kein Signal ist (die Summe der Ausgänge ist immer gleich eins)

Zeichnen wir einfach eine Regressionslinie, z. B. nach den Preisen, so liegen die größeren Preisschritte weiter von der Linie entfernt, die kleineren näher, d. h. wenn die Klassifikatorausgänge 0,9; 0,1 sind, liegt der positive Schritt weit von der Linie entfernt, d. h. das Signal 0,9 wird stärker sein als das Signal 0,6 zum Kauf

Und wenn wir ein neuronales Netz mit nichtlinearer Klassifizierung nehmen, zeigen die Ausgaben die Signalstärke an oder geben sie nur den Grad der Zugehörigkeit zu einer von 2 Klassen an und nicht mehr

D.h. ob diese Bedingung erfüllt sein wird:


Mir scheint, dass in dieser Situation die Hälfte der Anfänger, die sich mit der Materie nicht so gut auskennen, auf die Nase fallen werden. Der Grund dafür ist, dass der Grad der Zugehörigkeit zu dieser oder jener Klasse intuitiv auf eine größere oder geringere Signalstärke schließen lässt. Aber ob es tatsächlich so ist und ob es nicht besser ist, mehr Klassen zu schaffen, auf die man die Werte der Inkremente, sagen wir, in % verteilen kann, dann wird das Erhalten des Wertes in dieser oder jener Klasse (eine von 10, nehmen wir an) schon genau den Wert des Inkrements auffordern.

Wenn man ein solches Merkmal wie die Signalstärke am Ausgang haben möchte, warum sollte man dann ein Klassifizierungsproblem lösen wollen, das bei jeder Erhöhung der Anzahl der Klassen endlich (diskret) bleibt. Nehmen Sie die Regressionsaufgabe und geben Sie -1(100% VERKAUFEN) bis 1(100% KAUFEN) oder gleichmäßige Punkte bei der Trainingsausgabe - negativ für VERKAUFEN und positiv für KAUFEN, Null wird flach sein, wie es sein sollte.

P.S.
bereits in der vorherigen Nachricht geschrieben - ungefähr das Gleiche gemeint...

 
Dr. Trader:

An diesem Satz ist etwas falsch. Wenn Sie einen Klassifikator trainieren, wird der Lehrer nicht die Inkremente von 0 bis 1 sein, sondern bestimmte Werte wie -1 und 1 (Preisrückgang/Preisanstieg). Durch die Erstellung einer Trainingstabelle und eines Lehrers für das Modell werden die Inkremente auf -1 und 1 gerundet und alle Informationen über den Wert des Inkrements gehen verloren.

Im weiteren Verlauf wird das Modell trainiert, und einige Klassifizierungsmodelle können in der Tat eine Klassenwahrscheinlichkeit anstelle der strengen Werte -1 und 1 angeben. Diese Wahrscheinlichkeit steht jedoch in keinem Zusammenhang mit dem Wert des Inkrements, sondern kann als "der Preis wird mit einer Wahrscheinlichkeit von X % wahrscheinlich um einen unbekannten Betrag des Inkrements steigen" interpretiert werden.


Auch hier gibt es nur Grade der Zugehörigkeit zu 1 von 2 Klassen und nicht mehr. Die Anforderung wie auf dem Bild wird nicht erfüllt. Wenn Sie wissen wollen, wie groß die Schrittweite ist, müssen Sie eine Reihe von Klassen für verschiedene Schrittweiten erstellen.



Anstelle der Klassifizierung können Sie auch eine Regression verwenden. Und es wird ein Regressionsmodell benötigt. Beim Training können Sie dann Preisschritte ohne Änderungen und Rundungen eingeben, und wenn das Modell eine hohe Genauigkeit erreicht, wird es die Höhe des Anstiegs anstelle von Wahrscheinlichkeiten und Klassen vorhersagen. Das ist sehr praktisch.

Obwohl ich in Forex mit der Regression nicht mehr erreicht habe als mit der einfachen Klassifizierung. Das Modell erzeugte bei der Vorhersage sehr kleine Werte, obwohl es in mehr als 50 % der Fälle die Richtung erriet, aber es war nicht möglich, die Höhe des erwarteten Anstiegs anhand der Vorhersage zu schätzen. Das Ergebnis wurde wie bei den beiden Klassen behandelt - "der Preis wird wahrscheinlich um einen unbekannten Betrag steigen".


Verstehe :) also hat die Ausgabewahrscheinlichkeit der Klassenzuordnung nichts mit dem wahrscheinlichen Wert des Inkrements zu tun... sehen Sie, manche Leute kommen auch hier durcheinander, es ist ein unklarer Punkt für Anfänger... Andererseits, wenn ein neuronales Netz Wahrscheinlichkeiten ausgibt (z.B. Softmax-Schicht), wozu brauchen wir sie dann, wenn die Klassenzugehörigkeit durch eine Wahrscheinlichkeit von mehr als 0,5 bestimmt wird? Und dann können Sie wirklich versuchen, ein Regressionsmodell zu verwenden und die Normalisierung der Ausgabewerte loszuwerden... Übrigens verwende ich Zufallswälder und die Normalisierung der Eingaben ist dort nicht erforderlich

 
Iwan Negreshniy:

Wenn man ein solches Merkmal wie die Signalstärke am Ausgang haben möchte, warum sollte man dann das Klassifizierungsproblem lösen, das bei jeder Erhöhung der Anzahl der Klassen endlich (diskret) bleibt. Nehmen Sie das Regressionsproblem und geben Sie -1 (100% VERKAUFEN) bis 1 (100% KAUFEN) oder allgemein in Punkten - negativ für VERKAUFEN und positiv für KAUFEN, während Null, wie es sein sollte, flach sein wird.

P.S.
haben bereits in der vorherigen Nachricht geschrieben - ungefähr das Gleiche gemeint...


Ja, es stellt sich heraus, dass die Regression intelligenter sein wird (ich verwende RF, nicht das neuronale Netz)