Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 365

 
elibrarius:

Ich habe die korrelierten Eingänge bereits entfernt und frage mich nur, wie ich die Eingänge noch verbessern kann.

Ich stimme Ihnen also zu, dass es eine Korrelation mit dem Ziel geben sollte. Deshalb möchte ich nicht mit dem Ziel korrelierte Eingaben entfernen, zum Beispiel mit Ккорр<0,5 oder 0,3. Dies sollte den Lernprozess beschleunigen, ohne die Qualität zu sehr zu beeinträchtigen. Aber es besteht die Vermutung, dass ich alle Eingaben entfernen muss )))

Bei den verwendeten Inputs (zufällig aus den Tech-Indikatoren entnommen) habe ich bisher keine Korrelation mit dem Ziel gefunden, Lernfehler = 0,44, d.h. fast eine Münze. Nun, die Bilanz wird schlechter.


auf keinen Fall sollte es eine Korrelation mit dem Ziel geben, wo steht das überhaupt geschrieben? welchen Sinn macht das? Wenn Sie eine Korrelation von 1 mit dem Ziel haben, kennen Sie die Zukunft und brauchen kein neuronales Netz.
 
Maxim Dmitrievsky:

auf keinen Fall sollte es eine Korrelation mit dem Ziel geben, wo steht das überhaupt geschrieben? welchen Sinn macht das? Wenn Sie eine Korrelation von 1 mit dem Ziel haben, kennen Sie die Zukunft und brauchen kein neuronales Netz.


Alle MO beruhen auf der Tatsache, dass die Eingangsvariablen mit der Ausgangsvariablen korrelieren müssen.

Ansonsten haben ALLE MO-Modelle keinen Sinn.

Im Data Mining implementieren ALLE VARIABLE VARIABLE SELECTION MODELS einen Mechanismus zur maximalen Korrelation von Eingangs- und Ausgangsvariablen:

Vorwärtsauswahlverfahren,
Verfahren der Rückwärtselimination,
das schrittweise Verfahren,
Best Subsets Verfahren.
 
Dimitri:


Alle MOEs beruhen auf der Tatsache, dass die Eingangsvariable mit der Ausgangsvariable korrelieren muss.

Ansonsten haben ALLE MO-Modelle keinen Sinn.

Beim Data Mining setzen ALLE VARIABLENAUSWAHLMODELLE einen Mechanismus zur Maximierung der Korrelation zwischen der Eingabevariablen und der Ausgabevariablen ein:

Vorwärtsauswahlverfahren,
Verfahren der Rückwärtselimination,
das schrittweise Verfahren,
Best Subsets Verfahren.

korrelieren in dem Sinne, dass Eingangs- und Ausgangsvektoren (Kurven) korrelieren sollten, oder bedeutet Korrelation einfach die Abhängigkeit der Ausgangsvariablen von der Eingangsvariablen in einem allgemeinen Sinne?
 
Maxim Dmitrievsky:

korrelieren in dem Sinne, dass Eingangs- und Ausgangsvektoren (Kurven) korrelieren sollten, oder bedeutet Korrelation einfach die Abhängigkeit der Ausgangsvariablen von der Eingangsvariablen in einem allgemeinen Sinne?


Abhängigkeit ist ein Spezialfall von Korrelation. Wenn zwei Variablen voneinander abhängig sind, dann besteht definitiv eine Korrelation. Wenn es eine Korrelation gibt, dann muss nicht unbedingt eine Abhängigkeit bestehen.

Es gibt keine Methoden zur Erkennung von Abhängigkeiten in statistischen Modellen. Es besteht lediglich die Hoffnung, dass die festgestellte Korrelation zwischen einer Reihe von Eingangsvariablen und einer Ausgangsvariablen eine Beziehung darstellt.

Daher müssen die Variablen korreliert sein.

 
Dimitri:


Abhängigkeit ist ein Spezialfall von Korrelation. Wenn zwei Variablen voneinander abhängig sind, besteht definitiv eine Korrelation. Wenn es eine Korrelation gibt, dann muss nicht unbedingt eine Abhängigkeit bestehen.

Es gibt keine Methoden zur Erkennung von Abhängigkeiten in statistischen Modellen. Es besteht lediglich die Hoffnung, dass die festgestellte Korrelation zwischen einer Reihe von Eingangsvariablen und einer Ausgangsvariablen eine Beziehung darstellt.

Daher müssen die Variablen korreliert sein.


Und wenn es eine umgekehrte Korrelation gibt, ist es dann keine Abhängigkeit mehr oder was? ) Und die NS werden mit diesem Ansatz nicht weiterkommen.

Halleluja... Zickzack am Eingang und Zickzack am Ausgang mit Offset... die Korrelation ist fast perfekt, aber was nützt das? )

 
Maxim Dmitrievsky:

Wenn es sich um eine inverse Korrelation handelt, ist es dann keine Korrelation mehr? ) Und NS verzettelt sich bei diesem Ansatz


Keine Korrelation liegt vor, wenn der Korrelationskoeffizient 0 ist.

Wie kann man ein Modell erstellen, wenn eingehende und ausgehende Daten überhaupt nicht korreliert sind?

 
Dimitri:


Keine Korrelation liegt vor, wenn der Korrelationskoeffizient 0 ist.

Wie kann man ein Modell erstellen, wenn die eingehenden und ausgehenden Daten überhaupt nicht korreliert sind?


Ja, denn die Korrelation von Inputs und Outputs spielt überhaupt keine Rolle, wenn das Modell nach Mustern in einer Reihe von Prädiktoren sucht... Es ist ein Widerspruch, korrelierte Inputs zu entfernen, aber nach korrelierten Inputs zu Outputs zu suchen... )) D.h. wir haben zumindest eine Eingabe, die mit der Ausgabe korreliert, dann müssen wir alle anderen Eingaben entfernen, da sie ebenfalls mit der Ausgabe und folglich mit den anderen Eingaben korreliert sind... cool, nicht wahr?
 
Maxim Dmitrievsky:

Das liegt daran, dass die Korrelation von Inputs und Outputs überhaupt nicht wichtig ist, wenn das Modell nach Mustern in einer Reihe von Prädiktoren sucht... Das ist ein Widerspruch - man entfernt korrelierte Inputs, sucht aber nach korrelierten Inputs und Outputs. )) D.h. wir haben zumindest eine Eingabe, die mit der Ausgabe korreliert ist, dann müssen wir alle anderen Eingaben entfernen, da sie ebenfalls mit der Ausgabe und folglich mit den anderen Eingaben korreliert sind... cool, oder?


Nein, nicht cool.

Wenn die erste Variable mit der Ausgangsvariable mit einem Koeffizienten von z. B. 0,7 und die zweite mit einem Koeffizienten von 0,65 korreliert ist, bedeutet das nicht, dass die beiden Variablen stark miteinander korreliert sind.

Nehmen wir nun an, dass die erste mit 0,7 und die zweite mit dem Koeffizienten von -0,69 korreliert ist.

 
Dmitry:


Nein, das ist nicht cool.

Wenn die erste Variable mit der Ausgangsvariable mit einem Koeffizienten von z. B. 0,7 und die zweite Variable mit einem Koeffizienten von 0,65 korreliert ist, bedeutet das nicht, dass die beiden Variablen überhaupt hoch miteinander korreliert sind.

Stellen Sie sich nun den ersten mit einem Koeffizienten von 0,7 und den zweiten mit einem Koeffizienten von -0,69 vor.


Und wenn man sich vorstellt, dass die Korrelation "Ähnlichkeit" auf eine sehr eigenartige Weise definiert... Ich würde dem nicht viel Glauben schenken.

Wir bauen ein genaues neuronales Hightech-Netzwerk und lassen uns bei der Auswahl der Prädiktoren von der Korrelation leiten? Das ist ein bisschen falsch oder so... aber das ist alles "meiner Meinung nach"... )

 
Maxim Dmitrievsky:

Und wenn man sich außerdem vorstellt, dass Korrelation "Ähnlichkeit" auf eine sehr merkwürdige Weise definiert... Ich würde ihr nicht viel zutrauen.


Dann die zweite Option - alles, was Sie haben, in NS stecken. Aber es gibt zwei ABERs:

1. hoffen, dass unkorrelierte Variablen die Qualität des Modells nicht verschlechtern (so etwas gibt es bei der Regression).

2. Dimensionalität und Zeit zu opfern.

Grund der Beschwerde: