Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 804

 
Yuriy Asaulenko:

Sei nicht traurig, ich bin mir dessen bewusst.) Wenn Sie sich jedoch wohler fühlen, können Sie fortfahren.

Aber Sie haben Recht.

 
Aleksey Vyazmikin:
Bitte sagen Sie mir, ob es ausreicht, in der Anfangsphase nach einer Korrelation mit den Zieldaten zu suchen, und wenn ja, welche Korrelationsschwelle sollte verwendet werden?
Die Korrelation ist eine lineare Methode. Wenn es einen gibt, hat es keinen Sinn, aus NS einen Gemüsegarten zu machen. Eine lineare Regression ist ausreichend.
 
Grigoriy Chaunin:
Die Korrelation ist eine lineare Methode. Wenn sie vorhanden ist, hat es keinen Sinn, einen Gemüsegarten mit NS anzulegen. Die lineare Regression ist ausreichend.

Ich danke Ihnen für Ihre Antwort.

Wie wäre es mit der Anwendung der linearen Regression, um die robustesten Beziehungen zu ermitteln, indem zusätzliche Merkmale hinzugefügt werden?

 
Ich verstehe die Frage nicht. Allerdings funktioniert die lineare Regression auf den Finanzmärkten nicht.
 

Darüber habe ich schon eine Weile nachgedacht.... tatsächlich.

Wir haben eine Zehn-mal-Zehn-Matrix, was können wir dazu sagen?

Die Menge der Daten beträgt 100.

Dann können wir die Menge an Informationen in diesen Daten berechnen, die auch in einigen Einheiten ausgedrückt werden. Was enthält dieser Datensatz außer der Menge der Daten und der Menge der Informationen???? Ich werde meine Zeit nicht damit verschwenden, darauf zu antworten. Die Menge des Wissens. All dies ist natürlich in Bezug auf das Ziel. Wenn wir also die Ursache-Wirkungs-Beziehung betrachten, ergibt sich folgendes Modell.

Menge des Wissens -> Menge der Daten -> Menge der Information.

Um eine Vorhersage zu treffen, muss man also nicht die Menge der Informationen, sondern nur das WISSEN über einen bestimmten Wert aus einer Reihe von Daten herausfinden.

Wissen selbst ist eine sehr zerbrechliche Sache, die durch eine ungeschickte Datenkonvertierung verloren gehen kann. Eine unvorsichtige Änderung, auch nur in einem Datensatz um einen kleinen Betrag, kann den Betrag erheblich verringern, wenn nicht sogar ganz aufheben.

Deshalb ist es nicht empfehlenswert, die Eingabedaten durch Konvertierungen zu verkomplizieren. Je komplexer die Transformation ist, desto weniger Wissen bleibt im Endergebnis übrig.

Also... Wenn man nur laut über die hohe Materie nachdenkt, werden einige Leute es nicht verstehen und ihren Weg fortsetzen, ohne die Endstation zu erreichen....

 
Mihail Marchukajtes:

Darüber habe ich schon eine Weile nachgedacht.... tatsächlich.

Wir haben eine Zehn-mal-Zehn-Matrix, was können wir dazu sagen?

Die Menge der Daten beträgt 100.

Dann können wir die Menge an Informationen in diesen Daten berechnen, die auch in einigen Einheiten ausgedrückt werden. Was enthält dieser Datensatz außer der Menge der Daten und der Menge der Informationen???? Ich werde meine Zeit nicht damit verschwenden, darauf zu antworten. Die Menge des Wissens. All dies ist natürlich in Bezug auf das Ziel. Wenn wir also die Ursache-Wirkungs-Beziehung betrachten, ergibt sich folgendes Modell.

Menge des Wissens -> Menge der Daten -> Menge der Information.

Um eine Vorhersage zu treffen, muss man also nicht die Menge der Informationen, sondern nur das WISSEN über einen bestimmten Wert aus einer Reihe von Daten ermitteln.

Wissen selbst ist eine sehr zerbrechliche Sache, die durch eine ungeschickte Datenkonvertierung verloren gehen kann. Eine unvorsichtige Änderung, auch nur in einem Datensatz um einen kleinen Betrag, kann den Betrag erheblich verringern oder sogar ganz aufheben.

Deshalb ist es nicht empfehlenswert, die Eingabedaten durch Konvertierungen zu verkomplizieren. Je komplexer die Transformation ist, desto weniger Wissen bleibt im Endergebnis übrig.

Also... Wenn man nur laut über die hohe Materie nachdenkt, werden einige Leute es nicht verstehen und ihren Weg fortsetzen, ohne die Endstation zu erreichen....

Was mehr ist, haben Sie gedacht und aufgerundet Zahlen zu Dutzenden und verlor einige Daten, es ist in der Regel schädlich zu denken, während einige Leute weiter...

 
Aleksey Vyazmikin:

Ich danke Ihnen für Ihre Antwort.

Wie wäre es mit der Anwendung der linearen Regression, um die robustesten Beziehungen zu ermitteln, indem zusätzliche Merkmale hinzugefügt werden?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
Grigoriy Chaunin:
Ich verstehe die Frage nicht, aber die lineare Regression funktioniert auf den Finanzmärkten nicht.

Es gibt also keine Korrelation? Ich glaube,Maxim Dmitrievsky hat die folgende Frage beantwortet.

Danke für die Antwort.

 
Versuchen Sie, die Autokorrektur auf Preisdaten zu übertragen, und Sie werden sofort sehen, ob es eine Korrelation gibt oder nicht. Das Hinzufügen von Indikatoren ist nutzlos. Der Indikator ist eine Funktion des Preises. Deshalb bauen wir sie nur auf Preisdaten auf.
 

Für Liebhaber von Kreuzvalidierung, Stichprobenprüfungen, OOS und anderen Dingen werde ich nicht müde, dies zu wiederholen:

SanSanych und Vladimir Perervenko im Speziellen

Tests außerhalb der Stichprobe
Dies ist die beliebteste und auch am meisten missbrauchte Validierungsmethode. Kurz gesagt, Out-of-Sample-Tests erfordern, dass ein Teil der Daten beiseite gelegt wird, um die Strategie nach ihrer Entwicklung zu testen und eine unverzerrte Schätzung der zukünftigen Leistung zu erhalten. Allerdings sind Tests außerhalb der Stichprobe
geringere Aussagekraft der Tests aufgrund einer kleineren Stichprobe
die Ergebnisse sind verzerrt, wenn die Strategie durch Mehrfachvergleiche entwickelt wird
Mit anderen Worten, Out-of-Sample-Tests sind nur bei eindeutigen Hypothesen sinnvoll. Die Verwendung von Out-of-Sample-Tests für Strategien, die mittels Data-Mining entwickelt wurden, zeigt, dass der Prozess nicht verstanden wurde. In diesem Fall kann der Test verwendet werden, um Strategien abzulehnen, aber nicht, um welche zu akzeptieren. In diesem Sinne ist der Test immer noch nützlich, aber die Entwickler von Handelsstrategien wissen, dass eine gute Leistung außerhalb der Stichproben für Strategien, die durch Mehrfachvergleiche entwickelt wurden, in den meisten Fällen ein Zufallsergebnis ist.
Es wurden einige Methoden vorgeschlagen, um die Signifikanz außerhalb der Stichprobe zu korrigieren, um eine Verzerrung durch Mehrfachvergleiche auszuschließen, aber in fast allen realen Fällen ist das Ergebnis eine nicht signifikante Strategie. Wie wir jedoch in Ref. 1 anhand von zwei Beispielen zeigen, die zwei wichtigen Marktregimen entsprechen, können hoch signifikante Strategien auch nach Korrekturen für Verzerrungen aufgrund sich verändernder Märkte scheitern. Daher sind Out-of-Sample-Tests nur dann unverzerrte Schätzungen der zukünftigen Performance, wenn die zukünftigen Renditen genauso verteilt sind wie die vergangenen Renditen. Mit anderen Worten, Nicht-Stationarität kann alle Ergebnisse von Out-of-Sample-Tests ungültig machen.


Fazit: Out-of-sample-Tests gelten nur für eindeutige Hypothesen und setzen Stationarität voraus. In diesem Fall sind sie nützlich, aber wenn diese Bedingungen nicht erfüllt sind, können sie ziemlich irreführend sein.

ROS kann nur für die Aufhebung von Hypothesen oder nur für bekannte stationäre Probleme verwendet werden.

Aber nicht für die Suche nach Strategien und die Auswahl von Merkmalen/Bewertung der Systemstabilität


Grund der Beschwerde: