Diskussion zum Artikel "Random-Forest-Vorhersage-Trends" - Seite 3

 
Ist sie derzeit rentabel?
 
fozi:
Ist es im Moment rentabel?

Das Beispiel in dem Artikel ist demonstrativ, extrem redundant.

Wenn wir über Random Forests im Besonderen und die Anwendung von Modellen des maschinellen Lernens im Allgemeinen sprechen (neuronale Netze gehören zu dieser Klasse von Algorithmen), werden sie häufig im Handel eingesetzt.

PS. Es gibt eine Menge NS-Anhänger im Forum. Es handelt sich also nicht um die effizientesten Algorithmen für den Handel. Zufällige Wälder sind viel effizienter.

 
faa1947:

Das Beispiel in dem Artikel hat Demonstrationscharakter und ist extrem redundant.

Wenn wir über Random Forests im Besonderen und die Anwendung von Modellen des maschinellen Lernens im Allgemeinen sprechen (neuronale Netze gehören zu dieser Klasse von Algorithmen), sind sie im Handel weit verbreitet.

PS. Es gibt eine Menge NS-Anhänger im Forum. Es handelt sich also nicht um die effizientesten Algorithmen für den Handel. Zufällige Wälder sind viel effektiver.

Wo sind Sie geblieben?

Schon lange nichts mehr von Ihnen gehört?

 
Vinin:

Wo bist du gewesen?

Schon lange nichts mehr von dir gehört?

Nein, ich war hier, ich habe nur nicht daran teilgenommen, und dann habe ich ein bisschen Graphomanie bekommen. Ich habe einen Artikel geschrieben und einige Ergebnisse meiner Arbeit in Form eines Buches zusammengefasst, ich habe schon lange nichts mehr geschrieben.
 

Haben Sie einen Link zu weiterführenden Informationen?

 
Smart14:

Haben Sie Links zu ausführlicherem Material?

Es gibt eine Menge Literatur zu diesem Thema, vor allem in englischer Sprache.

Ich habe ein Buch mit dem Titel "Predicting Trends" (Trends vorhersagen) geschrieben, in dem Klassifizierungsprobleme viel ausführlicher als in diesem Artikel behandelt werden. Das Buch enthält wörtliche Übersetzungen der technischen Dokumentation (ca. 30 %), Beispiele für die Anwendung von Klassifizierungsmodellen auf dem Devisenmarkt (ca. 20 % des Textes) und Erklärungen zur Ideologie der Erstellung von Klassifizierungsmodellen. Es beschreibt auch die Abfolge der Schritte zum Aufbau eines auf Klassifikationsmodellen basierenden Expert Advisors.

Weitere Einzelheiten finden Sie im Anhang.

PS. Das Buch enthält eine recht umfangreiche Literaturliste zu diesem Thema.

Dateien:
PredictTrend.zip  858 kb
 

vlad19492014.11.23 15:

Lieber Vlad!

Alle Argumente über die Effizienz von Algorithmen des maschinellen Lernens machen nur unter einer Bedingung Sinn: Das Modell wird nicht neu trainiert. In meiner Praxis ist es sehr schwierig, ein untrainiertes Modell zu erhalten, insbesondere in dieser Arbeit ist es ein übertrainiertes Modell.

Das Übertrainieren des Modells entsteht durch einen fehlerhaften Satz von Prädiktoren, in denen der ganze Hund begraben ist. Daher sollten alle Anstrengungen auf die Auswahl der Prädiktoren und dann auf das Modell gerichtet sein.

Mir scheint, dass es mir gelungen ist, formale Anzeichen für die Eignung der Prädiktoren für eine bestimmte Zielvariable zu finden. Wenn Sie daran interessiert sind, bin ich gerne bereit, dies unter vier Augen zu besprechen.

 
faa1947:

vlad19492014.11.23 15:

Lieber Vlad!

Alle Argumente über die Effizienz von Algorithmen des maschinellen Lernens machen nur unter einer Bedingung Sinn: Das Modell wird nicht neu trainiert. In meiner Praxis ist es sehr schwierig, ein untrainiertes Modell zu erhalten, insbesondere in dieser Arbeit ist es ein übertrainiertes Modell.

Das Übertrainieren des Modells entsteht durch einen fehlerhaften Satz von Prädiktoren, in denen der ganze Hund begraben ist. Daher sollten alle Anstrengungen auf die Auswahl der Prädiktoren und dann auf das Modell gerichtet sein.

Mir scheint, dass es mir gelungen ist, formale Anzeichen für die Eignung der Prädiktoren für eine bestimmte Zielvariable zu finden. Wenn Sie daran interessiert sind, würde ich mich freuen, dies unter vier Augen zu besprechen.

тттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттт

Natürlich bin ich interessiert. Schreiben Sie

 

vlad19492014.11.23 15:

http://a ppliedpredictivemodeling.com/blog/2014/11/11/some-thoughts-on-do-we-need-hundreds-of-classifiers-to-solve-real-world-classification-problems

Ich habe diesen Link mit einem Kommentar in meinem Blog veröffentlicht. Es hat sich niemand dafür interessiert. Hier ist der Artikel selbst

 
faa1947:

Eine Übertrainierung des Modells entsteht durch die falsche Auswahl von Prädiktoren, in denen der ganze Hund begraben ist. Daher sollten alle Anstrengungen auf die Auswahl der Prädiktoren und dann auf das Modell gerichtet sein.

Das Modell und die Auswahl der Prädiktoren sind miteinander verknüpft. Zunächst sollte man ein Modell auswählen und dann die Prädiktoren auf der Grundlage dieses Modells auswählen, indem man mit demselben Modell diejenigen Prädiktoren auswählt, die den geringsten "Nutzen" für die Vorhersage haben. In vielen Artikeln und Lehrbüchern wird jedoch etwas anderes gelehrt: Zunächst werden die Prädiktoren anhand einer Methode zur Berechnung der Beziehung zwischen diesen Prädiktoren und der Zielreihe - dem Ergebnis - ausgewählt. Die gebräuchlichsten Screening-Methoden sind der Korrelationskoeffizient zwischen Prädiktoren und Output und die gegenseitige Information. Dann wird ein Modell ausgewählt, das in der Regel nichts mit der Auswahl der Prädiktoren zu tun hat. Wenn man darüber nachdenkt (und das wird einem in Ökonometrie-Lehrbüchern nicht gesagt, man muss selbst nachdenken), wählt die Methode der Auswahl von Prädiktoren nach dem Korrelationskoeffizienten mit dem Output im Wesentlichen diejenigen Prädiktoren aus, die den kleinsten Fehler in einem linearen Regressionsmodell (LRC) aufweisen. Die Methode der Auswahl von Prädiktoren nach ihrer gegenseitigen Information mit dem Output wählt im Wesentlichen diejenigen Prädiktoren aus, die den geringsten Fehler in einem auf Nadaraya-Watson-Regression basierenden Modell ergeben (abstruse Bezeichnung GRNN).

Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.