Forschung in Matrix-Paketen - Seite 7

 
http://quantquant.com/viewtopic.php?f=7&t=1236
 
zaskok3:
http://quantquant.com/viewtopic.php?f=7&t=1236

Wofür ist dieser Link? Ein kurzer Kommentar wäre hilfreich.

Zum Beispiel: Eine Reihe von Links zu R- und Python-Tutorials.

Und was den Inhalt der Links angeht: Haben Sie alles aus dem Internet zusammengeklaubt? Oder gibt es irgendwelche Präferenzen? Von Python ist pyBrain am interessantesten und wert, studiert und angewendet zu werden. Es implementiert Netzwerke, die in R-Paketen nicht vorhanden sind. Keine Diskussion, keine Kritik, nur eine Bemerkung am Rande.

Viel Glück!

 
Vladimir Perervenko:

1. Ja.

2. Warum? Benötigt wird eine einzige MT4R.dll, die das Gateway ist, um Daten an R zu senden und Ergebnisse zurück zu erhalten.

3. Zu allen bestehenden Datenbanken. Und nicht nur das: Sowohl Microsoft als auch Oracle haben R in ihre Datenbanken integriert.

4. R implementiert verschiedene Möglichkeiten der Interaktion mit Matlab, vom einfachen Austausch von Matlab-Dateien bis zur Ausführung von Matlab-Funktionen aus R heraus. Wenn Sie über Erfahrung und Fachwissen in diesem Bereich verfügen, können Sie eine hervorragende Matlab-MTterminal-Kopplung mit R implementieren.

5. In R werden die Pakete für alle Richtungen einer Wissenschaft und Technik und unter Berücksichtigung der neuesten Errungenschaften realisiert. Sie können von hier aus starten.

6. Es gibt mehr als eine. Die häufigste ist ff.

Generell bin ich überrascht. Sie sind mitten im Nirgendwo. Schauen Sie sich die Artikel 1 und 2 auf dieser Website an, und Sie werden nicht viel verstehen, aber Sie werden eine Vorstellung davon bekommen, wie die Sprache funktioniert.

Ich bin dabei, den zweiten Artikel über Deep Learning fertigzustellen, den ich Ihnen hoffentlich morgen zur Überarbeitung zusenden kann, und die Beispiele werden den Experten beigefügt... Wenn Interesse besteht, werde ich wohl mehrere Artikel über die erste Ebene schreiben (Filterung, Zerlegung, Vorhersage usw.). Und natürlich sollten Sie sich weiter mit Deep Learning beschäftigen, zumal Google seine TensorFlow-Bibliothek für alle geöffnet hat. Und es gibt andere, die nicht weniger interessant und vielversprechend sind (mxnet, pyBrain).

Wenn sich eine Gruppe von Enthusiasten zusammenfindet, können wir einen Zweig der R-Sprachbenutzer organisieren.

Viel Glück!

Gute Artikel! Ich danke Ihnen. Ich werde mich damit befassen müssen. Aber ich habe vor, SVM, GBM und xGBoost anstelle von NS auszuprobieren.
 
Alexey Burnakov:
Gute Artikel! Ich danke Ihnen. Ich muss mich darum kümmern, das zu überprüfen. Aber ich habe vor, SVM, GBM und xGBoost anstelle von NS auszuprobieren.
SVM, ada, randomforest. Und das alles, nachdem ich mit diesen Paketen trainiert habe. Und danach, Prädiktorenauswahlpakete
 
Alexey Burnakov:
Gute Artikel! Ich danke Ihnen. Ich werde mich damit befassen müssen. Aber ich habe vor, SVM, GBM und xGBoost anstelle von NS auszuprobieren.

Probieren Sie sie alle aus.

Mein Favorit ist randomForest in verschiedenen Abwandlungen (der Hauptvorteil ist, dass es keine Vorverarbeitung der Eingaben erfordert). Und auch ada - sehr hohe Qualitätsbewertung. Beide haben zwei Nachteile - eine sehr lange Lernkurve und eine hohe Anfälligkeit für Übertraining.

Das bedeutet nicht, dass man sie nicht verwenden sollte, sondern nur, dass man sich der Belästigungen bewusst sein muss.

Viel Glück!

 
СанСаныч Фоменко:
SVM, ada, randomforest. All dies nach der Übung mit diesen Paketen in der Rassel. Und nach Paketen zur Auswahl von Prädiktoren
Sam Sanych, ich habe bei der Arbeit auch schon viel mit diesen Paketen geübt. ))) Nur xGBoost hat es noch nicht berührt.
 
Vladimir Perervenko:

Probieren Sie sie alle aus.

Mein Favorit ist randomForest in verschiedenen Modifikationen (der Hauptvorteil ist, dass die Eingabedaten nicht vorverarbeitet werden müssen). Auch ada - sehr hohe Qualitätsbewertung. Beide haben zwei Nachteile: Sie brauchen sehr lange, um zu lernen, und sind sehr anfällig für Überlernen.

Das bedeutet nicht, dass Sie sie nicht benutzen müssen, sondern nur, dass Sie auf diese Belästigungen achten müssen.

Viel Glück!

Ich habe eine Frage an Sie zu Artikel 1. Ich sehe in der Handelsemulationstabelle, dass der Algorithmus bei jedem Balken handelt, richtig?

Und noch eine Frage. Haben Sie beim Training auch die Maschinendaten von jedem Balken eingegeben?

Der zentrale Punkt, der Zeitreihenprobleme von den meisten anderen statistischen Problemen unterscheidet, ist, dass in einer Zeitreihe die Beobachtungen nicht unabhängig voneinander sind. Vielmehr kann ein einziges zufälliges Ereignis alle späteren Datenpunkte beeinflussen. Dadurch unterscheidet sich die Zeitreihenanalyse deutlich von den meisten anderen Bereichen der Statistik.

Aufgrund dieser Nicht-Unabhängigkeit sind die wahren Muster, die den Zeitreihendaten zugrunde liegen, bei einer visuellen Inspektion oft nur sehr schwer zu erkennen. Jeder, der sich ein typisches Zeitungsdiagramm mit Börsendurchschnittswerten angesehen hat, sieht Trends, die sich über Wochen oder Monate hinweg fortzusetzen scheinen. Statistiker, die sich mit diesem Thema befasst haben, sind sich jedoch einig, dass solche Trends im Wesentlichen mit der gleichen Häufigkeit auftreten, die man zufällig erwarten würde, und dass es praktisch keine Korrelation zwischen der Börsenbewegung eines Tages und der des nächsten Tages gibt. Wenn es eine solche Korrelation gäbe, könnte jeder an der Börse Geld verdienen, indem er einfach darauf wettet, dass sich der heutige Trend morgen fortsetzt, aber so einfach ist das nicht. In der Tat ergibt die Kumulierung fast jeder Reihe von Zufallszahlen ein Muster, das nicht zufällig aussieht.

Von:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Ich gehe davon aus, dass Sie es so verstehen, dass ein einfacher Ansatz, bei dem alle Punkte der Zeitreihe in das Training (und die Tests) einbezogen werden, zu wechselseitig abhängigen Beobachtungen führt, was die Gültigkeit der Schlussfolgerungen über die gefundenen "Muster" mit einem Schlag außer Kraft setzt. Einfach ausgedrückt: Den Ergebnissen kann man nicht trauen, selbst wenn alles andere richtig gemacht wird. Die Erstellung einer Stichprobe von Beobachtungen aus einer Zeitreihe, die nicht gegen statistische Annahmen verstößt, ist daher eine Archivierung. Sehr oft wird dieser Schritt in populären Quellen einfach ignoriert, und die Folgen sind höchst bedauerlich. Die Maschine wird die Muster nicht lernen.

 
Alexey Burnakov:

Ich habe eine Frage an Sie zu Artikel 1. Ich sehe in der Handelsemulationstabelle, dass der Algorithmus bei jedem Balken handelt, richtig?

Und noch eine Frage. Haben Sie die Maschine beim Training auch mit Daten von jedem Takt gefüttert?

Von:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Ich gehe davon aus, dass Sie es so verstehen, dass ein einfacher Ansatz, bei dem alle Punkte der Zeitreihe in das Training (und die Tests) einbezogen werden, zu wechselseitig abhängigen Beobachtungen führt, die auf einen Schlag die Gültigkeit der Schlussfolgerungen über die gefundenen "Muster" durchkreuzen. Einfach ausgedrückt: Den Ergebnissen kann man nicht trauen, selbst wenn alles andere richtig gemacht wird. Die Erstellung einer Stichprobe von Beobachtungen aus einer Zeitreihe, die nicht gegen statistische Annahmen verstößt, ist daher eine Archivierung. Sehr oft wird dieser Schritt in populären Quellen einfach ignoriert, und die Folgen sind höchst bedauerlich. Die Maschine wird die Muster nicht lernen.

Nachmittags.

dass der Algorithmus bei jedem Takt ein Geschäft macht?

Nein. Der Algorithmus verarbeitet die Signale, die am letzten gebildeten Balken empfangen wurden. Vielleicht habe ich die Frage nicht verstanden?

Eine weitere Frage. Haben Sie den Expert Advisor während des Trainings mit den Daten aus jedem Balken gefüttert?

Ich kann das nicht verstehen. Würden Sie das bitte erklären? Ich werde versuchen, sie zu beantworten.

Viel Glück!

 
Alexey Burnakov:

Ich habe eine Frage an Sie zu Artikel 1. Ich sehe in der Handelsemulationstabelle, dass der Algorithmus bei jedem Balken handelt, richtig?

Und noch eine Frage. Haben Sie die Maschine beim Training auch mit Daten von jedem Takt gefüttert?

Von:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Ich gehe davon aus, dass Sie es so verstehen, dass ein einfacher Ansatz, bei dem alle Punkte der Zeitreihe in das Training (und die Tests) einbezogen werden, zu voneinander abhängigen Beobachtungen führt, die auf einen Schlag die Gültigkeit der Schlussfolgerungen über die gefundenen "Muster" in Frage stellen. Einfach ausgedrückt: Den Ergebnissen kann man nicht trauen, selbst wenn alles andere richtig gemacht wird. Die Erstellung einer Stichprobe von Beobachtungen aus einer Zeitreihe, die nicht gegen statistische Annahmen verstößt, ist daher eine Archivierung. Sehr oft wird dieser Schritt in populären Quellen einfach ignoriert, und die Folgen sind höchst bedauerlich. Die Maschine wird die Muster nicht lernen.

In dem Artikel, auf den Sie sich beziehen, geht es um Regression. Wir haben es mit einer Klassifizierung zu tun. Das sind zwei große Unterschiede...

Ich verstehe Ihre Frage immer noch nicht.

Viel Glück!

 
Vladimir Perervenko:

In dem Artikel, auf den Sie sich beziehen, geht es um Regression. Wir haben es mit einer Klassifizierung zu tun. Das sind zwei große Unterschiede...

Ich verstehe Ihre Frage immer noch nicht.

Viel Glück!

Eine beiläufige Frage an alle, die sich an der Diskussion beteiligen. Arbeiten Sie mit Zeckendaten? Ich habe mich schon vor langer Zeit von der Balkenanalyse entfernt, ich arbeite ausschließlich mit DSP-Methoden
Grund der Beschwerde: