Der erste Gedanke, der mir beim Lesen des Artikels kam, war "was für eine schlampige Übersetzung".
Ich habe nachgeschaut, woher der Autor stammt - es stellte sich heraus, dass es doch keine Übersetzung war)))
В качестве инструмента для предсказания поведения валютных пар выберем систему R, которая идеально подходит для задач предсказания на финансовых рынках и, в частности, предсказания поведения валютных пар.
Ich wollte nichts Schlechtes sagen, sondern nur meine Gedanken äußern. Der Artikel kann gut sein, er kann sehr gut sein......
Interessiert sich für die Idee selbst (wusste nichts von Random Forest ). Künstlich auferlegtes Werkzeug. Ich möchte wiederholen, ohne es - es ist nicht klar angegeben, was genau getan wurde, welche Daten-Vektoren verwendet werden. Zickzack-Parameter werden weggelassen. Ist das Zielpublikum Benutzer des Rattle-Pakets? Oder diejenigen, die in R schreiben? Ohne deren Studium sind viele Punkte des Artikels unverständlich. Die Schlussfolgerungen sind weitschweifig - aus dem Artikel geht nicht hervor, ob diese Richtung vielversprechend ist oder nicht. Es wäre möglich, Beispiele für den Handel zu nennen. Allgemeiner Eindruck - als ob er für einen engen Kreis geschrieben wurde.
PS. Beim Versuch, TC.Rdata aus dem Artikel zu öffnen, erscheint folgendes:
Ошибка в sqrt(ncol(crs$dataset)) : нечисловой аргумент для математической функции Вдобавок: Предупреждение In rm(crs) : объект 'crs' не найден
Interessiert sich für die Idee selbst (wusste nichts von Random Forest). Künstlich auferlegtes Werkzeug. Ich möchte wiederholen, ohne es - es ist nicht klar angegeben, was genau getan wurde, welche Daten-Vektoren verwendet werden. Zickzack-Parameter werden weggelassen. Ist das Zielpublikum Benutzer des Rattle-Pakets? Oder diejenigen, die in R schreiben? Ohne deren Studium sind viele Punkte des Artikels unverständlich. Die Schlussfolgerungen sind weitschweifig - aus dem Artikel geht nicht hervor, ob diese Richtung vielversprechend ist oder nicht. Es wäre möglich, Beispiele für den Handel zu nennen. Der allgemeine Eindruck ist, als ob er für einen engen Kreis geschrieben wurde.
Da ist man sehr pingelig. Ich z.B., der ich kein Mathematiker bin, habe das Wesentliche ganz gut verstanden, bis auf einige Punkte, die ausführlicher hätten erklärt werden müssen.Zum Beispiel habe ich den Begriff "Baumsplitting" nicht ganz verstanden, er kommt mehrmals vor und es ist nicht ganz klar, was genau damit gemeint ist. Und was die Schlussfolgerungen angeht, welche Schlussfolgerungen brauchen Sie? "Auf die Barrikaden gehen"? Mir zum Beispiel wurde nach der Lektüre dieses Artikels klar, dass ich ein Fahrrad erfinde, indem ich versuche, ähnliche Algorithmen selbst zu erfinden, anstatt eine vorgefertigte Lösung zu verwenden.So wie ich es verstanden habe, bestand die Hauptidee darin, das R-Paket bei statistisch interessierten Amateuren (aber nicht bei "Dummies") bekannt zu machen. Und das ist meiner Meinung nach ganz gut gelungen.
Interessiert sich für die Idee selbst (wusste nichts von Random Forest). Künstlich auferlegtes Werkzeug. Ich möchte wiederholen, ohne es - es ist nicht klar angegeben, was genau getan wurde, welche Daten-Vektoren verwendet werden. Zickzack-Parameter werden weggelassen. Ist das Zielpublikum Benutzer des Rattle-Pakets? Oder diejenigen, die in R schreiben? Ohne deren Studium sind viele Punkte des Artikels unverständlich. Die Schlussfolgerungen sind weitschweifig - aus dem Artikel geht nicht hervor, ob diese Richtung vielversprechend ist oder nicht. Es wäre möglich, Beispiele für den Handel zu nennen. Allgemeiner Eindruck - als ob er für einen engen Kreis geschrieben wurde.
PS. Und beim Versuch, TC.Rdata aus dem Artikel heraus zu öffnen, wird folgendes angezeigt:
Zielpublikum - Benutzer des Rattle-Pakets? Oder diejenigen, die in der Sprache R schreiben? Ohne sie zu studieren, sind viele Punkte des Artikels unverständlich.
Bei der Verwendung von Rattle sehe ich zwei Zielgruppen:
Ungeübte R-Benutzer, die ihre eigene .csv-Eingabedatei zusammenstellen und die Ergebnisse von 6 Modellen, nicht nur Zufallswäldern, erstellen und bewerten können. Das Hauptproblem ist nicht das Modell, sondern die Eingabedaten des Modells. Wenn es Ihnen gelingt, die Ausgangsdaten zu finden, dann können Sie die Programmierung in Auftrag geben. Die Hauptsache ist die Idee, und es können auch Programmiertechniken angewendet werden.
PS. Und beim Versuch, TC.Rdata aus dem Artikel zu öffnen, kommt folgendes:
Nachgeprüft, alles ist normal. der Ablauf ist wie folgt:
- R starten
- Reiter {Datei/Arbeitsbereich laden
- dann suchen Sie die Datei TC.RData aus dem entpackten Archiv.
- Rattle starten
- Registerkarte Data\R Dataset
- Suchen Sie im Dropdown-Menü im Fenster "Data Name" nach dem Namen TC.
- Klicken Sie auf "Ausführen".
Sie erhalten die Liste der Vektoren, an denen Sie interessiert sind.
Eine weitere Zielgruppe sind geschulte Benutzer. Rattle ist ein recht praktisches Werkzeug für die Auswahl der Ausgangsdaten für das Modell. Beim Aufbau von Handelssystemen wird die meiste Zeit mit der Auswahl der Ausgangsdaten verbracht - der unsicherste Teil der Arbeit. An dieser Stelle ist Rattle sehr nützlich. Sie können sehr schnell eine endgültige Schätzung erhalten, ohne dass Sie sich mit sehr komplexen mathematischen Modellkonstruktionen beschäftigen müssen.
Viel Glück, ich bin bereit, die Erklärungen fortzusetzen
Sie sind einfach nur pingelig. Ich zum Beispiel, der ich kein Mathematiker bin, habe das Wesentliche ganz gut verstanden, abgesehen von einigen Punkten, die ausführlicher hätten erklärt werden müssen.Zum Beispiel habe ich den Begriff "Baumsplitting" nicht ganz verstanden, er kommt mehrmals vor, und es ist nicht ganz klar, was genau damit gemeint ist. Und was die Schlussfolgerungen angeht, welche Schlussfolgerungen brauchen Sie? "Auf die Barrikaden gehen"? Mir zum Beispiel wurde nach der Lektüre klar, dass ich ein Fahrrad erfinde, indem ich versuche, ähnliche Algorithmen selbst zu erfinden, anstatt eine vorgefertigte Lösung zu verwenden.So wie ich es verstanden habe, bestand die Hauptidee darin, das R-Paket unter statistikinteressierten Amateuren (aber nicht für "Dummies") zu popularisieren. Und das ist meiner Meinung nach ganz gut gelungen.
Zum Beispiel habe ich den Begriff "Baumaufteilung" nicht ganz verstanden
Wir nehmen die Wurzel des Baumes - sie liegt ganz oben.
Wir teilen die Wurzel und ziehen zwei Linien von der Wurzel aus - Wurzelaufspaltung, dann die gleiche Aktion auf jeder Ebene.
In jedem Knoten des Baums wird eine vom Algorithmus formulierte Bedingung überprüft. Zum Beispiel, wenn eurusd > 1,35, dann gehen Sie entlang der linken Zweig, wenn nicht, gehen Sie entlang der rechten.
Der Algorithmus hat übermäßig viele 500 solcher Bäume erzeugt. Es sollten 10000 Bedingungen sein.
Weiter. Beim Eintreffen der Werte aller Prädiktoren - ein Wert für jeden Prädiktor - habe ich insgesamt 88 Stück, die mit den Bäumen verglichen werden, und es wird eine Entscheidung getroffen, dass dieser bestimmte Satz von 88 Werten lang oder kurz bedeutet. D.h. eine Art Analogie zu einem Muster, nur sehr viel mehr.
Ich habe es noch einmal überprüft, es ist in Ordnung. Die Reihenfolge ist wie folgt:
- R ausführen
- file/load workspace tab
- dann suchen Sie die Datei TC.RData aus dem entpackten Archiv.
- Rattle starten
- Registerkarte Data\R Dataset
- Suchen Sie im Dropdown-Menü den Namen TC im Fenster Data Name.
- Klicken Sie auf "Ausführen".
Sie erhalten die Liste der Vektoren, an denen Sie interessiert sind.
Vielen Dank! Jetzt ist alles klar.
Könnten Sie das Wesen dieser Vektoren erklären: ZZ.75, ZZ.35?
Was sind die Vektoren *.dif1, *.dif2, *.dif3? Inkremente? Wovon relativ zu was?
Vektoren eur, gbp, etc. - Was sind sie?
Und eine globale Frage - warum werden Daten von Indikatoren hinzugefügt? Ist es nicht dasselbe wie [x, f1(x), f2(x)]? Ich spreche hier von Redundanz. Haben Sie nicht versucht, nur die Inkremente der Schließungen zu liefern?
Vielen Dank im Voraus für Ihre Antworten.
Ich danke Ihnen! Jetzt ist alles klar.
Könnten Sie das Wesen dieser Vektoren erklären: ZZ.75, ZZ.35?
Was sind die Vektoren *.dif1, *.dif2, *.dif3? Inkremente? Wovon relativ zu was?
Vektoren eur, gbp, etc. - Was sind sie?
Und eine globale Frage - warum werden Daten von Indikatoren hinzugefügt? Ist es nicht dasselbe wie [x, f1(x), f2(x)]? Ich spreche hier von Redundanz. Haben Sie nicht versucht, nur die Inkremente der Schließungen zu liefern?
Vielen Dank im Voraus für Ihre Antworten.
Könnten Sie bitte erklären, was es mit diesen Vektoren auf sich hat: ZZ.75, ZZ.35?
Es handelt sich um ZZ mit einem minimalen Umkehrabstand von 75 Pips und 35. Die Zielvariable TREND ergibt sich aus ZZ.35. Diese Variablen können im Modell nicht verwendet werden - sie schauen in die Zukunft.
Was sind die Vektoren *.dif1, *.dif2, *.dif3? Inkremente? Wovon relativ zu was?
Das Inkrement zum vorherigen Balken, der vorherige (-2) und (-3) Balken. Die Idee ist, Trends zu berücksichtigen.
Vektoren eur, gbp, etc. - Was sind sie?
Die Quotienten eurusd, gbpusd sind die ersten Symbole.
Ich weise auf die Redundanz hin. Haben Sie versucht, einfach die Inkremente der Schlusskurse einzugeben?
Ich habe viele Dinge ausprobiert. Der Artikel ist eine Demonstration von Möglichkeiten und gleichzeitig Redundanz, so dass jeder nach seinen eigenen Vorstellungen auswählen und ausprobieren kann. Die Auswahl erfolgt ganz einfach - die Variable wird als Ignorieren markiert.
Herzlichen Glückwunsch zu dem Artikel SanSanych!
Natürlich wäre es in R kompakter, aber wir sollten wahrscheinlich zuerst dort anfangen.
Ich bin gerade dabei, den Artikel über "Deep Learning" fertigzustellen. Mit Ihren Daten werden wir versuchen, das Ergebnis zu vergleichen.
Viel Erfolg!
Ich habe mir den Datensatz genau angeschaut, er taugt nichts. Die Anführungszeichen müssen verworfen werden. Das heißt, die ersten 48 Variablen werden entfernt. Es bleibt ein Datensatz mit 42 Eingangsvariablen und einer Zielvariablen übrig.
Nun, das bleibt jedem selbst überlassen, jeder wählt nach seinem Geschmack, seiner Erfahrung usw. Aber es gibt eine Bemerkung zu dem Modell. "RandomForest ist wunderbar, weil es keine Vorverarbeitung braucht, überhaupt keine. Es nimmt Rohdaten wunderbar an.
Ansonsten ist der Artikel natürlich sehr nützlich.
Herzlichen Glückwunsch zu dem Artikel SanSanych!
Natürlich wäre es in R kompakter, aber wir sollten wahrscheinlich zuerst dort anfangen.
Ich beende gerade den Artikel über "Deep Learning". Mit Ihren Daten werden wir versuchen, das Ergebnis zu vergleichen.
Viel Erfolg!
Es wäre sehr gut, diesen Thread von Ihnen hier zu wiederholen.
Es war sehr nützliches Material.

- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Neuer Artikel Random-Forest-Vorhersage-Trends :
Dieser Artikel widmet sich der Verwendung des Rattle-Pakets zur automatischen Suche nach Mustern zur Vorhersage von Long- und Short-Positionen von Forex-basierten Währungspaaren. Dieser Artikel richtet sich an Neulinge ebenso wie an erfahrene Trader.
Long- und Short-Positionen existieren nicht als Zielvariablen. Und das ist auch der Hauptunterschied zu den unabhängigen Variablen, die sich unten befinden. Dieser Aspekt steht im Zusammenhang mit dem Umstand, dass wir eine Zukunft vorhersagen werden, die für den Moment noch nicht existiert. Da wir die Zukunft im Verhältnis zur Vergangenheit kennen, können wir sehr gute historische Datentrends zeichnen.
Um Trends und historische Daten zu unterscheiden, werden wir ZigZag benutzen. Dies ist ein brillanter Indikator für historische, aber zugleich nutzlos für tatsächliche Daten, da die letzte Verbindung (und manchmal auch die vorherige) neu gezeichnet wird. Da es keine Dynamiken hinsichtlich historischer Daten gibt, können wir mit diesem Indikator wirklich sehr schöne Trends zeichnerisch zustande bringen.
Um die Zielvariable zu berechnen, wurde der ZigZag-Indikator mit dem Parameter „Abstand zwischen den Wende-/Umkehrpunkten“, der mit 0,0035$ identisch ist, benutzt. Abb. 1 zeigt die Ergebnisse
Abb. 1 Der ZigZag-Indikator:
Autor: СанСаныч Фоменко