Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 453

 

Das Thema ist zur Kaffeesatzleserei verkommen - immerhin haben sie eine Wissenschaft namens Astrologie ins Spiel gebracht.


Warum sich mit Unsinn aufhalten und alles auf den Modellinput schieben? Es wird schon seit fast hundert Seiten diskutiert, dass man nur die Prädiktoren nehmen sollte, die die Zielvariable beeinflussen. Ich führe immer Datamining durch, und ich habe nie Modelle mit mehr als 40 % Fehler. Es stimmt, Modelle mit einem Fehler von weniger als 30 % sind schwer zu finden. Aber ich habe nie eine solche Empörung wie 50 %.

 
SanSanych Fomenko:

Das Thema ist zur Kaffeesatzleserei verkommen - immerhin haben sie eine Wissenschaft namens Astrologie ins Spiel gebracht.


Warum sich mit Unsinn aufhalten und alles auf den Modellinput schieben? Es wird schon seit fast hundert Seiten diskutiert, dass man nur die Prädiktoren nehmen sollte, die die Zielvariable beeinflussen. Ich führe immer Datamining durch, und ich habe nie Modelle mit mehr als 40 % Fehler. Es stimmt, Modelle mit einem Fehler von weniger als 30 % sind schwer zu finden. Aber ich habe nie eine solche Empörung wie 50 %.

Denn Sie haben "gemischte Pferde Menschen, Funktionen, Targeting, ZZ ...", während die Vorhersage Candlestick Farbe oder Rückkehr, bei solchen Frequenzen (>5min), würde etwa die gleiche haben.

 
Dr. Trader:

Experiment. Wie wäre es, verschiedene gbpusd-, usdchf-, usdrub- und andere populäre Symbole zu nehmen und sie zur Vorhersage des eurusd zu verwenden.

Hier sind zwei Tabellen in atache, train.csv und test.csv, in denen das Ziel eurusd m5 Wachstum für den nächsten Balken ist, und die Prädiktoren sind audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], usw. Es gibt insgesamt 12 Symbole, von denen die Erhöhungen für die vorherigen 3 Balken der Geschichte übernommen werden. Im Allgemeinen ist bei der Bezeichnung von Spalten alles klar.
Die Trainingstabelle hat 10000 Zeilen, das sind etwa 7 Wochen.

Ich habe versucht, ein Modell zu trainieren und erhielt r^2 = 0,0006164161 für die Trainingsdaten, und wenn wir Ziel und Ergebnisse auf die Klassen -1 und 1 runden, beträgt die Genauigkeit 0,5052. Das ist sehr schlecht. Aber es ist einfach unrealistisch, Dutzende von Balken für jedes Übungsbeispiel und Dutzende von Zeichen selbst zu nehmen, mein Modell auf diese Hunderte von Spalten zu trainieren wird Wochen dauern.
Auf dem Prüfstand sind die Validierungsergebnisse des Modells rückläufig, r^2 = -0,003390913 und Genauigkeit 0,4907. Zufällig war, zufällig ist.

Aber das ist alles langweilig und nicht schlüssig.
Interessant war, welche Gewichtung das Modell den einzelnen Prädiktoren zuordnete (je höher die Gewichtung, desto besser):


Fazit: Der Versuch, die Richtung des Eurusd auf dem nächsten m5-Balken vorherzusagen, ist besser, wenn man vor allem audusd, usdrub, usdsgd verwendet.

Ja, das Ergebnis ist nicht gut, aber es ist fair und der Tester wird das entsprechende Eigenkapital haben, nicht den gleichen Fehler auf der Vorwärts 30% und Sharp Ratio +-0,5, die 10 sein sollte ))))

Ihre Chips sind überhaupt nicht gut, zumindest für jedes Instrument einige vergangene Retouren mit exponentiell zunehmenden Fenster (1,2,5,10,30,60...) und Sie sollten besser die Minuten nehmen.

 

Um ehrlich zu sein, habe ich schon vor langer Zeit angefangen, das Gleiche über Jura Reschetow zu denken. Ich war so überrascht, dass ich zuerst dachte, er hätte sich vielleicht einer Geheimorganisation angeschlossen, man weiß ja nie... dann funktionierte die Website nicht mehr und so weiter. Schade, wenn es so ist, möge er in Frieden ruhen ......

In der Tat ist die Ernsthaftigkeit seiner Arbeit unbestreitbar..... Aber ich habe den Eindruck, dass er es nicht zu Ende gebracht hat, nur ein bisschen ..... Ich denke daran, seine Methode genauer zu zerlegen und etwas daran zu schrauben... Nun, mal sehen.....

 
giftig:

Denn Sie haben "gemischte Pferde Menschen, Chips, Targeting, ZZ...", und wenn Sie vorhersagen, Kerzenfarbe oder Rückkehr, bei solchen Frequenzen (>5min), würden Sie etwa die gleiche Sache.


Hier habe ich genau nichts durcheinander gebracht: das Hauptproblem beim Datamining, die Hauptmenge der Arbeit.... Was Sie hier haben, ist intellektuelles Amüsement.

 
SanSanych Fomenko:

Hier habe ich genau nichts durcheinander gebracht: das Hauptproblem beim Datamining, die Hauptmenge der Arbeit.... Und Sie haben ein intellektuelles Amüsement zu bieten.

Meine HFT-Prädikate sind alle in Ordnung, ich stelle einen Datensatz auf, und ab 10 min ist da gar nichts mehr, in den Kursen selbst, es braucht andere Daten, Makro, News, etc. im Kurs selbst null, sprichwörtliche Effizienz.

 
Die andere ist diese:

Meine HFT-Präfixe sind alle sehr seriös, ich habe den Datensatz angelegt, und ab 10 min ist da überhaupt nichts mehr drin, in den Kursen selbst, es braucht andere Daten, Makro, News, etc. im Kurs selbst null, notorische Effizienz.

Ich würde Ihnen eher zustimmen. Aber was ist mit Leuten, die durch Zeichen öffnen, wie TA, und mir versichern, dass sie regelmäßig und mit Vergnügen gewinnen?

Es gibt 2 Möglichkeiten: 1. es handelt sich um Wunschdenken und das Ganze ist nur ein Scherz, und 2. es gibt etwas, das über 10 Minuten hinausgeht.

 
Ich bin mirnicht sicher:

Meine HFT-Prädikate sind alle fein und würdig, ich habe einen Datensatz angelegt, und 10 min und darüber gibt es überhaupt nichts, in den Preisen selbst, es braucht andere Daten, Makro, Nachrichten, etc. im Preis selbst Null, notorische Effizienz.

Haben Sie HFT zum Handeln? Wenn es natürlich kein Geheimnis ist und "ehrlich" ist ...

 
Eidechse_:

Erschrecken Sie nicht, ich lache schon lange über ihn und Vova, obwohl Mishka sie alle übertrifft)))
Nicht das Licht leuchten und nicht diskutieren, lassen Sie sie selbst)))


Also... mehr..... Man kann niemanden zum Reden bringen, man kann niemanden dazu bringen, etwas Gutes zu sagen.... Ich sehe dich gerade um die Ecke lachen.... Wozu bist du gut?

Wahrscheinlich das Gleiche wie ich. Nein.... Aber wenigstens bin ich witzig.)

 
Eidechse_:

Entschuldigung, Teacher))))))


In Ordnung... Ich bin nicht böse auf dich..... Ich bin nur neugierig, wissen Sie, rein theoretisch..... Nur um des Experimentierens willen. Ich schicke Ihnen meinen Datensatz noch einmal zu, es handelt sich um 3 Futures, d.h. um Daten aus fast 9 Monaten, Sie erstellen ein Modell und geben ein Urteil ab. Am liebsten würde ich Ihr Modell auf meinem Computer laufen lassen, aber ich bestehe nicht wirklich darauf..... Einfach neugierig....

Also, äh... Soll ich es veröffentlichen?

Grund der Beschwerde: