Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1780

 
Aleksey Vyazmikin:

Berichte, dass sie nicht an der Ausbildung teilgenommen haben.

Dann ist das Ergebnis mehr als gut.

 
mytarmailS:

hohe Genauigkeit ist nicht 70%

Einverstanden, ich habe für mich eine Entscheidung getroffen, die nicht unter 95 % liegt.

 
Farkhat Guzairov:

Strategie... Nach MO brauchen Sie also immer noch eine ganze Strategie? Ich dachte, der Zweck von MO sei es, Ihnen schließlich eine Empfehlung für den Handel (long/short) zu geben oder nicht.

Nun, das Ziel ist nicht meins, und ich finde es nur interessant, um die Wirksamkeit von Prädiktoren bei einem anderen Ziel zu untersuchen.

Farkhat Guzairov:

Einverstanden, ich habe für mich eine Entscheidung von mindestens 95 % getroffen.

Das hängt stark von der Zielsetzung ab, für meine Hauptzielsetzung wäre es ein sehr gutes Ergebnis, da es sich um Trends handelt.

 
mytarmailS:

Schicken Sie es ab und lassen Sie es uns sehen .... aber ich werde es mir heute nicht ansehen, tut mir leid, ich bin gerade mit etwas anderem beschäftigt.

Okay, ich werde es später tun.

 
Aleksey Vyazmikin:

In Ordnung, ich werde es später veröffentlichen.

Ja, das können Sie, ich sagte nur, dass ich nicht sofort sehen kann

 
mytarmailS:

hohe Genauigkeit ist nicht 70%

Das soll wohl ein Scherz sein. 70 % ist eine sehr hohe Eingabegenauigkeit. Werden Geschäfte getätigt, ohne auf Verlusten zu sitzen, ist ein wesentlich höheres Ergebnis kaum zu erzielen. Und 95 % sind etwas, das aus dem Reich der Fantasie stammt. Ich habe jetzt meine Geschäfte der Übertaktung Pfand für das Interesse zu zählen. In meinem ersten Versuch habe ich also 42 Geschäfte abgeschlossen, von denen ich 6 verloren habe. Im zweiten Versuch wurden 67 Geschäfte getätigt, von denen 10 verloren wurden. So haben sich die Konten selbst bei einer so bescheiden erscheinenden Eingabegenauigkeit verzehnfacht. Ich habe vergessen zu sagen, dass ich Situationen, in denen man +1 Punkt nimmt und -200 Punkte verliert, nicht berücksichtigt habe. Natürlich können Sie eine Eingabegenauigkeit von 95 % erreichen.

 
MrBobr1:

wo Sie +1 Pip nehmen und -200 Pips verlieren, habe ich nicht berücksichtigt. Es ist durchaus möglich, eine Eingabegenauigkeit von 95 % zu erreichen.

Um mit zu beginnen, um 1 zu nehmen und geben 200 Pips ist zunächst nicht akzeptabel für mich, vor allem, weil kein Makler wird nicht zulassen, dass sich in einem solchen Modus für eine lange Zeit, und das Verhältnis der kontinuierlichen Gewinne sollte sein, wie Sie haben"67 von ihnen 10", persönlich habe ich nie erreicht solche Ergebnisse. Wenn Sie nicht wissen, was Sie mit ihnen machen sollen, werden Sie einen Gewinn daraus ziehen und was Sie mit ihnen machen sollen. Alle Geschäfte wurden abgeschlossen, wenn das System eine Vorhersagegenauigkeit von mehr als 95 % erreichte.

Ich möchte gleich sagen, dass Ihr MO die Wahrscheinlichkeit eines Markteintritts zu 100 % vorhersagen kann, aber was tatsächlich passieren wird und wie es sein wird, das ist meiner Meinung nach nicht die Aufgabe von MO, sondern von KI, die neben der mathematischen Statistik auch verbale Umgebungsfaktoren berücksichtigen wird.



 
mytarmailS:

Ja, machen Sie nur, ich sage nur, dass es nicht möglich sein wird, es sofort zu sehen.

Ja. Es gibt zwei Dateien im Archiv - eine Probe zum Trainieren und eine Probe zum Testen des trainierten Modells, für beide benötigen wir Prädiktoren.

Eine solche Besonderheit ist, dass jede neue Zeile ein neuer Balken ist - die Messwerte werden zum Zeitpunkt der Balkeneröffnung genommen, die Messwerte selbst sind für den vorherigen Balken, wenn also der Prädiktor die Eröffnungsdaten des Null-Balkens verwendet, dann nehmen Sie diesen Messwert vom nächsten Balken.

Dateien:
CB_ZZ_M1.zip  2957 kb
 
Aleksey Vyazmikin:

GUT. Es gibt zwei Dateien im Archiv - eine Probe zum Trainieren und eine Probe zum Testen des trainierten Modells, für beide benötigen wir Prädiktoren.

Eine solche Besonderheit ist, dass jede neue Zeile ein neuer Balken ist - die Messwerte werden im Moment der Balkeneröffnung genommen, die Messwerte selbst sind für den vorherigen Balken, wenn also der Prädiktor die Eröffnungsdaten des Null-Balkens verwendet, dann nehmen Sie diesen Indikator vom nächsten Balken.

Nun, Sie hätten auch die Zielscheibe anbringen können, wie können Sie sie sonst vergleichen?

Und warum haben Sie das Datum entfernt?

400 000 Tausend Zeilen im Zug? Ist das Ihr Ernst? Haben Sie das Modell für 400 000 Tausend Zeilen trainiert?



UPD=====

Tut mir leid, aber mein alter Laptop verarscht mich einfach... wenn ich nur versuche, Daten zu manipulieren, wenn ich nur 100 Attribute mache, stellt sich heraus, dass es eine 100*400 000-Matrix ist, und wenn ich eine solche Matrix im RAM behalte, muss ich gleichzeitig das Modell trainieren, der Laptop stirbt einfach beim Versuch...


Ich kann es nicht als Datensatz mit 50 000 oder so verwenden, ich brauche keine Minute, um diese großen Datensätze zu erstellen, 5 Minuten oder sogar eine Stunde reichen aus. Verzerren Sie die Daten nicht, verwenden Sie das Datum-Zeit-OHLCV-Format und fügen Sie ein Ziel hinzu, an dem Sie Ihr Modell trainiert haben, damit Sie später Fehler vergleichen können

 
mytarmailS:

Nun, sie hätten auch ihr Ziel anbringen können, wie könnten sie sonst vergleichen?

Und warum haben Sie das Datum gelöscht?

400 000 000 Linien im Zug? Ist das Ihr Ernst? Haben Sie das Modell für 400 000 Linien trainiert?

Ich habe das Datum nicht gelöscht, ich habe es nur nicht gespeichert, um Platz in der Datei zu sparen.

Ja, ich habe über 2 Jahre lang auf Minuten trainiert.


mytarmailS:


UPD=====

Sorry, aber mein alter Laptop nur verwöhnt mich ... wenn ich nur versuchen, die Daten zu manipulieren, wenn ich nur 100 Attribute es stellt sich heraus, die Matrix 100 * 400 000 und halten eine solche Matrix in den Speicher sollte auch ein Modell zur gleichen Zeit zu trainieren, der Laptop nur sterben versuchen ...

Können Sie die Prädiktoren nicht zu Beginn nacheinander in einer Datei speichern und sie dann einfach für das Training laden?

Ich habe eine Probe für das Training jetzt unter einem Gigabyte - CatBoost bewältigt leicht, aber ich würde nicht riskieren, genetischen Baum in R jetzt zu bauen...

mytarmailS:

Ihr erster Versuch, einen Datensatz von 50 000 oder so zu erstellen, dauert keine Minute, 5 Minuten oder sogar eine Stunde reichen aus. Verzerren Sie die Daten nicht, geben Sie sie im gleichen Format an, wie sie sein sollten, Datum, Uhrzeit, OHLCV, fügen Sie das Ziel hinzu, an dem Sie Ihr Modell trainiert haben, damit Sie später Fehler vergleichen können.

50.000 Beobachtungen sind zu wenig für solide Beobachtungen dieser Art, es werden nur etwa 300 ZZ-Segmente sein. Ich habe die wichtigsten Prädiktoren auf die Minuten geschärft, gibt es Prädiktoren aus dem oberen TF, aber sie können nicht genug sein.

Benutzen Sie die Lautstärke oder ist es nur bequem mit der Lautstärke?

Sie brauchen keine ZZ-Parameter, um die Prädiktoren anzupassen?

Ich verstehe die Datenverzerrung nicht. Müssen Sie die Daten verschieben, um alle Daten des Nullbalkens zu kennen? Wenn ja, haben Sie nicht einen Blick auf den Null-Balken geworfen?

Grund der Beschwerde: