Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1016

 
SanSanych Fomenko:

Ich habe den Link wegen der Tabelle mitgebracht: ein neuer Blick auf die Prädiktoren und als Weiterentwicklung von Alexanders Gedanken über ACF.

Frisch, ist das dein Ernst? So alt wie ... das Mammut. Inwiefern ist sie besser als die Fourier-Zerlegung oder andere Zerlegungen oder autoregressive Koeffizienten und deren Werte oder Filter?

Nichts davon funktioniert.

 
Maxim Dmitrievsky:

Frisch, ist das dein Ernst? So alt wie ... das Mammut. Inwiefern ist sie besser als Fourier- oder andere Zerlegungen oder autoregressive Koeffizienten und deren Werte oder Filter?

Nichts davon funktioniert.

Frisch für diesen Thread.

Was haben Sie also ausprobiert?

Was genau? Für welches Ziel?

 
SanSanych Fomenko:

Frisch für diese Branche.

Was haben Sie also ausprobiert?

Was genau? Für welches Ziel?

Ich habe verschiedene Dekompositionen ausprobiert, auch autoregressive (kein Unterschied zu acf) zusammen mit Koeffizienten.

Funktioniert bei gut korrelierten Reihen (nehmen Sie die 2. Reihe als Fixpunkt, erstellen Sie z. B. ein VAR zwischen Instrumenten, nehmen Sie es als Prädiktor und trainieren Sie das Modell). Nun, es funktioniert - solange die Korrelation nicht unterbrochen wird.

Für das 1. Instrument gilt dasselbe wie für viele andere Prädiktoren, nämlich eine Überanpassung. Die Ziele werden automatisch ausgewählt.

 
Iwan Negreshniy:

Danke, ich bin nicht so sehr an der Mitgliedschaft interessiert, die, wie ich weiß, mit erheblichen Schwierigkeiten verbunden ist, sondern an der Ebene, die wahrscheinlich nicht weniger wichtig ist.

"Mitgliedschaft" ist richtig))) jede Mitgliedschaft ist in der Regel das Ergebnis einer zufälligen Bekanntschaft und/oder eines Zufalls, und es gibt ein paar fortgeschrittene Jungs, die ihren "kuklusklan" mit seiner Kultur und seinen Ritualen improvisieren, ich bin erst seit ein paar Monaten dabei, bis ich etwas sehr Wertvolles gelernt habe, aber die tatsache, dass das ökosystem zumindest relativ geschlossen ist, ist ein großer Pluspunkt für solche diskussionen und den austausch von ersatzteilen für ihre algorithmischen infrastrukturen. ich glaube nicht, dass es mit solchen schikanen lange halten wird, ich muss mich nach ähnlichen gruppen umsehen, die sich nicht so sehr mit geks anlegen.

Sie haben geschrieben, dass diese Gruppe eine einheitliche Darstellung der Modelle des Verteidigungsministeriums anstrebt; dies sind die Modelle, die ich gerne sehen würde.

Ja, solche Gedanken wurden laut geäußert und nicht nur dort habe ich übrigens davon gehört, auf der elite-trader sprach erinnern, vielleicht hier gehört etwas ähnliches, schlage ich vor, unter vier Augen, wenn Sie diskutieren wollen, wie man ein Format für den Austausch von Modellen zu etablieren, ich habe auch Gedanken zu diesem Thema, in der Tat jeder Coder weißwie sie es auf ihre eigene Weise tun können, nur eine Frage der Standards, so etwas wie Fullstack C++ dll-grall Muster, das Rohdaten und Ausgaben Prognosen und ein paar Zeilen Code, um in von sharp's peyton und so weiter zu stecken nimmt. Wen interessiert das schon.

Zum Vergleich als bereit, ihre, bescheidenen Entwicklungen zu zeigen, trainierte ich Modelle in binärem oder Textformat und in Form eines Quellcodes zu serialisieren.

Die Hauptidee besteht darin, den Mechanismus der Ausstiegsstrategie zu nutzen.

 

Zhenya:

Sie haben geschrieben, dass in dieser Gruppe eine einheitliche Darstellung der MoD-Modelle in Betracht gezogen wird, das sind die Modelle, die ich gerne sehen würde.

Ja, solche Gedanken wurden laut geäußert und nicht nur dort habe ich übrigens davon gehört, auf elit-trader erinnere ich mich, vielleicht habe ich hier etwas ähnliches gehört, ich schlage vor, unter vier Augen zu diskutieren, wenn Sie wollen, wie wir das Format des Modellaustauschs anpassen können, ich habe auch Gedanken zu diesem Thema, in der Tat weiß jeder Coderwie sie es auf ihre eigene Art und Weise tun können, nur eine Frage der Standards, so etwas wie Fullstack C++ dll-grall pattern, das Rohdaten und Prognosen ausgibt und ein paar Zeilen Code zum Einfügen von sharp's peyton, etc. Wen interessiert das schon.

Es gibt zum Beispiel PMML.

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

Es gibt eine Bibliothek für R (auch pmml genannt), die die meisten gängigen Modelle in dieses Format konvertieren kann.

ist es möglich:
1) Trainieren Sie das Modell wie üblich in R
2) Konvertieren Sie das Modell in pmml
3) Speichern Sie das pmml-Modell in einer xml-Datei und geben Sie es weiter

Vor einiger Zeit wollte ich ein Skript für mql erstellen, das xml-Dateien mit pmml-Modellen lesen kann. In diesem Fall könnte ich eine Vorhersage, die von einem trainierten gbm aus r gemacht wurde, mit ein paar Zeilen Code in EA einbetten (Skript + pmml als Ressource einschließen). Aber ich bin noch nicht dazu gekommen, es zu tun.


Dies ist nicht geeignet, wenn Sie das Modell selbst geheim halten wollen, denn in der xml-Datei werden Gewichte von Neuronen oder Waldzweigen vorgegeben.

Für die völlige Geheimhaltung der Modellanordnung können Sie eine Idee aus einem Datenwissenschaftler-Wettbewerb verwenden - sie benötigen eine Datei mit Hunderttausenden von Vorhersagen darin. Von dort aus können sie diese Datei verwenden, um die Vorhersagen zu interpolieren und eine Vorhersage neben der bestehenden zu erhalten.

 
Dr. Trader:

Es gibt zum Beispiel PMML.

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

Es gibt eine Bibliothek für R (auch pmml genannt), die die meisten gängigen Modelle in dieses Format konvertieren kann.

könnten Sie es so machen:
1) Trainieren Sie das Modell wie üblich in R
2) Konvertieren des Modells in pmml
3) Speichern Sie das pmml-Modell als xml-Datei und geben Sie es frei.

Vor einiger Zeit wollte ich ein Skript für mql erstellen, das xml-Dateien mit pmml-Modellen lesen kann. Dann könnte ich die Vorhersage von trainierten gbm aus r mit ein paar Zeilen Code in EA einbetten (einschließlich des Skripts + pmml als Ressource). Aber ich bin noch nicht dazu gekommen, es zu tun.

Es ist nicht geeignet, wenn Sie das Modell selbst geheim halten wollen, denn in der xml-Datei werden die Gewichte der Neuronen oder der Waldzweige vorgegeben.

Leider ist Geheimhaltung hier eine wichtige Voraussetzung))) Es geht um das Börsenprotokoll, das durch C++-Modelle verschleiert wird, die Rohdaten von der Börse nehmen und Prognosen erstellen. Man kann also ein Modell mit einer Beschreibung seiner Eingaben und Ausgaben nehmen, es z. B. einen Monat lang oder so lange, wie es konzipiert ist, ohne Änderung (Umschulung usw.) verwenden und Schlussfolgerungen ziehen (kaufen, mieten usw.)

Es ist wünschenswert, dass es nur ein Ordner mit den Dateien, verschiedene binäre, in denen die Details zu verstehen ist nicht kosteneffektiv.

Für die völlige Geheimhaltung des Modells können Sie eine Idee aus einem Wettbewerb für Datenwissenschaftler verwenden - sie benötigen eine Datei mit Hunderttausenden von Vorhersagen. Von dort aus können sie diese Datei verwenden, um die Vorhersagen zu interpolieren, um eine Vorhersage neben der bestehenden zu erhalten.

Wenn Sie numerai meinen, dann wird ihr Ansatz nicht funktionieren, in diesem Fall bedeuten sie mit "Modell" den vollständigen Satz von Transformationen von Rohdaten in eine Vorhersage, vor allem ist es Zeichen, numerai hat einen Studentenwettbewerb für die Vermarktung ihrer Münze (NMR), kann es nicht irgendwie mit den realen Märkten verbunden werden, das letzte, was der Hedge-Fonds brauchen wird, ist die reine Klassifizierung auszulagern. Wenn Sie von einem anderen Wettbewerb sprechen, sagen Sie es mir bitte.

 
Kann jemand etwas zu dieser Verwendung von MO für nicht-stationäre Reihen sagen: kombinierte Modelle? Es wird ein zusätzlicher Parameter eingeführt, der dem Zustand des Prozesses entspricht und von dem die Modellparameter abhängen. Dieser Parameter wird ebenfalls vorhergesagt. Dieser Ansatz wird in dem Artikel zur Vorhersage der Temperatur verwendet. Sicherlich ist eine solche Komplikation des Modells mit einer Überanpassung verbunden, aber zumindest können wir die Nicht-Stationarität irgendwie in den Griff bekommen.
 

Ja.

Ihr Weg ist nicht unbegründet. Ich habe versucht, mit meinen Modellen Hunderttausende von Zufallsfällen vorherzusagen. Für die Blackbox-Vorhersagen habe ich dann den nächstgelegenen Punkt in den Koordinaten gesucht und dessen Ergebnis als Vorhersage selbst verwendet. Dieser Prototyp hat funktioniert, aber ich könnte ihn in der Praxis noch verbessern - die 3 nächstgelegenen Punkte finden und das durchschnittliche Ergebnis triangulieren. Dies ist jedoch sehr rechenintensiv, selbst mit einem opencl-Widget kann die Vorhersage einige Sekunden dauern.

 
Aleksey Nikolayev:
Es wird ein zusätzlicher Parameter eingeführt, der dem Zustand des Prozesses entspricht und von dem die Modellparameter abhängen. Dieser Parameter wird ebenfalls vorhergesagt.

Es ist dem Speicher in RNN (rekurrenten neuronalen Netzen) sehr ähnlich

Die Prädiktoren und ein weiterer Wert (Speicher) werden in das Modell eingegeben. Das Modell erzeugt bei der Vorhersage zwei Zahlen - das Ziel selbst und einen neuen Speicherwert, der zusammen mit den Prädiktoren bei der nächsten Vorhersage verwendet wird. Deshalb handelt es sich um ein rekurrentes Netz, dessen Ausgabe als Eingabe für das nächste Mal verwendet wird, und so weiter, jedes Mal im Kreis.

RNNs in Forex sind sehr überfüttert, das ist schlecht, man kann nicht alles nach Lehrbuch machen und Trades setzen.
Aber für ein Modell mit nur ein paar Parametern hat es eine ziemlich gute Genauigkeit, vergleichbar mit einem normalen Neuron mit einer großen versteckten Schicht, es erstaunt mich immer noch.

 
Dr. Trader:

Dies ist dem Gedächtnis in RNN (rekurrenten neuronalen Netzen) sehr ähnlich.

Prädiktoren und ein weiterer Wert (Speicher) werden dem Eingang des Modells zugeführt. Das Modell gibt bei der Vorhersage zwei Zahlen aus - das Ziel selbst und einen neuen Speicherwert, der zusammen mit den Prädiktoren bei der nächsten Vorhersage verwendet wird. Deshalb handelt es sich um ein rekursives Netz, dessen Ausgabe beim nächsten Mal als Eingabe verwendet wird, und so geht es jedes Mal im Kreis weiter.

RNNs in Forex sind sehr overfeeding, es ist schlecht, Sie können nicht alles tun, durch das Lehrbuch und setzen Trades.
Aber für ein Modell mit nur ein paar Parametern hat es eine recht gute Genauigkeit, vergleichbar mit einem regulären Neuron mit einer großen versteckten Schicht, es erstaunt mich immer noch.

Vielen Dank, es sieht wirklich so aus.

Grund der Beschwerde: