Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1290

 
Aleksey Vyazmikin:

Das passt gut zu meiner Theorie über den Markt. Ganz einfach, jemand mit viel Geld hat seinen Algorithmus für die Positionsauswahl/Operationen eingeschaltet, irgendeine große Bank, vielleicht die Zentralbank, das geht natürlich nicht so schnell, aber da dieser Teilnehmer dominant war und die Marktsituation dazu beitrug, konnten sie Anzeichen für ihren Algorithmus finden. Nachdem der Teilnehmer aufgehört hatte, den Markt zu beeinflussen, funktionierten die Schilder natürlich nicht mehr. Es gibt viele solcher Teilnehmer (vielleicht 100), ihre Algorithmen können sich überschneiden, aber es wird davon ausgegangen, dass sie ähnlich sind (man erinnere sich an die technische Analyse und die Anforderungen an die Banken, ihre Handelsoperationen auf der Grundlage dieser Analyse zu rechtfertigen (zumindest in Russland)), und aus diesem Grund ist es sinnvoll, eine große Stichprobe zu analysieren, bei der ein und derselbe Algorithmus mehrmals ausgeführt wird, dann gibt es eine Chance zu verstehen, wie er funktioniert, seine indirekten Zeichen zu beschreiben, aber das Modell muss lernen, ihn zu identifizieren und nicht auf Rauschen zu dieser Zeit zu arbeiten, darauf wartend, dass der Algorithmus eingeschaltet wird, unter denen Ich denke, dass dies natürlich noch besser bei Aktien und Derivaten funktionieren würde, bei Devisen mache ich kein MO.

Aber unterm Strich müssen wir 10 Modelle finden, die den Algorithmus für die Großverdiener beschreiben, und lernen, wie wir herausfinden können, welcher Algorithmus vorzuziehen ist. Da der Zyklus des Algorithmus ein paar Tage dauern kann und wahrscheinlich über einen kurzen Zeitraum wiederholt wird, ist es in Ordnung, wenn wir mit einer kleinen Verzögerung einsteigen, Hauptsache, wir wählen das richtige Modell für diesen Algorithmus.

Ich weiß nicht, ob ich 10 Muster finden kann. Aber die Tatsache, dass die auf den Markt gelangenden Informationen in einem Zyklus strukturiert sind, der einen Anfang, eine Fortsetzung und ein Ende hat, ist sicher

Der Bifurkationspunkt ist genau der Moment des Auftreffens einer neuen brisanten Information, die dann zeitlich strukturiert wird. Eine Störung, die sich für einige Zeit in Kreisen (Wellen) ausbreitet.

Deshalb sind zum Beispiel die Muster innerhalb von Terminkontrakten stärker als innerhalb verschiedener Terminkontrakte.

 
Maxim Dmitrievsky:

über die Geschichte existiert, weiß ich nicht, wie man sie algorithmisieren kann

Sie kann durchaus in der Geschichte existieren. Ist es überhaupt möglich, sie in Echtzeit und rechtzeitig zu erkennen? Wenn sie nicht bekannt ist, dann ist es nicht sicher, dass die Lösung überhaupt existiert.

Ich überprüfe solche Dinge normalerweise mit Statistiken. In den meisten Fällen sind die Ergebnisse nichts). Man kann mit den Augen sehen, aber die Statistik sagt, dass dort nichts ist - eine scheinbare Reflexion des scheinbaren Mondes).

 
Yuriy Asaulenko:

Was die Geschichte betrifft, so kann sie durchaus existieren. Ist es überhaupt möglich, dies in Echtzeit und rechtzeitig zu erkennen? Wenn sie unbekannt ist, ist es überhaupt nicht sicher, dass es überhaupt eine Lösung gibt.

Normalerweise überprüfe ich solche Dinge mit Statistiken. In den meisten Fällen sind die Ergebnisse nichts). Man kann mit den Augen sehen, aber die Statistik sagt, dass da nichts ist - eine scheinbare Reflexion des scheinbaren Mondes).

Wenn Sie sich das Diagramm ansehen, können Sie es mit den Augen machen, ich kann es nicht programmatisch machen.

 
Maxim Dmitrievsky:

Ich weiß nicht, ob ich 10 Muster finden kann. Sicher ist jedoch, dass die Informationen, die auf den Markt gelangen, in einem Zyklus strukturiert sind, der einen Anfang, eine Fortsetzung und ein Ende hat.

Dazu müssen Sie die Flip-Algorithmen aufgeben und dem Modell beibringen, nicht ständig auf dem Markt zu sein. Meine Strategie erlaubt dies, und ich experimentiere jetzt in dieser Richtung mit Catbust-Modellen. Leider können die Blätter des Baumes, die ich ein halbes Jahr lang aufbewahrt habe, nicht mehr verwendet werden, da ich einige Änderungen an den Prädiktoren vorgenommen habe (es gab Fehler in der Logik und nivellierte Verzögerungen bei der Öffnung der Balken - d. h. das Problem mit der Berechnung lag in den Echtzeitverzögerungen), aber die Arbeit mit ihnen bestätigt, dass es eine Möglichkeit gibt, Muster zu erkennen, die einzeln genauer sind als die Vorhersagekraft des Baumes/Waldes, und dass ihre Kombination daher gute Ergebnisse liefert.

Maxim Dmitrievsky:

Und der Bifurkationspunkt ist genau dann, wenn ein neuer, brisanter Teil der Information freigelegt wird, der dann im Laufe der Zeit strukturiert wird. Eine Störung, die sich für einige Zeit in Kreisen (Wellen) ausbreitet.

Deshalb sind beispielsweise die Muster innerhalb von Terminkontrakten stärker als bei anderen Terminkontrakten, wie man festgestellt hat.

Es ist also notwendig, diese Punkte zu identifizieren, vielleicht sollten sie zu Zielen gemacht werden. Und ein Modell identifiziert sie, und je nach Ziel wählt man ein geeignetes Handelsmodell. Eine andere Sache ist, dass wir wieder über Prädiktoren und Datenfaltung nachdenken sollten, um die Periode des Zyklusbeginns in einer Zeile auszudrücken, wenn die Periode selbst in (durchgehend), sagen wir, 10 Balken festgelegt werden kann.

 
Maxim Dmitrievsky:

Wenn Sie es in das Diagramm einfügen, können Sie es mit Ihren Augen machen, ich kann es nicht programmatisch machen.

Programmtechnisch ist es eine sehr lange Geschichte.

Das frühere System hatte mehr als 30 Bedingungen (Parameter) für lange Eingänge, dieselben für Kurzschlüsse und etwas weniger für Ausgänge. Es gab eine Menge Arbeit, einschließlich der Konstruktion vieler Sets und ihrer Trennung, der Beseitigung von Geschäften mit zusätzlichen Bedingungen, die in den Sets enthalten waren, usw.

 
Aleksey Vyazmikin:
Yuriy Asaulenko:

Programmtechnisch ist es eine sehr lange Geschichte.

Das frühere System hatte mehr als 30 Bedingungen (Parameter) für lange Eingänge, dieselben für Kurzschlüsse und etwas weniger für Ausgänge. Es gab eine Menge Arbeit, einschließlich des Aufbaus vieler Sets und ihrer Trennung, der Beseitigung von Gewerken, die aus Sets mit zusätzlichen Bedingungen herausfallen, usw.

Wir müssen also diese Punkte identifizieren, vielleicht sollten sie zu Zielen gemacht werden. Ein Modell identifiziert diese Punkte, und das andere wählt das entsprechende Handelsmodell in Abhängigkeit von der Zielgröße aus. Eine andere Sache ist, dass wir noch einmal über Prädiktoren und die Faltung von Daten nachdenken sollten, um die Periode des Zyklusbeginns in einer Zeile auszudrücken, wenn die Periode selbst in (durchgehend), sagen wir, 10 Balken festgelegt werden kann.

Nun, es ist klar, dass es ein Fehler ist, niemand bestreitet ))

 
Was die Katbucht betrifft, so hat sich herausgestellt, dass es möglich ist, mehr als eine Verarbeitung auf der GPU per Stapelverarbeitung auszuführen, d. h. zwei Stapel gleichzeitig auszuführen, indem die Konsolenanwendung aufgerufen wird. Und in diesem Fall, zumindest bei meinen Modellen, ändert sich die Geschwindigkeit der GPU zur Erstellung der Modelle nicht, was bedeutet, dass es möglich ist, Berechnungen zu parallelisieren. Die Grenzen und Einschränkungen sind noch nicht vollständig bekannt. Lass deine Alglib fallen, und lass uns Catbust foltern ;)
 
Aleksey Vyazmikin:
Bei catbucht hat sich herausgestellt, dass es auf der GPU möglich ist, mehr als eine Verarbeitung per Stapelverarbeitung auszuführen, d. h. zwei Stapel gleichzeitig auszuführen, indem die Konsolenanwendung aufgerufen wird. Und in diesem Fall, zumindest bei meinen Modellen, ändert sich die Geschwindigkeit der GPU zur Erstellung der Modelle nicht, was bedeutet, dass es möglich ist, Berechnungen zu parallelisieren. Die Grenzen und Einschränkungen sind noch nicht vollständig bekannt. Lass deine Alglib fallen, und lass uns Catbust foltern ;)

die Software ist überraschend gut (im Gegensatz zu allem anderen von Yandex), nutzt sogar CERN, um Daten aus dem Collider zu verarbeiten

noch keine Zeit, dann vielleicht später

 
Aleksey Vyazmikin:

Es gibt auch eine coole Software KNIME, die alle Arten von Boosting, Datenanalyse und Visualisierung ermöglicht

es ist möglich, xgboost ohne Programmierung zu sägen, catboost scheint auch möglich zu sein, hinzuzufügen

KNIME - Open for Innovation
KNIME - Open for Innovation
  • 2019.01.28
  • www.knime.com
KNIME, the open platform for your data.
 
Maxim Dmitrievsky:

die Software ist überraschend gut (im Gegensatz zu allem anderen von Yandex), nutzt sogar CERN, um Daten aus dem Collider zu verarbeiten

noch keine Zeit, vielleicht später.

Ich denke, dass der offene Quellcode, der regelmäßig korrigiert und um neue Versionen ergänzt wird, einen wichtigen Beitrag leistet. Eh, wenn ich den Code lesen könnte... Ich habe den Eindruck, dass es dort eine ganze Reihe von Ideen gibt, die man aufgreifen und weiterentwickeln kann, um einen eigenen Impuls zu setzen.


MaximDmitrievsky:

Es gibt auch eine coole Software KNIME Boosten, Datenanalyse und Visualisierung

Sie können xgboost ohne Programmierung schreiben, catboost scheint es auch hinzufügen zu können!

Danke! Im Moment reicht mir der Catboost aus, weil ich den gesamten Zyklus von der Erstellung des Beispiels bis zur Implementierung in Expert Advisor debuggt habe. Und anders als bei der Überbrückung mit Python kann ich die Optimierung nutzen, um verschiedene Modelle, ihre Kombinationen und die Interpretation der von ihnen erzeugten "Wahrscheinlichkeiten" zu testen.

Obwohl ich nicht genau mit kategorischen Zeichen arbeiten kann (CatBoost-Funktion) - ich habe keinen solchen Modellinterpreter, aber meine vorläufige Forschung hat gezeigt, dass die Verwendung solcher Modelle mehr Stabilität in Zeitintervallen bietet, d.h. die Modelle sind besser, obwohl das Training fünfmal langsamer ist.

Grund der Beschwerde: