Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2017

 
mytarmailS:

Hat jemand versucht, "runde Ebenen" als Zeichen zu verwenden?

Oder als eine Art der Preisverarbeitung?

Sie können Preise zum Beispiel mit kreisförmigen Werten kennzeichnen...

Es ist möglich, gleiche Werte in einer Zeile zu entfernen...

Es ist eine gute Informationsverdichtung, plus Filterung ... Vielleicht ist es einfacher, in einem solchen Diagramm nach Mustern für ein Modell zu suchen ...

Ich plane, Prädiktoren zu erstellen, die Logik hier ist, dass es Option Streiks auf Ebenen, so kann es für Moex nützlich sein.

Die Diagramme sind interessant, MQL möchte einen schnellen Algorithmus erhalten...
 
Aleksey Vyazmikin:

Zum Thema Störung - vielleicht müssen wir die Art der Fehlerkorrektur ändern.

Warum Blackbox, wenn es nur 2-3 Schichten gibt, dann ist es durchaus realistisch, durch Koeffizienten zu entschlüsseln. Kleine Koeffizienten können hier vergröbert und mit Nullen versehen werden, wodurch sich die Anzahl der Eingaben für das Neuron verringert.

Was meinen Sie mit "vielleicht sollten Sie wechseln"? Lernen Sie die Mathematik und die Funktionsweise von Aktivierungsschriften. Oder sind die Netzwerkentwickler so dumm, dass sie nicht wussten, dass

Warum sollte man sich auf all diese Dinge einlassen und das Rad neu erfinden, wenn man keinen Abschluss oder mathematischen Hintergrund hat? Es ist eine dumme Zeitverschwendung. Es gibt Technologien, und es ist festgelegt, wie sie zu verwenden sind.

 
Maxim Dmitrievsky:

Lernen Sie die Mathematik und die Funktionsweise von Aktivierungsfunktionen kennen. Oder die Netzwerkentwickler sind so dumm, dass sie es nicht herausgefunden haben.

weil es reine Zeitverschwendung ist, nichts als Spekulationen und nichts Konkretes. Sie haben einfach den Autoencoder optimiert, Hotkeys zu einer Bündelung oder NS hinzugefügt und uns die Ergebnisse gezeigt. Das ist alles. Sie müssen nichts weiter ausarbeiten. Tiefgreifende Architekturen sind nicht dazu da, um geparst zu werden, sondern um die analytische Routine zu reduzieren.

Warum sollte man sich überhaupt auf all das einlassen und das Rad neu erfinden, wenn man keinen Abschluss oder mathematischen Hintergrund hat? Es ist eine dumme Zeitverschwendung. Es gibt Technologien, und es ist festgelegt, wie sie eingesetzt werden sollen, das ist alles. Viele Leute arbeiten daran.

Wenn fertige, sofort einsetzbare Lösungen die von mir gestellten Aufgaben lösen würden, müsste ich nichts erfinden.

Jetzt bereite ich eine große Stichprobe vor und werde viele Modelle auf CatBoost trainieren. Ich habe einige Ideen, wie ich die Modellqualität für eine weitere erfolgreiche Echtzeitanwendung einschätzen kann - ich werde die Ergebnisse meiner Forschung mitteilen.

 
Aleksey Vyazmikin:

Wenn fertige Lösungen aus der Schachtel die von mir gestellten Aufgaben lösen würden, bräuchte ich nichts zu erfinden, aber leider ist das nicht der Fall.

Jetzt bereite ich die große Stichprobe vor und werde viele Modelle auf CatBoost trainieren, es gibt Ideen, wie man die Qualität des Modells mit dem Ziel ihrer weiteren erfolgreichen Anwendung in Echtzeit einschätzen kann - ich werde Ergebnisse der Forschung teilen.

Ich glaube nicht, dass catboost die beste Lösung für die Vorhersage von Zeitreihen ist, denn es funktioniert nicht mit Sequenzen.

Sie können mit der Klassifizierung spielen, aber sie wird nutzlos sein.
 
Maxim Dmitrievsky:

Catbust ist nicht für Zeitreihenvorhersagen geeignet, da es nicht mit Sequenzen arbeitet.

nur um mit der Klassifizierung zu spielen, aber es ist nutzlos

Und wie stellt man fest, ob es funktioniert oder nicht?

Ich habe Modelle im Tester, die seit einem Jahr rentabel sind (vor etwa einem Jahr trainiert) - wollen Sie damit sagen, dass sie zufällig sind?

Ja, CatBoost ist einem genetischen Baum mit Post-Processing-Blättern unterlegen, aber es ist sehr schnell zu trainieren.

Und was funktioniert - NS?

 
Aleksey Vyazmikin:

Wie können Sie feststellen, ob es funktioniert oder nicht?

Ich habe Modelle im Tester, die seit einem Jahr rentabel sind (vor etwa einem Jahr trainiert) - wollen Sie damit andeuten, dass sie ein Glücksfall sind?

Ja, CatBoost ist einem genetischen Baum mit Post-Processing-Blättern unterlegen, aber es ist sehr schnell zu trainieren.

Und was funktioniert - NS?

Ich habe sie nicht definiert, die Architektur selbst ist für andere Aufgaben bestimmt.

Ja, es ist alles zufällig.

noch nichts funktioniert )

 
Aleksey Vyazmikin:

Prädiktoren sind keine Preise in nackter Form - viele relative Punkte, die ähnlich sein können...

Ich bin mir nicht sicher, ob ein Screening durch Korrelation effektiv wäre...

Warum nicht ausprobieren? Auch ein negatives Ergebnis ist ein Ergebnis (im Sinne eines Denkanstoßes).

Ich habe sogar einmal die Formel für den Korrelationskoeffizienten vorgeschlagen: C = (n1 - n2)/n, wobei n die Anzahl der Balken ist, bei denen mindestens eines der beiden Systeme das Handelssignal gibt, n1 die Anzahl der Balken ist, bei denen die Signale von beiden Systemen gleichzeitig und in die gleiche Richtung gegeben werden, und n2 die Anzahl der Balken ist, bei denen die Signale von beiden Systemen gleichzeitig und in die entgegengesetzte Richtung gegeben werden.

Diese Matrix kann für Clustering, Ausdünnung und Portfoliobildung verwendet werden.

 
Maxim Dmitrievsky:

Ich habe es nicht bestimmt, aber die Architektur selbst ist für andere Aufgaben gedacht.

Ja, es ist alles zufällig.

bis jetzt funktioniert nichts)

Natürlich gibt es hier keine Zeitreihenschärfung, so dass die Prädiktoren X-Koordinaten-Informationen enthalten sollten, nicht nur Y-Koordinaten-Informationen.

Wenn man lernt, solche Zufallsmuster zu erkennen, ist man ein Profi.

Mehr als 60 % der in den vergangenen Jahren beprobten Blätter funktionieren, was sehr gut ist und meiner Meinung nach die Richtigkeit des Konzepts einer schlecht klassifizierten Datenverarbeitung bestätigt. Wenn mehr Leute an der Idee arbeiten würden, wäre das Ergebnis besser, aber jeder hat sein eigenes Süppchen gekocht.

 
Aleksey Vyazmikin:

Natürlich findet hier keine Zeitreihenschärfung statt, so dass die Prädiktoren Informationen über die X-Koordinaten und nicht nur über die Y-Koordinaten enthalten sollten.

Wenn man lernt, solche Zufallsmuster zu erkennen, wird man davon profitieren.

Mehr als 60 % der in den vergangenen Jahren beprobten Blätter funktionieren, was sehr gut ist und meiner Meinung nach die Richtigkeit des Konzepts einer schlecht klassifizierten Datenverarbeitung bestätigt. Wenn mehr Leute an der Idee arbeiten würden, wäre das Ergebnis besser, aber jeder hat sein eigenes Süppchen gekocht.

Zum Beispiel wollte der Artikel... Skizzieren Sie die Grundzüge des Konzepts. Ich verstehe immer noch nicht, was du da machst :D

Ich vertrete die Auffassung, dass die Merkmale automatisch vom Modell selbst aus den Zeitreihen (sofern vorhanden) extrahiert werden sollten. Und es ist nicht nötig, irgendetwas manuell zu tun. Die Abstufungen sind ausreichend. Die Frage ist die Architektur. Wie zum Beispiel in NLP (neuronale Sprachverarbeitung) bestimmt das neuronale Netz selbst den Kontext in Wortfolgen, d.h. die Beziehung zwischen Zeitreihenproben.

 
Aleksey Nikolayev:

Warum probieren Sie es nicht aus? Auch ein negatives Ergebnis ist ein Ergebnis (im Sinne eines Denkanstoßes).

Ich glaube, ich habe sogar einmal die Formel für den Korrelationskoeffizienten vorgeschlagen: C = (n1 - n2)/n, wobei n die Anzahl der Balken ist, bei denen mindestens eines der beiden Systeme ein Handelssignal gibt, n1 die Anzahl der Balken ist, bei denen die Signale von beiden Systemen gleichzeitig und in dieselbe Richtung gegeben werden, und n2 die Anzahl der Balken ist, bei denen die Signale von beiden Systemen gleichzeitig und in entgegengesetzte Richtungen gegeben werden.

Die Matrix dieser Kennzahlen kann zur Clusterbildung, Ausdünnung und Portfoliobildung verwendet werden.

Was hat das mit Prädiktoren zu tun?

Ich mache etwas Ähnliches für die Blattauswahl, aber der Haken ist, dass die Anzahl der Blattantworten in der Stichprobe unterschiedlich ist und wir berücksichtigen sollten, dass Blätter mit ähnlichen Antworten, aber unterschiedlicher Länge zur gleichen Gruppe gehören können.

Grund der Beschwerde: