Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2018

 
Maxim Dmitrievsky:

Ich glaube, der Artikel wollte... Skizzieren Sie die Grundzüge des Konzepts. Ich verstehe immer noch nicht, was du da machst :D

Ich vertrete die Ansicht, dass die Merkmale automatisch vom Modell selbst aus den Zeitreihen extrahiert werden sollten (falls es welche gibt). Und es ist nicht nötig, irgendetwas manuell zu tun. Die Abstufungen sind ausreichend. Die Frage ist die Architektur. Wie zum Beispiel in NLP (neuronale Sprachverarbeitung) bestimmt das neuronale Netz selbst den Kontext in Wortfolgen, d.h. die Verbindung zwischen Zeitreihenmustern.

Der genetische Baum und CatBoost sind nur schwach miteinander verbunden, der Artikel, den ich über CatBoost schreiben möchte. Aufgeschoben, um aus dem Grund zu schreiben, dass ich die Fehler in der Stabilität der Indikatoren der Prädiktoren gefunden habe und alle Kräfte auf die Korrektur es geworfen habe, gleichzeitig und die neuen Prädiktoren gemacht haben. Bis Ende der Woche will ich mit den Berechnungen beginnen (sonst ist es lästig, wenn die Server im Leerlauf sind), und ich werde versuchen, den ersten Teil des Artikels bis Ende des Monats zu schreiben. Der Artikel wird über meine Küche des Modellbaus auf CatBoost sein.

Mit genetischen Bäumen ist es komplizierter, es wird noch keinen Artikel darüber geben, aber der Ansatz ist, dass wir Blätter von Bäumen auswählen, die einen Teil der Daten über die Geschichte stabil klassifizieren - in der Tat 0,5%-3% aller Probenantworten, je mehr solcher Blätter, desto besser, jetzt etwa 1000 für Kauf und Verkauf, zusätzlich suche ich Blätter, die auch ausgewählte Blätter filtern, d.h. ich führe zusätzliches Training durch, das ihre Genauigkeit erhöht. Die Blätter werden nach ihrer Ähnlichkeit gruppiert (hier ist noch einiges zu tun), dann werden ihre Antworten innerhalb jeder Gruppe nach dem Verlauf gewichtet und der Schwellenwert, bei dem das Signal einer Gruppe von Blättern erzeugt wird, bestimmt. Ein zusätzlicher Filter ist ein genetischer Baum, der auf den Antworten aller Blätter oder nur Gruppen von Blättern basiert. Mit diesem Ansatz lässt sich die Vollständigkeit der Klassifizierung bei unausgewogenen Stichproben erheblich steigern, in meinem Fall mit 3 Zielen, bei denen das Ziel "0" etwa 65 % ausmacht.

Die Arbeit an den Auswahlkriterien für die Blätter und die Methodik ihrer Zusammenstellung birgt ein großes Verbesserungspotenzial, so dass die Modelle von höherer Qualität sein können.

 
Aleksey Vyazmikin:

Was haben Prädiktoren damit zu tun?

Er muss verwirrt gewesen sein, weil er an seine eigene Person dachte.)

 
Maxim Dmitrievsky:

Ich bin der Meinung, dass die Merkmale automatisch vom Modell selbst aus den Zeitreihen extrahiert werden sollten (falls es welche gibt). Und es ist nicht nötig, irgendetwas manuell zu tun. Die Abstufungen sind ausreichend. Die Frage ist die Architektur. Zum Beispiel bestimmt das neuronale Netz selbst den Kontext in Wortfolgen, d.h. die Verbindung zwischen Zeitreihenmustern, wie in NLP (neuronale Sprachverarbeitung).

Ich stimme zu, was die Architektur betrifft, wir brauchen eine völlig andere Architektur, wir brauchen eine Reihe von Netzen:

1. die Identifizierung von Bildern.

2. die Bestimmung der räumlichen Anordnung der Bilder

3. Suche nach Mustern in den im Raum platzierten Bildern

Jetzt habe ich mein eigenes Gehirn, das für die Netze 1 und 2 die Prädiktoren erstellt, und mit der dritten Aufgabe ist der CatBoost beschäftigt. Es wird schwierig sein, diese Netze in einem einzigen zusammenzufassen. Vielleicht sollte man versuchen, mit jeder Richtung separat zu arbeiten und dann diese Netze zu vereinen?

 
Aleksey Vyazmikin:

Jetzt löse ich für die Netze 1 und 2 mit meinem Gehirn, indem ich Prädiktoren zusammenstelle, und CatBoost übernimmt die dritte Aufgabe. Es wäre schwierig, diese Netze zu einem einzigen zusammenzuführen. Vielleicht sollten Sie versuchen, mit jeder Richtung getrennt zu arbeiten und diese Netze dann zusammenzuführen?

Man muss die Innovationen beobachten, sie werden ständig verbessert. Moderne Netze haben genau die gleiche Aufgabe, nämlich alles auf einmal zu machen.

Die manuelle Suche nach Prädiktoren ist, als würde man mit einer Spitzhacke auf einen Stein schlagen. Und wie jeder gesehen hat, funktioniert es fast nicht.
 
Maxim Dmitrievsky:

Sie müssen nach neuen Produkten Ausschau halten, sie werden ständig verbessert. Moderne Netze haben genau die gleiche Aufgabe, nämlich alles auf einmal zu machen.

Die manuelle Suche nach Prädiktoren ist wie der Einsatz einer Spitzhacke auf einem Felsen. Und wie jeder gesehen hat, funktioniert es fast nicht.

Es muss eine sehr komplexe Architektur sein, um alles auf einmal zu erledigen, und je komplexer die Architektur ist, desto mehr Rechenleistung wird benötigt.

Allerdings, wenn es Bedarf an Kapazitäten (es gibt alte Server und GPU), bin ich bereit, sie für die Idee zu schaffen ;)

 
Aleksey Vyazmikin:

Je komplexer die Architektur ist, desto mehr Rechenleistung wird benötigt.

Wenn es jedoch einen Bedarf an Strom gibt (es gibt alte Server und GPUs), bin ich bereit, ihn für die Idee zur Verfügung zu stellen ;)

nicht kompliziert, man muss nur verstehen

Ich brauche überhaupt keinen Strom. Ich habe LSTM auf meinem Laptop in ein paar Minuten ohne Grafikkarte gelernt. Das mit der Macht ist ein Mythos.

 
Aleksey Vyazmikin:

Je komplexer die Architektur ist, desto mehr Rechenleistung wird benötigt.

Wenn es jedoch einen Bedarf an Strom gibt (es gibt alte Server und GPUs), bin ich bereit, ihn für die Idee zur Verfügung zu stellen ;).

Sind Sie bereit, eine Idee persönlich vorzustellen?

 
Maxim Dmitrievsky:

nicht kompliziert, man muss es nur herausfinden.

Sie brauchen überhaupt keinen Strom. Ich kann LSTM auf meinem Laptop in wenigen Minuten und ohne Videokarte unterrichten. Das mit der Macht ist ein Mythos.

Nicht komplexe Architekturen funktionieren nicht, Sie haben es selbst gesagt. Unkomplizierte brauchen Stationarität... Zyklen.

Wow, ein paar Minuten ist cool, und welche Netzwerktopologie ist es, wie viele Schichten, Neuronen?

 
dr.mr.mom:

Sind Sie bereit, Ihre Ideen persönlich auszuloten?

Das können Sie persönlich tun.

 
Aleksey Vyazmikin:

Unkomplizierte Architekturen funktionieren nicht, Sie haben es selbst gesagt. Unkomplizierte brauchen Stationarität... Zyklen.

Wow, in ein paar Minuten ist das cool, und welche Netzwerktopologie ist das, wie viele Schichten, Neuronen?

Oh, Mann... es ist nicht kompliziert in dem Sinne, dass man herausfinden kann

In der Regel reichen ein paar Ebenen aus, man braucht nicht viel Tiefe in der Sprache.

Es gibt fortschrittlichere Netze für VR, die cooler sind als lstm. Könnte von dort aus profitabel sein, habe ich noch nicht überprüft. Alle "Klassiker" wie Boostings und Perseptrons sind für BP nicht geeignet.

Grund der Beschwerde: