Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3012

 
Maxim Dmitrievsky #:

was du sagst, versteht meiner Meinung nach immer noch niemand )

Er hat alles klar, ohne Worte und einfach, nach dem Prinzip des Rasiermessers von Occam.

Nein, es ist nur so, dass Sie über die Idee gelacht haben, als ich in den Thread kam und anfing, über das Heraussuchen von Regeln aus den Bäumen zu sprechen und sie zu bewerten.

Jetzt habe ich den nächsten Schritt gemacht - die Schaffung von Bedingungen für die Erstellung von potenziell hochwertigen Regeln durch die Bewertung von Quantensegmenten des Prädiktors, und wieder werde ich völlig missverstanden.

 
СанСаныч Фоменко #:

Ich habe ein paar Mal geschrieben.

Hier muss man das Gleiche hundertmal sagen, um gehört zu werden.

 
Aleksey Vyazmikin #:

Nein, es ist nur so, dass Sie über die Idee gelacht haben, als ich in den Thread kam und anfing, Regeln aus den Bäumen zu ziehen und sie zu bewerten.

Jetzt habe ich den nächsten Schritt gemacht - die Schaffung von Bedingungen für die Erstellung potenziell hochwertiger Regeln durch die Schätzung von Quantenabschnitten des Prädiktors, und wieder werde ich völlig missverstanden.

Einfach nur Regeln aus dem Baum zu ziehen, macht Sie also nicht glücklich? Theoretisch ist es auch hier eine Frage des Glücks, aber auf Kosten ihrer (Regel-)Anzahl könnte man etwas finden.

Es ist ungefähr dasselbe wie die Suche nach Strategieparametern in einem Optimierer, nur auf elegantere Weise.
 
Maxim Dmitrievsky #:

Sie sind also nicht zufrieden, wenn Sie die Regeln aus dem Baum ziehen?

Die Methode erwies sich als recht gut, abgesehen von der Tatsache, dass es keine Gewissheit über das weitere Leben der Regeln mit ihrer anschließenden Reinkarnation gibt. In großen Abständen zeigten mehr als 50% der ausgewählten Regeln positive Leistungsergebnisse.

Ich habe einen genetischen Baum verwendet - dieser ist sehr langsam, wenn die Stichprobe viele Prädiktoren enthält.

Daher beschloss ich, nach Möglichkeiten zu suchen, um die Menge der Informationen zu reduzieren, die dem Baum zum Training zugeführt werden. Ich begann nach Möglichkeiten zu suchen, potenziell nützliche Daten hervorzuheben.

Ein weiteres Problem besteht darin, dass die Blätter/Regeln in Bezug auf die Aktivierungspunkte sehr ähnlich sind. Und je größer die Blattbasis wurde, desto schwieriger war es, Einzigartigkeit zu finden.

Das Ergebnis: Das Design ist interessant, es gibt etwas zu verbessern, aber in meinem Fall war es extrem langsam. Im Allgemeinen nicht für Experimente geeignet, aber interessant für die Umsetzung, wenn das ganze Konzept der TK-Bauvorrichtung fertig ist.

Und natürlich - ich kenne R nicht, ich habe lokale Gurus gefragt, und niemand konnte mir helfen, meine Aufgaben zu lösen.

Jetzt würde ich Sampling und erzwungene Auswahl des Wurzelprädiktors (durch Liste) und Blockierung des bereits verwendeten Prädiktors hinzufügen.

 
Aleksey Vyazmikin #:

Die Methode erwies sich als recht gut, abgesehen von der Tatsache, dass es keine Gewissheit über die weitere Lebensdauer der Regeln mit ihrer anschließenden Reinkarnation gibt. In langen Abständen zeigten mehr als 50 % der ausgewählten Regeln positive Leistungsergebnisse.

Ich habe einen genetischen Baum verwendet - dieser ist sehr langsam, wenn die Stichprobe viele Prädiktoren enthält.

Daher beschloss ich, nach Möglichkeiten zu suchen, um die Menge der Informationen zu reduzieren, die dem Baum zum Training zugeführt werden. Ich begann nach Möglichkeiten zu suchen, potenziell nützliche Daten auszuwählen.

Ein weiteres Problem besteht darin, dass die Blätter/Regeln in Bezug auf die Aktivierungspunkte sehr ähnlich sind. Und je größer die Blattbasis wurde, desto schwieriger war es, Einzigartigkeit zu finden.

Das Ergebnis: Das Design ist interessant, es gibt etwas zu verbessern, aber in meinem Fall war es extrem langsam. Generell nicht für Experimente geeignet, aber interessant für die Umsetzung, wenn das Gesamtkonzept des TK-Baukastens steht.

Und natürlich - ich kenne R nicht, ich habe lokale Gurus gefragt, und niemand konnte mir helfen, meine Probleme zu lösen.

Jetzt würde ich Sampling und erzwungene Auswahl des Wurzelprädiktors (durch Liste) und Blockierung des bereits verwendeten Prädiktors hinzufügen.

Was hat catbust damit zu tun? Wozu brauchst du es, ziehst du auch Regeln daraus?

Warum nehmen Sie nicht einen einfachen Baum und gehen von der Wurzel bis zu den Spitzen nach Regeln vor, wobei Sie komplexen Regeln weniger Gewicht geben (Strafe für Regelkomplexität)

jede Regel in einem Prüfprogramm auf neue Daten anwenden, wobei die Regeln mit einem großen Fehler vorher verworfen werden.

ZY, ich mag diesen Ansatz intuitiv immer noch nicht, ich habe noch nicht herausgefunden, warum.
 
Aleksey Vyazmikin #:

Und natürlich - ich kenne R. nicht,

Das höre ich schon seit über einem Jahr.

Sie können R in einer Woche lernen.

 
Maxim Dmitrievsky #:

Was hat Catbust damit zu tun? Wozu braucht man es, bekommt man auch die Regeln heraus?

CatBoost ist eine großartige Geschwindigkeit, um zu überprüfen, ob die Richtung der Ideen überhaupt richtig ist.

Ich kann Regeln aus dem ersten Baum ziehen, aber natürlich fallen sie im Durchschnitt viel schwächer aus (es gibt auch gute, aber sehr selten), also habe ich diese Idee vorerst aufgegeben. Nun gibt es eine alternative Möglichkeit, Bäume zu erstellen, vielleicht sind die Regeln dort stärker, aber es gibt keine Möglichkeit, in MQL5 mit einem solchen Modell ohne Python zu arbeiten.

Und im Allgemeinen habe ich meine eigenen Ideen, wie man ein Modell baut, das langsam zu erstellen ist, aber mit den gleichen Prüfungen, die für die Auswahl der Blätter verwendet wurden. Vielleicht werde ich eines Tages zu seiner Implementierung in Code kommen.

 
Maxim Dmitrievsky #:

Warum nimmt man nicht einfach einen einfachen Baum und geht von der Wurzel bis zu den Spitzen nach Regeln vor, wobei komplexe Regeln weniger Gewicht erhalten (Abzug für die Komplexität der Regeln)?

jede Regel in einem Prüfprogramm auf neue Daten anwenden, wobei die Regeln mit einem großen Fehler vorher verworfen werden.

ZY, ich mag diesen Ansatz intuitiv immer noch nicht, ich habe noch nicht herausgefunden, warum

Der Unterschied liegt im Wesentlichen nur in der Datenmenge und der CPU-Last bei der Anwendung des Modells.

Naja, und außerdem sind die Blätter durch die Gruppierung und Verteilung der Gewichte (ich nannte es ein Herbarium :) ) einfacher zu gruppieren.

Es werden viele Bäume verwendet, um Regeln zu erstellen, was bedeutet, dass sich die Signale überschneiden, was bei nur einem Baum nicht der Fall ist.

 
mytarmailS #:

Das höre ich nun schon seit über einem Jahr.

R kann in einer Woche erlernt werden

Offenbar ist nicht jeder so begabt.

Und der Code ist nicht einfach - ich habe versucht, ihn neu zu schreiben, aber es gab nicht genügend Informationen im Internet, um das Problem zu lösen.

Ein weiterer Nachteil von R ist, dass es keine einfache Lösung für die Parallelisierung von Berechnungen zwischen Computern gibt.

 
Aleksey Vyazmikin #:

Der Unterschied besteht im Wesentlichen nur in der Menge der Daten und der CPU-Belastung bei der Anwendung des Modells.

Nun und plus, Blätter sind leichter zu Ensemble, sammeln in Gruppen und Gewichte zu verteilen (ich nannte es Herbarium :) ).

Es werden viele Bäume verwendet, um Regeln zu erstellen, was bedeutet, dass sich Signale überschneiden, was bei nur einem Baum nicht der Fall ist.

Mir ist klar, warum ich diese Idee nicht mag, denn Assoziation (Regeln z.B.) != Kausalität :)

Grund der Beschwerde: