Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1810

 
Evgeny Dyuka:

JA! So ist es, und nicht anders.

Ich stimme nicht zu, aber ich werde nichts aufzwingen...

 
mytarmailS:

Ich bin nicht einverstanden, aber ich werde Ihnen nichts aufzwingen...

Sie können 3 Tage mit visuell unterschiedlichen Instrumenten verbringen. In jedem Fall werden wir zunächst die Reihen untersuchen und Schlussfolgerungen ziehen. Und es ist immer besser, im Test eine Verständigung zu finden, als in der Realität einen Verlust zu beheben).

 
Valeriy Yastremskiy:

Es ist besser, ohne Emotionen zu testen))) Ein Grund mehr, zu handeln)))))))

Offen gesagt, das Thema Prädiktoren wird nicht behandelt. Ebenso wie die Logik der Modelle, welche Modelle wann angewendet werden sollten und welches Kriterium für ihre Auswahl gilt.

Empfehlungen zur Datenaufbereitung haben nichts mit dem Ergebnis zu tun. Obwohl wir ohne sie nicht starten können)))))

Die logischen Modelle, die Auswahlkriterien und die Datenaufbereitung sind Schlüsselfragen, niemand kann Ihnen eine funktionierende Lösung anbieten. Wenn man es auslegen kann, funktioniert es nicht.

Es spielt keine Rolle, ob es aus menschlicher Sicht gut ist oder nicht, man muss nur zugeben, dass dies die Regeln des Themas sind, in dem wir sitzen.

 
Valeriy Yastremskiy:

Es ist besser, ohne Emotionen zu testen))) Ein Grund mehr, zu handeln)))))))

Offen gesagt, das Thema Prädiktoren wird nicht behandelt. Ebenso wie die Logik der Modelle, welche Modelle wann angewendet werden sollten und welches Kriterium für ihre Auswahl gilt.

Empfehlungen zur Datenaufbereitung haben nichts mit dem Ergebnis zu tun. Obwohl es ohne sie nicht anfängt zu)))))

Nicht offengelegt wird hier nicht, es ist leider der derzeitige Stand der Dinge. Keine Arbeit oder Schlussfolgerungen, wie man feststellen kann, welches Modell für eine bestimmte Reihe besser ist, außer um die Ergebnisse zu vergleichen).

 
Evgeny Dyuka:

Die Logik der Modelle, die Auswahlkriterien und die Datenaufbereitung sind Schlüsselfragen, für die es keine funktionierende Lösung gibt. Wenn sie ausgelegt ist, funktioniert sie nicht.


Nun, ganz so ist es wahrscheinlich nicht. Es ist nur so, dass es mathematische Methoden gibt, deren Anwendung früher nicht für jedermann möglich war, jetzt aber möglich ist. Aber es gibt keine andere Lösung als zu suchen und zu wählen und zu versuchen. Die maximale Plausibilität ist natürlich eine Methode, aber sie ist subjektiv, und das Problem ist die Subjektivität der Wahl der für die Analyse wichtigen Parameter.

Es ist besser, Logiken, Modelle und Prädiktoren mit den Merkmalen und der Logik ihrer Anwendung zu diskutieren.

Es spielt keine Rolle, ob es funktioniert oder nicht. Es ist erwiesen, dass sie nicht 100%ig ist. Und schon einer reicht aus, um zu scheitern)))) Die Hauptsache ist, dass die Hände!!!!! Oder der Schwanz)))))

 
mytarmailS:

Bitte...

200 oder 300 in absoluten Werten.

An welchen Bereichen sind Sie interessiert?


Oder vielleicht ein bisschen R lernen? ;)


5 Zeilen Code und Sie haben, was Sie wollten

Ich denke, Sie sollten sich die Fehlerbilanz ansehen (+1 richtige Eingabe und -1 falsche Eingabe), oder zumindest die Bilanz normalisieren, um Ausreißer zu reduzieren.

R ist eine sehr schwierige Aufgabe für mich, es sieht nicht wie MQL aus, und ich bin weit davon entfernt, ein Programmierer zu sein. Und ich bin nicht einmal ein Programmierer und habe keine richtige Hilfe.


Ich habe gesehen, dass Sie sich für die Stichprobeneffizienz interessieren. Ich bin auch an diesem Thema interessiert, vor allem möchte ich verstehen, ob es möglich ist, die Aufteilung besser zu machen als ich. Ich kann eine Stichprobe machen, in der Prädiktorenwerte ohne und mit Abwahl vorkommen, so dass man die Effizienz des Pakets überprüfen kann, d.h. wenn es nach einer künstlichen Stichprobe besser lernen kann als nach meiner logischen, dann ist das Paket effizienter als der Mensch.

 
Aleksey Vyazmikin:

Ich denke, Sie sollten sich die Fehlerbilanz ansehen (+1 richtige Eingabe und -1 falsche Eingabe), oder zumindest die Bilanz normalisieren, um Ausreißer zu reduzieren.

R ist eine sehr schwierige Aufgabe für mich, es sieht nicht wie MQL aus, und ich bin weit davon entfernt, ein Programmierer zu sein. Und ich bin nicht einmal ein Programmierer und habe keine richtige Hilfe.


Ich habe gesehen, dass Sie sich für die Stichprobeneffizienz interessieren. Ich bin auch an diesem Thema interessiert, vor allem möchte ich verstehen, ob es möglich ist, die Aufteilung besser zu machen als ich. Ich kann eine Stichprobe von Prädiktorwerten ohne und mit Abwahl machen, so dass man die Effizienz des Pakets überprüfen kann, d.h. wenn es nach einer künstlichen Stichprobe besser lernen kann als nach meiner logischen, dann ist das Paket effizienter als ein Mensch.

Ich bin auch kein Programmierer, außerdem habe ich angefangen, C# zu lernen, ich habe nichts verstanden und aufgegeben, dann habe ich R ausprobiert und alles ging gut :)


Durch die Diskretisierung wird die Qualität sicherlich nicht verbessert, sondern eher verschlechtert, Hauptsache, sie wird nicht zu sehr verbessert.

Ich benötige es, um numerische Variablen mit einem Bereich von Tausenden von Teilungen in kategorische Variablen umzuwandeln, die z. B. nur 20 Stufen haben werden.

Ich brauche es, um Regeln zu generieren, die ..... wiederholen werden.

Die Wälder arbeiten nach dem Abstimmungsprinzip, die Ausgabewahrscheinlichkeit ist die Summe der Stimmen der Bäume, manchmal zeigt der Algorithmus eine hohe Wahrscheinlichkeit, aber die Vorhersage ist schlecht, und manchmal hat er eine hohe Wahrscheinlichkeit und eine gute Vorhersage, so dass ich sehe, dass, wenn ich genau weiß, welche Regeln in diesem Moment an der Abstimmung beteiligt sind, ich ehrliche Regeln von verrauschten unterscheiden kann...

 
mytarmailS:

Ich bin auch kein Programmierer, ich habe sogar angefangen, C# zu lernen, ich habe nichts verstanden und aufgegeben, dann habe ich R ausprobiert und alles ging gut :)


Durch die Diskretisierung wird die Qualität sicherlich nicht verbessert, sondern eher verschlechtert, Hauptsache, sie wird nicht zu sehr verbessert.

Ich benötige es, um numerische Variablen mit einem Bereich von Tausenden von Teilungen in kategorische Variablen umzuwandeln, die z. B. nur 20 Stufen haben werden.

Ich brauche es, um Regeln zu generieren, die ..... wiederholen werden.

Wälder funktionieren nach dem Abstimmungsprinzip, die Ausgabewahrscheinlichkeit ist die Summe der Stimmen der Bäume, manchmal zeigt der Algorithmus eine hohe Wahrscheinlichkeit, aber die Vorhersage ist schlecht, und manchmal hat er eine hohe Wahrscheinlichkeit und eine gute Vorhersage, wenn ich genau weiß, welche Regeln an der Abstimmung beteiligt sind, kann ich ehrliche und verrauschte Regeln unterscheiden...

In meinem Fall verbessert die Diskretisierung das Ergebnis, und ja, meine Prädiktoren sind eher kategorisch, fast alle, mit Werten zwischen 2 und 20.

Um ein solches Modell zu schätzen, muss man nämlich die Ähnlichkeit der Aktivierungspunkte der stimmberechtigten Blätter überprüfen und die Blätter, die ständig an ähnlichen Punkten in der Stichprobe aktiviert werden, entfernen bzw. nicht gewichten. Solche verrauschten Bäume passen gut in die Geschichte, weil sie zu viel Speicherplatz haben.

Idealerweise sollte jedes Blatt die Bedeutung enthalten und das benachbarte sollte sie ergänzen, aber etwas anderes beschreiben, z.B. stellte eines fest, dass wir einen Ball vor uns haben, ein anderes bestimmte seine Farbe - klassifizierte also den Ball, der zu einer bestimmten Spielart gehört. Vereinfacht.

Zerlegen Sie den Wald mit Hilfe von Baumindizes in Blätter und sehen Sie sich die Aktivierung jedes einzelnen Blattes auf der Probe an, dann entsorgen Sie den Abfall.
 
mytarmailS:

Vladimir, könnten Sie mir bitte sagen, wie in R ist es möglich, AMO nicht zum Beispiel Klassifizierung oder Regression zu lehren, aber etwas mehr vage ...

Ich weiß nicht, wie es aussehen soll und welche Werte es annehmen soll; es ist nicht wichtig für mich, alles, was ich tun kann, ist, eine Leitfunktion zu beschreiben und AMO ein Kriterium der Leitfunktion maximieren zu lassen, das von ihm selbst erstellt wurde

Oder handelt es sich um ein reines Optimierungsproblem, das nichts mit AMO zu tun hat?


(1) Jedes Modell erfordert die Optimierung von Hyperparametern. Mit den Standardeinstellungen wird das Ergebnis nicht das beste sein. Legen Sie bei der Optimierung das Kriterium fest, das für Sie wichtig ist. In allen Beispielen in der Literatur handelt es sich bei diesen Kriterien um statistische Metriken (Acc, F1, etc.). In unserem Fall führen diese Kriterien nicht immer zu dem erwarteten Ergebnis beim Handel (so seltsam es auch erscheinen mag). Ich verwende zum Beispiel die durchschnittliche Rendite pro Barren über einen bestimmten Zeitraum (in der Regel 1 Woche) als Optimierungskriterium und Indikator für die Leistung des Modells. Wenn der Mindestwert nicht unterschritten wird (z. B. 5 Punkte von 4 Zeichen), wird weiter gearbeitet. Wenn sie gefallen ist, werden wir das Modell mit neuen Daten beenden. Optimierung ist nur Bayesianisch, es gibt Varianten.

Das Modell muss im Laufe des Prozesses ständig verbessert werden, wobei die sich ändernden Marktbedingungen zu berücksichtigen sind. Es ist eine große Illusion, dass man ein Modell auf einer großen Anzahl von Daten aus der Vergangenheit trainieren und es dann lange Zeit ohne erneutes Training verwenden kann.

2. Die Synthese einer Funktion, ich weiß nicht, welcher Art - das ist eine Sache, die man tun oder nicht wissen kann. Es gibt mehrere Pakete, die genetische Programmierung implementieren. Die genauen Namen sind derzeit noch nicht bekannt. Aber das ist ein sehr kniffliger Abschnitt. Versuchen Sie es.

3. Diskretisierung. Der Hauptzweck der Stichprobenbildung besteht darin, das Verhältnis zwischen Prädiktor und Ziel so linear wie möglich zu gestalten. Dies führt natürlich zu Informationsverlusten. Aber in einigen Fällen werden damit recht gute Ergebnisse erzielt.

Viel Glück!

Генетическое программирование - Genetic programming - qwe.wiki
Генетическое программирование - Genetic programming - qwe.wiki
  • ru.qwe.wiki
В области искусственного интеллекта , генетическое программирование ( ГП ) представляет собой метод , посредством которого компьютерные программы кодируются в виде набора генов, которые затем модифицированных (эволюционировали) с использованием эволюционного алгоритма (часто генетический алгоритм , «GA») - это применение ( например...
 
Diskretisierung ist unsinnig, Regularisierung kann verwendet werden. Eine Umschulung des Modells während des Handels ist ebenfalls unsinnig, sie wird nicht funktionieren.
Grund der Beschwerde: