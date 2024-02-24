Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 881
Ich habe eine Frage zur Zielvariable.
Wenn unsere Zielvariable das finanzielle Ergebnis eines Geschäfts ist, dann ist es sinnvoll, dieses Ergebnis zu normalisieren, wie ich dachte. Aber hier suche ich nach Informationen auf der Website, und überall heißt es, dass die Zielvariable zwei Werte haben sollte - Kaufen oder Verkaufen. Und wenn ich in jedem Fall - ob ich nun kaufe oder verkaufe - einen Verlust erleide (und das kommt vor!), warum sollte ich dann alle negativen Variablen streichen? Und wenn es das Vorhandensein negativer Varianten ist, das die Statistik beeinflusst?
Generell würde ich gerne wissen, welche Netzwerke im Extremfall mit einem Kauf/Verkauf/Nichts-Trigger funktionieren (und wo man sie bekommt?), und im besten Fall mit einer Funktion (vorher habe ich hier nach einer Funktion gefragt, da ich nach einer theoretischen Lösung gesucht habe, aber jetzt habe ich ein Skript erstellt, das Prädiktoren zusammenfasst), die das Ranking vornimmt.
Es hängt alles von Ihren Prädiktoren ab. Sie können die Antwort nur experimentell herausfinden, indem Sie beide Varianten ausprobieren. Ich habe zum Beispiel versucht, meine eigene Fitnessfunktion für Forest zu erstellen - ich habe ein Handelsdiagramm (unter Berücksichtigung des Spreads) unter Verwendung von Forest-Prognosen erstellt und das Diagramm verwendet, um die Sharpe Ratio zu definieren; das war der Wert, den ich als Ergebnis zu erhöhen versuchte.
> Generell würde ich gerne wissen, welche Netze funktionieren.
Ich nehme derzeit offene Preise und verwende sie mit (selbst erstellten) Indikatoren, um neue Funktionen zu schaffen. Ich trainiere die Neuronik, die den Preisanstieg pro Barren vorhersagt. Ich brauche viel Zeit, um neue Indikatoren zu erstellen, da das Modell sonst nicht den Spread schlagen kann.
Wenn ich mir Ihre Dateien anschaue, sehe ich, dass Sie bereits eine Menge Prädiktoren haben. Wenn Ihr Ziel nur ein Satz von -1,0,1 ist - verwenden Sie forest. Wenn Sie den Preis vorhersagen wollen - verwenden Sie besser Neuron.
Falsch... ja, die Punkte, wo der maximale Gewinn möglich ist, z.B.
für Klassifizierungszwecke ein mehrschichtiges Perseptron mit einer Softmax-Ausgabeschicht (gibt Wahrscheinlichkeiten der Klassenzugehörigkeit aus)
Haben Sie dies gelesen? https://www.mql5.com/ru/articles/497 am Beispiel des 1. Neurons. Und dann stellen Sie sich vor, dass es viele von ihnen gibt, also das ganze neuronale Netz.
Das sind genau die Schwellenwertfunktionen, nach denen Sie gefragt haben.
Nun, es sieht nach einem guten Ergebnis aus, ja.
Ich habe diesen Artikel übersehen - danke für den Hinweis, jetzt ist einiges klarer geworden! Aber nicht alles auf einmal - man muss solche Dinge immer wieder lesen... Ich habe verstanden, wie man Koeffizienten streut und ihre Summe mit einer Funktion hört.
Versuchen Sie die 1. Datei, teilen Sie sie in 3 Teile auf:
Ausbildung
Vorhersage
Tatsächlich 0 1
0 28107 1244
1 3045 4119
Prüfung 1
Vorhersage
Tatsächlich 0 1
0 5950 356
1 742 776
Aktuell 2
Vorhersage
Tatsächlich 0 1
0 5945 333
1 779 769
Berechnet auf nnet mit 10 Neuronen in einer versteckten Schicht (NS des Rattle-Pakets von R)
Schlechter als Ihr Wald, aber nicht schlecht. Die zweite Datei kann zu ähnlichen Ergebnissen führen.
Danke! Ich denke, dass diese Ergebnisse als Filter, d. h. als Handelsverbot, verwendet werden können, da das Erraten von Nullen stabiler ist.
Nun, in Wirklichkeit gibt es mehr von ihnen - deshalb ist es leicht zu erraten)
Jetzt nehme ich offene Preise und verwende sie mit (selbst erstellten) Indikatoren, um neue Funktionen zu schaffen. Ich trainiere die Neuronik, die mit Hilfe dieser Chips den Preisanstieg pro Barren vorhersagt. Die Erstellung neuer Indikatoren nimmt viel Zeit in Anspruch, da das Modell sonst nicht den Spread schlagen kann.
Teilweise funktionieren die meisten meiner Funktionen mit der Vorhersage, aber nicht des Preises, sondern seines Niveaus - ich benutze meine ATR, aber die Standard-ATR sollte auf die gleiche Weise funktionieren.
Das spielt also keine Rolle - die Hauptsache ist, dass man weiß, in welchen Bereichen ein erhöhtes Risiko für den Handel besteht, und das haben sie irgendwie gezeigt.
Die andere Sache ist, dass ich keine Ahnung habe, wie ich das alles in denselben Indikator verwandeln kann - ist es wirklich notwendig, alle Regeln, die sich gebildet haben, neu zu schreiben oder was?
Hmm, ich dachte, es wäre wichtiger für den Wald, die Prädiktoren logisch zu machen, wie ja/nein, was ich auch getan habe, und deshalb gibt es so viele davon, aber es wäre viel weniger. Ich werde versuchen, es anders zu machen - ich werde einem Prädiktor 8 Werte geben, und ich werde sehen, ob sich das Ergebnis ändert.
Der Wald ist schlechter und weist nur wenige Merkmale auf, es gibt nur wenige Splits.
Und wenn es viele spärliche Merkmale gibt und eines davon nicht spärlich ist, dann wird sich der Wald zu sehr an dieses Merkmal anpassen und die Importe daraus werden am größten sein, und die anderen werden nur sehr wenig Einfluss auf das Ergebnis haben
Normal Forest oder Random Forest, oder beides?
Ich habe die Rattle und R (gut, und glitches die ganze Sache ...), und jetzt kann ich nicht verstehen, wie man eine vergleichbare Einstellung zu machen, wie in dem Screenshot unten? Denn die Standardeinstellungen von Rattle lieferten schlechtere Ergebnisse als das Programm, das ich zuvor verwendet hatte.
Dieselben Anzeigen, dieselben Einstellungen, aber die Anzeigen sind zusammengeklappt und nicht wie zuvor erweitert.
Alte Variante
Neue Variante
Ich fand etwas mehr Nullen, aber deutlich weniger Einsen - fast doppelt so viele! Ich hätte nicht gedacht, dass kollabierte und erweiterte Variablen einen solchen Effekt haben können...
Normal Forest, Random Forest und Tree Forest sind dasselbe :) Wald ist ein Ensemble von Bäumen
Sind die Merkmale kollabiert, d. h. es gibt weniger von ihnen, oder was? Bei kollabierten Merkmalen handelt es sich um sich selten ändernde und/oder kategorische Merkmale wie Einsen und Nullen (das ist ein hohes Maß an Verständnis).
Ich verwende R nicht, weil mir die lokalen Gurus mit ihren vergoldeten Brillen davon abgeraten haben.
Solange Sie sich die Mühe machen, studieren Sie die Theorie darüber, was Bäume sind und was ein Wald aus Bäumen ist.
https://habr.com/post/171759/
https://habr.com/post/116385/
Wenn Sie die Einstellungen von Rattle ändern möchten, sollten Sie es zu Sanych nehmen, aber ich weiß nicht, warum, Sie wollen nur zu frönen, oder die Mühe mit der Integration der EA auf mt5 und R
https://www.mql5.com/ru/articles/1165
Bei Ihren Daten, der Datei Pred_004_Buy, die in zwei Hälften geteilt wird, erhalten Sie 0,85 Kopfpunkte.
Die Daten sind Unsinn und sollten besser weggeworfen werden. Den Rest holen wir selbst nach. In der Stille...
Warum sind die Daten so schlecht? Das ist ein sehr gutes Ergebnis.