Diskussion zum Artikel "Die Anwendung der Monte Carlo Methode beim Reinforcement-Learning"

FxTrader562 2018.12.14 09:42 #1

Ich möchte gerne zu den Beobachtungen beitragen:

Vorteile dieser Version:

*************************************

1. Im Gegensatz zu früheren Versionen wird bei dieser Version nicht ständig gehandelt. Es wird selektiv gehandelt, wenn das Signal gut ist. Dies ist ein großer Vorteil, um Ihre Bedürfnisse zu erfüllen. Ansonsten ist es eine gute Sache.))) ..

2. Er kann schnell und einfach optimiert werden.

3. Die Größe des Trainermodells ist klein, so dass wir große Datenmengen trainieren können.

Die Nachteile dieser Version:

*******************************************

1. In vielen Fällen dauert es sehr lange, bis der Optimierungsprozess abgeschlossen ist, und wir müssen ihn daher manuell abbrechen.

2. Aus einigen Gründen ist es nicht so einfach, die Tests auszuführen. Ich muss mein MT5-Terminal neu starten und manchmal funktioniert es trotzdem nicht.

Meine Vorschläge zur Verbesserung:

*************************************

1. Versuchen Sie, mindestens 4 bis 5 Eingabefunktionen für das Training zu verwenden, wie z.B. open, close, high, low.

2. versuchen Sie, die "MathMoments ()" -Funktionen richtig zu verwenden, wenn Sie die Handelssignale optimieren wollen:

h ttps:// www.mql5.com/en/docs/standardlibrary/mathematics/stat/mathsubfunctions/statmathmoments

3. Versuchen Sie, einen iterativen Trainingskurs auf täglicher oder wöchentlicher Basis zu implementieren.

Dies ist ein zufälliges Ergebnis.

4. Versuchen Sie mehrere Zeiträume.

Ich muss das tun. Wie können wir es besser machen :))))

Documentation on MQL5: Standard Library / Mathematics / Statistics / Subfunctions / MathMoments

www.mql5.com

Standard Library / Mathematics / Statistics / Subfunctions / MathMoments - Reference on algorithmic/automated trading language for MetaTrader 5

Portfolio: PriceChannelExpert und andere MT4 hat nicht mehr Fragen von Neueinsteigern zu

Aleksandr Masterskikh 2018.12.14 11:15 #2

Die Monte-Carlo-Methode ist sicherlich eine wirksame Methode zur Untersuchung von Zufallsprozessen. Allerdings sollte bei der Anwendung dieser Methode (wie auch bei jeder anderen) die Art des Prozesses (bei uns sind es die Finanzmärkte) berücksichtigt werden.

Das Problem der modernen Analytik besteht darin, dass bisher weder die traditionelle TA noch andere Methoden in der Lage waren, die elementare Struktur der Marktpreisbewegungen (wie ein Atom in der Physik) aufzudecken, und die verfügbaren Strukturen (TA-Muster, Elliott-Wellen und andere) sind nicht elementar, da sie für die Analyse nicht kontinuierlich sind (sie erscheinen mehrdeutig oder selten). Daher ist die Anwendung moderner Methoden fast eine blinde Suche nach dem so genannten "besten Modell" mittels Brute-Force-Methode (in diesem Fall mittels Monte-Carlo-Methode).

Dies ist jedoch ein Problem für die gesamte Analytikbranche. Und der Autor hat im Rahmen der Methode originelle Lösungen aufgezeigt - danke für die Arbeit!

Diskussion zum Artikel "Brute-Force-Ansatz Diskussion zum Artikel "MQL5 Diskussion zum Artikel "Optimale

Ivan Negreshniy 2018.12.15 11:45 #3

Respekt an den Autor, für einen weiteren interessanten Artikel, für ein offenes und konstruktives Herangehen an die MO, trotz der heimlichen, mausartigen Fummelei anderer Teilnehmer des Themas und des Zugunders der Verwaltung:)

Speziell zum Thema - ich verstehe nicht ganz den Sinn des Monte-Carlo-Schießens, um Ziele zu finden, denn sie sind fast eindeutig deterministisch und können eine Größenordnung schneller gefunden werden, je nach den Scheitelpunkten des Zickzacks oder den Werten der gleichen Erträge.

Meines Erachtens wäre es sinnvoller, diese Methode auf ein viel unsichereres und mehrdimensionales Problem anzuwenden, wie z. B. die Auswahl und Einstufung von Prädiktoren. Idealerweise sollten die Prädiktoren bei der Lösung dieses Problems in einem Komplex bewertet werden, und die im Artikel beschriebene Suche und das alternative Training für jeden einzelnen Prädiktor sieht aus wie ein Gleichungssystem mit einer Unbekannten.

Diskussion zum Artikel "Random-Forest-Vorhersage-Trends" Maschinelles Lernen im Handel: Diskussion zum Artikel "Algorithmen

[Gelöscht] 2018.12.16 08:27 #4

Ivan Negreshniy:

Respekt an den Autor, für einen weiteren interessanten Artikel, für eine offene und konstruktive Herangehensweise an die MO, trotz der geheimen, Mausfummelei anderer Teilnehmer des Themas und der Verwaltung zugunder:)

Speziell zum Thema - ich verstehe nicht ganz den Sinn des Monte-Carlo-Schießens, um Ziele zu finden, denn sie sind fast eindeutig deterministisch und können eine Größenordnung schneller gefunden werden, in Übereinstimmung mit den Scheitelpunkten des Zickzacks oder den Werten der gleichen Erträge.

Meines Erachtens wäre es sinnvoller, diese Methode auf ein viel unsichereres und mehrdimensionales Problem anzuwenden, wie z. B. die Auswahl und Einstufung von Prädiktoren. Idealerweise sollten die Prädiktoren bei der Lösung dieses Problems in einem Komplex bewertet werden, und die im Artikel beschriebene Suche und das alternative Training für jeden einzelnen Prädiktor sieht aus wie die Erstellung von Gleichungssystemen mit einer Unbekannten.

Hallo, durch Monte Carlo gibt es eine Brute-Force-Suche des Ziels zufällig, nach allen Kanons von RL. Das heißt, es gibt viele Strategien (Schritte), der Agent sucht nach der optimalen, durch den minimalen Fehler auf der oos. Die Konstruktion neuer Merkmale ist auch in einer der Bibliotheken über MSUA implementiert (siehe Codobase). In diesem Papier wird nur eine Brute-Force-Suche von bestehenden Fiches implementiert, ohne neue zu konstruieren. Siehe Rekursive Eliminierungsmethode. Das heißt, sowohl Fiches als auch Ziele werden rekursiv eliminiert. Später kann ich andere Varianten vorschlagen, davon gibt es tatsächlich eine Menge. Aber vergleichende Tests sind sehr zeitaufwendig.

Diskussion zum Artikel "Fortschrittliches Fragen von Anfängern MQL5 [ARCHIV!] Alle Fragen von

Aleksandr Masterskikh 2018.12.16 10:21 #5

Ivan Negreshniy:

Respekt an den Autor, für einen weiteren interessanten Artikel, für eine offene und konstruktive Herangehensweise an die MO, trotz der geheimen, Mausfummelei anderer Teilnehmer des Themas und der Verwaltung zugunder:)

Speziell zum Thema - ich verstehe nicht ganz den Sinn des Monte-Carlo-Schießens, um Ziele zu finden, denn sie sind fast eindeutig deterministisch und können eine Größenordnung schneller gefunden werden, in Übereinstimmung mit den Scheitelpunkten des Zickzacks oder den Werten der gleichen Erträge.

Meines Erachtens wäre es sinnvoller, diese Methode auf ein viel unsichereres und mehrdimensionales Problem anzuwenden, wie z. B. die Auswahl und Einstufung von Prädiktoren. Idealerweise sollten die Prädiktoren bei der Lösung dieses Problems in einem Komplex bewertet werden, und die im Artikel beschriebene Suche und das alternative Training für jeden einzelnen Prädiktor sieht aus wie die Erstellung von Gleichungssystemen mit einer Unbekannten.

Was "eindeutig deterministisch" betrifft, so ist dies nicht korrekt, da TA-Zahlen und "Renditen" sehr mehrdeutig und unzuverlässig zu analysieren sind.

Deshalb verwendet der Autor sie nicht, sondern experimentiert mit der Monte-Carlo-Methode.

[WARNUNG GESCHLOSSEN!] Alle Fragen Maschinelles Lernen im Handel: Hilfe bei der Codierung

FxTrader562 2018.12.16 12:16 #6

Hallo Maxim.

eine Frage.

"shift_probab" und "regularisation" Die Werte werden nur zur Optimierung verwendet und NICHT im Zuge des Live-Handels. Liege ich da richtig?

Oder ist es notwendig, die optimierten Werte für shift_probab und regularisation nach jeder Optimierung für den Live-Handel auf dem Chart zu setzen?

Vielen Dank!

Jede Anfängerfrage, um das Expert Advisors: RSI EA Maschinelles Lernen im Handel:

Ivan Negreshniy 2018.12.16 12:55 #7

Maxim Dmitrievsky:
Hallo, durch Monte Carlo gibt es eine zufällige Aufzählung von Zielen, nach allen Kanons des RL. Das heißt, es gibt viele Strategien (Schritte), der Agent sucht nach der optimalen, durch den minimalen Fehler auf der oos. Die Konstruktion neuer Merkmale ist ebenfalls in einer der Bibliotheken über MSUA implementiert (siehe Codobase). In diesem Papier wird nur eine Brute-Force-Suche von bestehenden Fiches implementiert, ohne neue zu konstruieren. Siehe Rekursive Eliminierungsmethode. Das heißt, sowohl Fiches als auch Ziele werden rekursiv eliminiert. Später kann ich andere Varianten vorschlagen, davon gibt es tatsächlich eine Menge. Aber vergleichende Tests sind sehr zeitaufwändig.

Hi, natürlich ist die zufällige Auswahl von Aktionen der Kanon des RL, außerdem kann sie notwendig sein, weil verschiedene Aktionen des Agenten die Umgebung verändern können, was eine gegen unendlich tendierende Anzahl von Varianten erzeugt, und natürlich kann man Monte Carlo anwenden, um die Reihenfolge solcher Aktionen zu optimieren.

Aber in unserem Fall hängt die Umgebung - die Marktkurse - nicht von den Handlungen des Agenten ab, vor allem nicht in der betrachteten Implementierung, in der historische, im Voraus bekannte Daten verwendet werden, und daher kann die Wahl der Reihenfolge der Handlungen (Trades) des Agenten ohne stochastische Methoden erfolgen.

P.S. Es ist z.B. möglich, die Zielsequenz von Trades mit dem maximal möglichen Gewinn durch Notierungen zu finden https://www.mql5.com/de/code/9234.

ReverseSystem

www.mql5.com

Простая и короткая система, работающая неплохо в тестере на любых парах и таймфрэймах. Можно видеть закономерность: чем меньше таймфрэйм - тем выше прибыль. ReverseSystem можно запускать, как по ценам открытия, так и по всем тикам. ReverseSystemBEST (работает только на модели: Все тики) показывает максимальную прибыль, которую можно было...

Diskussion zum Artikel "MQL5 Fragen von Neueinsteigern zu Die Regelmäßigkeiten der Preisbewegungen:

[Gelöscht] 2018.12.16 14:08 #8

FxTrader562 :

Hallo Maxim.

eine Frage.

"shift_probab" und "regularisation" Die Werte werden nur zur Optimierung verwendet und NICHT im Zuge des Live-Handels. Liege ich da richtig?

Oder ist es notwendig, die optimierten Werte für shift_probab und regularisation nach jeder Optimierung für den Live-Handel auf dem Chart zu setzen?

Ja, danke.

Hallo, ja, nur für die Optimierung und dann haben Sie ein separates Modell, das aus einer Datei in einem Test zu Test oder Live-Trading-Test geladen wird

[Gelöscht] 2018.12.16 14:11 #9

Ivan Negreshniy:

Hi, natürlich ist die zufällige Auswahl von Aktionen der Kanon von RL, außerdem kann es notwendig sein, weil verschiedene Aktionen des Agenten die Umgebung verändern können, was eine Anzahl von Optionen erzeugt, die gegen unendlich tendieren, und natürlich kann Monte Carlo gut angewandt werden, um die Sequenz solcher Aktionen zu optimieren.

Aber in unserem Fall hängt die Umgebung - die Marktkurse - nicht von den Handlungen des Agenten ab, vor allem nicht in der betrachteten Implementierung, in der historische, im Voraus bekannte Daten verwendet werden, und daher kann die Wahl der Reihenfolge der Handlungen (Trades) des Agenten ohne stochastische Methoden erfolgen.

P.S. Es ist z.B. möglich, die Zielsequenz von Trades mit dem maximal möglichen Gewinn durch Notierungen zu finden https://www.mql5.com/de/code/9234.

Ja, der Markt ändert sich nicht durch die Handlungen des Agenten, aber der Fehler auf dem oob ist sehr gleichmäßig, man kann die Streuung auf dem Optimierungsdiagramm sehen. Und wir suchen nach einem Modell, das nach einem externen Kriterium optimal ist, nämlich dem Test-Sabset. Die Fehlersprünge erreichen 0,3 und mehr, das ist ein sehr großer Unterschied zwischen verschiedenen Modellen. Es ist möglich, jeden einzelnen Durchgang erheblich zu beschleunigen, das ist bereits implementiert, aber wir müssen es noch fertigstellen. Und dann werden Hunderte von Durchgängen Minuten dauern. Zumindest sind mir noch keine anderen Möglichkeiten eingefallen, die Agenten zu verfeinern. Was das Beispiel von fxsaber angeht - habe ich am Telefon nicht wirklich verstanden. Ich habe verstanden, dass es sich an die Historie anpasst, diese macht im Grunde das Gleiche - öffnet zufällige Trades, und korrigiert dann alle Verlusttrades durch TD - zeitliche Differenz. Mit anderen Worten, können Sie fast perfekte Handel auf der Trayne, auf jeder Bar zu bekommen. Es genügt, 1 < shift_prob >=0,5 zu setzen. Mit Ticks riskiere ich noch kein Gerüst, die Modelle werden sehr schwer sein.

Volatilität Qualitätsindex Maschinelles Lernen im Handel: Interessantes Thema für viele:

[Gelöscht] 2018.12.16 14:15 #10

Aleksandr Masterskikh:

Die Aussage "eindeutig deterministisch" ist falsch, da TA-Zahlen und "Renditen" sehr vieldeutig und unzuverlässig zu analysieren sind.

Daher verwendet der Autor sie nicht, sondern experimentiert mit der Monte-Carlo-Methode.

Im Allgemeinen werden in dieser Version die Renditen einfach so eingegeben :), aber das ist nur ein Beispiel, Sie können es nach Belieben ändern.