Diskussion zum Artikel "MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 80): Verwendung von Ichimoku-Muster und des ADX-Wilder mit TD3 Reinforcement Learning"

 

Neuer Artikel MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 80): Verwendung von Ichimoku-Muster und des ADX-Wilder mit TD3 Reinforcement Learning :

Dieser Artikel schließt an Teil 74 an, in dem wir die Paarung von Ichimoku und ADX im Rahmen des überwachten Lernens untersuchten, und verlagert den Schwerpunkt auf das Bestärkende Lernen. Ichimoku und ADX bilden eine komplementäre Kombination von Unterstützungs-/Widerstandskartierung und Trendstärkemessung. In dieser Folge wird gezeigt, wie der Twin Delayed Deep Deterministic Policy Gradient (TD3) Algorithmus mit diesem Indikatorensatz verwendet werden kann. Wie bei früheren Teilen der Serie erfolgt die Implementierung in einer nutzerdefinierten Signalklasse, die für die Integration mit dem MQL5-Assistenten entwickelt wurde, was eine problemlose Zusammenstellung von Expert Advisors ermöglicht.

In der Familie der RL-Algorithmen zeichnet sich der Twin Delayed Deep Deterministic Policy Gradient (TD3) in einigen Kreisen als solider Kandidat für Finanzanwendungen ab. TD3 ist für kontinuierliche Aktionsräume konzipiert und eignet sich daher besonders gut für Handelsprobleme, bei denen Positionsgrößen und Timing nicht binär sind, sondern eine feinkörnige Kontrolle erfordern. Im Vergleich zu seinem Vorgänger DDPG bringt TD3 entscheidende Stabilitätsverbesserungen mit sich, wie z.B. die Verwendung von mehr als einem Kritiker, das Hinzufügen von Rauschglättung zu den Zielaktionen und das Verzögern von Politikaktualisierungen, um eine Überanpassung an vorübergehende Schwankungen zu verhindern. 

Unser Hauptziel mit diesem Artikel ist, wie immer, zu demonstrieren, wie TD3-Modelle, wenn sie in Python trainiert werden, in das Expert Advisor Framework von MQL5 integriert werden können, um Prototypen zu erstellen. Konkret soll gezeigt werden, wie ein TD3-Akteursnetzwerk, das in das ONNX-Format exportiert wird, in eine nutzerdefinierte Signalklasse verpackt und verwendet werden kann. Wie immer werden diese Signalklassen dann mit Hilfe des MQL5-Assistenten zu einem Handelsroboter zusammengestellt.

Um diese Diskussion mit etwas mehr „Praxisnähe“ zu untermauern, schließt der Artikel mit einem Überblick über einige Vorwärtstests, die mit dem MetaTrader Strategy Tester durchgeführt wurden. Es werden drei Berichte analysiert, die jeweils die 3 Signalmuster abdecken, die wir im Artikel Teil 74 zur weiteren Untersuchung ausgewählt hatten. Dies waren die Signalmuster 0, 1 und 5.


Autor: Stephen Njuki