Diskussion zum Artikel "MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 41): Deep-Q-Networks"

 

Neuer Artikel MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 41): Deep-Q-Networks :

Das Deep-Q-Network ist ein Reinforcement-Learning-Algorithmus, der neuronale Netze bei der Projektion des nächsten Q-Wertes und der idealen Aktion während des Trainingsprozesses eines maschinellen Lernmoduls einsetzt. Wir haben bereits einen alternativen Verstärkungslernalgorithmus, Q-Learning, in Betracht gezogen. Dieser Artikel stellt daher ein weiteres Beispiel dafür vor, wie ein mit Reinforcement Learning trainierter MLP in einer nutzerdefinierten Signalklasse verwendet werden kann.

Tiefes Q-Lernen (DQN) ist neben Q-Lernen ein weiterer Algorithmus des verstärkenden Lernens, den wir uns in diesem Artikel angesehen haben, aber im Gegensatz zum Q-Learning verwenden sie neuronale Netze, um den q-Wert und die nächste Aktion des Agenten vorherzusagen. Es ist dem Q-Learning insofern ähnlich/verwandt, als dass eine Q-Tabelle involviert ist, in der das kumulative Wissen über Aktionen und Zustände aus früheren „Episoden“ gespeichert wird. Tatsächlich teilt es sich die gleiche Wikipedia-Seite mit Q-Learning, wie aus den Links ersichtlich ist, wo es im Wesentlichen als eine Variante von Q-Learning definiert wird.

Die Signalklasse zusammen mit den Klassen für Trailing-Stop und dem Money-Management sind die drei Hauptmodule, die beim Aufbau eines assistentengestützten Expert Advisors definiert werden müssen. Die Zusammenstellung mit Hilfe des MQL5-Assistenten kann anhand der Anleitungen hier und hier für neue Leser erfolgen. Der am Ende dieses Artikels beigefügte Quellcode ist für die Verwendung der Assistenten-Bauanleitungen gedacht, die unter diesen Links aufgeführt sind. Auch hier geht es um die Definition einer nutzerdefinierten Signalklasse für die Verwendung in einem vom Assistenten zusammengestellten Expert Advisor.

Dies ist jedoch nicht die einzige Möglichkeit, DQN zu untersuchen, da auch Implementierungen für eine nutzerdefinierte Trailing-Klasse oder eine nutzerdefinierte Money-Management-Klasse erstellt und getestet werden können. Wir konzentrieren uns jedoch auf die Signalklasse, da die Bestimmung der Kauf- und Verkaufs-Bedingungen in diesen Expert Advisors von entscheidender Bedeutung ist und in vielen Fällen das Potenzial eines Handels-Setups am besten demonstriert. Dieser Artikel baut auf früheren Artikeln dieser Serie auf, in denen wir auf Techniken oder verschiedene Setups eingehen, die bei der Entwicklung von maßgeschneiderten, mit einem Assistenten ausgestatteten Expert Advisors verwendet werden können, und so wäre ein Rückblick auf frühere Artikel für neue Leser eine gute Idee, insbesondere wenn sie ihren Ansatz diversifizieren möchten. Diese Artikel behandeln nicht nur eine Vielzahl von nutzerdefinierten Signalen, sondern auch nutzerdefinierte Implementierungen der Trailing-Klasse und der Money-Management-Klasse.

Autor: Stephen Njuki