Diskussion zum Artikel "MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 36): Q-Learning mit Markov-Ketten"

Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Neuer Artikel MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 36): Q-Learning mit Markov-Ketten :
Reinforcement Learning ist neben dem überwachten und dem unüberwachten Lernen eine der drei Hauptrichtungen des maschinellen Lernens. Es geht also um die optimale Steuerung oder das Erlernen der besten langfristigen Strategie, die der Zielfunktion am besten entspricht. Vor diesem Hintergrund untersuchen wir die mögliche Rolle, die ein MLP für den Lernprozess eines von einem Assistenten zusammengestellten Expertenberaters spielt.
Nutzerdefinierte Signalklassen für assistentengestützte Expert Advisors können verschiedene Rollen übernehmen, die es wert sind, erforscht zu werden. Wir setzen diese Suche fort, indem wir untersuchen, wie der Algorithmus von Q-Lernen zusammen mit Markov-Ketten den Lernprozess eines mehrschichtigen Perzeptron-Netzwerks verfeinern kann. Q-Learning ist einer der verschiedenen (ca. 12) Algorithmen des Reinforcement-Learnings. Im Wesentlichen geht es also auch darum, wie dieses Thema als nutzerdefiniertes Signal implementiert und in einem von einem Assistenten zusammengestellten Expert Advisor getestet werden kann.
Die Struktur dieses Artikels geht also davon aus, was Reinforcement-Learning ist, beschäftigt sich mit dem Q-Learning-Algorithmus und seinen Zyklusphasen, betrachtet, wie Markov-Ketten in Q-Learning integriert werden können und schließt dann wie immer mit den Berichten des Strategietesters. Das Verstärkungslernen kann als unabhängiger Signalgeber genutzt werden, da seine Zyklen („Episoden“) im Wesentlichen eine Form des Lernens sind, die Ergebnisse als „Belohnungen“ für jede der „environments“ (Umgebungen) quantifiziert, an denen der „Akteur“ beteiligt ist. Diese in Anführungszeichen gesetzten Begriffe werden im Folgenden erläutert. Wir verwenden das Reinforcement Learning jedoch nicht als reines Signal, sondern nutzen seine Fähigkeiten, um den Lernprozess zu fördern, indem wir es als Ergänzung zu einem Multi-Layer-Perceptron einsetzen.
Autor: Stephen Njuki