Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 45): Training von Fertigkeiten zur Erkundung des Zustands" - Seite 2
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Ich habe alle Testerprotokolle gelöscht und die Research-Optimierung für die ersten 4 Monate des Jahres 2023 auf EURUSD H1 durchgeführt.
Ich lief es auf echte Ticks:
Ergebnis: 4 Stichproben insgesamt, 2 im Plus und 2 im Minus:
Vielleicht mache ich etwas falsch, optimiere die falschen Parameter oder es stimmt etwas mit meinem Terminal nicht? Es ist mir nicht klar... Ich versuche, Ihre Ergebnisse wie im Artikel zu wiederholen...
Die Fehler beginnen ganz am Anfang.
Das Set und das Optimierungsergebnis sowie die Agenten- und Testerprotokolle sind im Archiv Research.zip angehängt
1. Ich habe die vollständige Optimierung angegeben, nicht die schnelle Optimierung. Dies ermöglicht eine vollständige Aufzählung der gegebenen Parameter. Dementsprechend wird es mehr Durchläufe geben.
2. Die Tatsache, dass es beim Start von Research profitable und unprofitable Durchläufe gibt, ist normal. Beim ersten Durchlauf wird das neuronale Netz mit zufälligen Parametern initialisiert. Die Anpassung des Modells wird während des Trainings durchgeführt.
Das Problem ist, dass Sie "tester.ex5" ausführen, um die Qualität der trainierten Modelle zu prüfen, die Sie noch nicht haben. Zuerst müssen Sie Research.mq5ausführen , um eine Datenbank mit Beispielen zu erstellen. Dann StudyModel.mq5, mit dem der Autoencoder trainiert wird. Der Schauspieler wird in StudyActor.mq5 oder StudyActor2.mq5 trainiert (unterschiedliche Belohnungsfunktion). Und erst dann wird tester.ex5 funktionieren. Beachten Sie, dass Sie in den Parametern des letzteren das Akteursmodell Act oder Act2 angeben müssen. Dies hängt vom Expert Advisor ab, mit dem Sie Actor studieren.
Dmitry guten Tag!
Können Sie mir sagen, wie man verstehen kann, dass der Trainingsfortschritt überhaupt stattfindet? Sind die Prozentsätze der Fehler beim Reinforcement Learning von Bedeutung oder schauen sie auf das tatsächliche Handelsergebnis des Netzwerks?
Wie viele Zyklen haben Siestudiert (StudyModel.mq5 -> StudyActor2.mq5 ), bis Sie ein angemessenes Ergebnis erhielten?
Sie haben in Ihrem Artikel angegeben, dass Sie zunächst eine Basis von 50 Durchläufen gesammelt haben. Haben Sie im Laufe des Trainings weitere Sammlungen durchgeführt, die ursprüngliche Basis ergänzt oder gelöscht und neu erstellt?
Verwenden Sie immer 100.000 Iterationen in jedem Durchgang oder ändern Sie die Anzahl von Durchgang zu Durchgang? Wovon hängt sie ab?
Ich habe dem Netzwerk 3 Tage lang eine Lektion erteilt, ich habe vielleicht 40-50 Zyklen gemacht. Das Ergebnis ist wie auf dem Screenshot zu sehen. Manchmal gibt es nur eine gerade Linie (öffnet oder schließt keine Geschäfte). Manchmal werden viele Geschäfte eröffnet und nicht geschlossen. Nur das Eigenkapital ändert sich. Ich habe verschiedene Beispiele ausprobiert. Ich habe versucht, 50 Beispiele zu erstellen und dann Schleifen zu bilden. Ich habe versucht, 96 Beispiele zu erstellen und alle 10 Zyklen weitere 96 Beispiele hinzuzufügen, und so weiter bis zu 500. Das Ergebnis ist das gleiche. Wie kann ich es unterrichten? Was mache ich falsch?
Guten Tag Dimitri!
Können Sie mir sagen, wie man den Fortschritt des Trainings überhaupt verstehen kann? Spielen die Fehlerprozente beim Reinforcement Learning eine Rolle oder schauen sie auf das tatsächliche Handelsergebnis des Netzwerks?
Wie viele Zyklen haben Siestudiert (StudyModel.mq5 -> StudyActor2.mq5 ), bis Sie ein angemessenes Ergebnis erhielten?
Sie haben in Ihrem Artikel angegeben, dass Sie zunächst eine Basis von 50 Durchläufen gesammelt haben. Haben Sie im Laufe des Trainings weitere Sammlungen durchgeführt, die ursprüngliche Basis ergänzt oder gelöscht und neu erstellt?
Verwenden Sie immer 100.000 Iterationen in jedem Durchgang oder ändern Sie die Anzahl von Durchgang zu Durchgang? Wovon hängt sie ab?
Ich habe dem Netzwerk 3 Tage lang eine Lektion erteilt, ich habe vielleicht 40-50 Zyklen gemacht. Das Ergebnis ist wie auf dem Screenshot zu sehen. Manchmal gibt es nur eine gerade Linie (öffnet oder schließt keine Geschäfte). Manchmal werden viele Geschäfte eröffnet und nicht geschlossen. Nur das Eigenkapital ändert sich. Ich habe verschiedene Beispiele ausprobiert. Ich habe versucht, 50 Beispiele zu erstellen und dann Schleifen zu bilden. Ich habe versucht, 96 Beispiele zu erstellen und alle 10 Zyklen weitere 96 Beispiele hinzuzufügen, und so weiter bis zu 500. Das Ergebnis ist das gleiche. Wie kann ich es unterrichten? Was mache ich falsch?
Es ist dasselbe...
Ich habe ein paar Tage damit verbracht, aber das Ergebnis ist das gleiche.
Wie man es lehrt, ist unklar ...
Ich habe es nicht geschafft, das Ergebnis wie in dem Artikel zu bekommen....