Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 39): Go-Explore, ein anderer Ansatz zur Erkundung"
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jeder Öffnung eines neuen Balkens. Ich verstehe nicht, wie er in der Testversion ein Plus machen konnte.
Ahahahah))))
Murmeltiertag.
Ich habe Mitleid mit Ihnen.
Versuchen Sie, die Schaltfläche "Start" im Strategietester mehrmals zu drücken. Sie werden überrascht sein.
Guten Tag Dimitri. Vielen Dank für diese wunderbare Artikelserie. Ich habe alle Ihre Expert Advisors ausprobiert, aber ich habe ein Problem mit den neuesten.
Der Expert Advisor aus Artikel 36 (der mit dem größten neuronalen Netzwerk) besteht den Test im Tester, aber die Grafikkarte wird während des Tests nicht geladen und der Expert Advisor versucht nicht zu handeln. Das Gleichgewichtsdiagramm ändert sich nicht. Im Protokoll des Testers sind keine Fehler zu finden. Im Ordner Common\Files erscheinen 1 kb große Dateien.
Expert Advisors aus den Artikeln 37 und 38 werden überhaupt nicht getestet. Der Test wird gestartet, aber es gibt keinen Fortschritt. Gleichzeitig wird die Grafikkarte zu 100% belastet. Und so weiter, bis der MT5-Prozess im Manager beendet wird. Es werden keine Dateien in Common\Files erstellt. Es gibt keine Fehler im Tester.
Der Expert Advisor aus diesem Artikel Faza1 durchläuft den Test korrekt ohne Fehler im Log, aber die Datei GoExploer.bd wird auch mit der Größe von 1kb erstellt.
Können Sie mir bitte sagen, wo ich suchen muss? Andere Expert Advisors aus dieser Artikelserie (die auf den Chart geworfen werden) funktionieren normal und werden als Grafikkarte betrachtet. Grafikkarte RTX 3060 c 12Gb.
Der Expert Advisor aus diesem Artikel Faza1 besteht den Test ebenfalls korrekt ohne Fehler im Log, aber die Datei GoExploer.bd wird auch mit einer Größe von 1kb erstellt.
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jedem Öffnen eines neuen Balkens. Ich verstehe nicht, wie er im Tester ein Plus gemacht hat.
Was ist die Trainingsperiode? Eine kurze Einarbeitungszeit erlaubt nur zu sehen, ob das Modell lernen kann. Aber solche Erfahrungen reichen nicht aus, um sie auf zukünftige Zustände des Systems zu interpolieren.
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Neuer Artikel Neuronale Netze leicht gemacht (Teil 39): Go-Explore, ein anderer Ansatz zur Erkundung :
Wir setzen die Untersuchung der Umgebung in Modellen des verstärkten Lernens fort. Und in diesem Artikel werden wir uns einen weiteren Algorithmus ansehen – Go-Explore. Er ermöglicht es Ihnen, die Umgebung in der Phase der Modellbildung effektiv zu erkunden.
Die Hauptidee von Go-Explore besteht darin, sich an vielversprechende Zustände zu erinnern und zu ihnen zurückzukehren. Dies ist von grundlegender Bedeutung für einen effektiven Betrieb, wenn die Anzahl der Belohnungen begrenzt ist. Diese Idee ist so flexibel und breit gefächert, dass sie auf vielfältige Weise umgesetzt werden kann.
Im Gegensatz zu den meisten Reinforcement-Learning-Algorithmen konzentriert sich Go-Explore nicht auf die direkte Lösung des Zielproblems, sondern darauf, relevante Zustände und Aktionen im Zustandsraum zu finden, die zum Erreichen des Zielzustands führen können. Um dies zu erreichen, hat der Algorithmus zwei Hauptphasen: Suche und Wiederverwendung.
Die erste Phase besteht darin, alle Zustände im Zustandsraum zu durchlaufen und jeden besuchten Zustand in einer Zustands-“Karte“ festzuhalten. Danach beginnt der Algorithmus, jeden besuchten Zustand genauer zu untersuchen und Informationen über Aktionen zu sammeln, die zu anderen interessanten Zuständen führen können.
In der zweiten Phase geht es darum, bereits gelernte Zustände und Aktionen wiederzuverwenden, um neue Lösungen zu finden. Der Algorithmus speichert die erfolgreichsten Trajektorien und verwendet sie, um neue Zustände zu erzeugen, die zu noch erfolgreicheren Lösungen führen können.
Autor: Dmitriy Gizlyk