Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 39): Go-Explore, ein anderer Ansatz zur Erkundung"

 

Neuer Artikel Neuronale Netze leicht gemacht (Teil 39): Go-Explore, ein anderer Ansatz zur Erkundung :

Wir setzen die Untersuchung der Umgebung in Modellen des verstärkten Lernens fort. Und in diesem Artikel werden wir uns einen weiteren Algorithmus ansehen – Go-Explore. Er ermöglicht es Ihnen, die Umgebung in der Phase der Modellbildung effektiv zu erkunden.

Die Hauptidee von Go-Explore besteht darin, sich an vielversprechende Zustände zu erinnern und zu ihnen zurückzukehren. Dies ist von grundlegender Bedeutung für einen effektiven Betrieb, wenn die Anzahl der Belohnungen begrenzt ist. Diese Idee ist so flexibel und breit gefächert, dass sie auf vielfältige Weise umgesetzt werden kann. 

Im Gegensatz zu den meisten Reinforcement-Learning-Algorithmen konzentriert sich Go-Explore nicht auf die direkte Lösung des Zielproblems, sondern darauf, relevante Zustände und Aktionen im Zustandsraum zu finden, die zum Erreichen des Zielzustands führen können. Um dies zu erreichen, hat der Algorithmus zwei Hauptphasen: Suche und Wiederverwendung.


Die erste Phase besteht darin, alle Zustände im Zustandsraum zu durchlaufen und jeden besuchten Zustand in einer Zustands-“Karte“ festzuhalten. Danach beginnt der Algorithmus, jeden besuchten Zustand genauer zu untersuchen und Informationen über Aktionen zu sammeln, die zu anderen interessanten Zuständen führen können.

In der zweiten Phase geht es darum, bereits gelernte Zustände und Aktionen wiederzuverwenden, um neue Lösungen zu finden. Der Algorithmus speichert die erfolgreichsten Trajektorien und verwendet sie, um neue Zustände zu erzeugen, die zu noch erfolgreicheren Lösungen führen können.

Autor: Dmitriy Gizlyk

 
Hallo. Faza 1 hat im Testprogramm funktioniert und eine leere Datei im gemeinsamen Ordner GoExploer. bd. Faza 2 ist nicht mit dem Diagramm verbunden.
 
Beim zweiten Versuch wurde der Prozess gestartet. Das Startdatum war weit weg, stellen Sie es so ein, wie Sie einen Monat haben.
 
star-ik #:
Beim zweiten Versuch wurde der Prozess gestartet. Das Startdatum war weit weg, ich habe es so eingestellt, dass Sie einen Monat Zeit haben.
Was ist das Ergebnis?
 
Mehr oder weniger. Aber die Drawdowns sind groß. Er eröffnet ein Geschäft und wartet lange auf einen günstigen Moment, um es zu schließen. Er füllt oft nach. Verkauft sehr selten, kauft immer nur. Die Pfeile sind auf jedem Balken zu sehen. Sobald der Markt funktioniert, werde ich ihn in der Demo-Version ausprobieren.
 
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jedem Öffnen eines neuen Balkens. Ich verstehe nicht, wie er ein Plus in der Tester gemacht.
 
star-ik #:
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jedem Öffnen eines neuen Balkens. Ich verstehe nicht, wie er im Testgerät ins Plus gekommen ist.

Danke

 
star-ik #:
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jeder Öffnung eines neuen Balkens. Ich verstehe nicht, wie er in der Testversion ein Plus machen konnte.

Ahahahah))))

Murmeltiertag.


Ich habe Mitleid mit Ihnen.

Versuchen Sie, die Schaltfläche "Start" im Strategietester mehrmals zu drücken. Sie werden überrascht sein.

 

Guten Tag Dimitri. Vielen Dank für diese wunderbare Artikelserie. Ich habe alle Ihre Expert Advisors ausprobiert, aber ich habe ein Problem mit den neuesten.

Der Expert Advisor aus Artikel 36 (der mit dem größten neuronalen Netzwerk) besteht den Test im Tester, aber die Grafikkarte wird während des Tests nicht geladen und der Expert Advisor versucht nicht zu handeln. Das Gleichgewichtsdiagramm ändert sich nicht. Im Protokoll des Testers sind keine Fehler zu finden. Im Ordner Common\Files erscheinen 1 kb große Dateien.

Expert Advisors aus den Artikeln 37 und 38 werden überhaupt nicht getestet. Der Test wird gestartet, aber es gibt keinen Fortschritt. Gleichzeitig wird die Grafikkarte zu 100% belastet. Und so weiter, bis der MT5-Prozess im Manager beendet wird. Es werden keine Dateien in Common\Files erstellt. Es gibt keine Fehler im Tester.

Der Expert Advisor aus diesem Artikel Faza1 durchläuft den Test korrekt ohne Fehler im Log, aber die Datei GoExploer.bd wird auch mit der Größe von 1kb erstellt.

Können Sie mir bitte sagen, wo ich suchen muss? Andere Expert Advisors aus dieser Artikelserie (die auf den Chart geworfen werden) funktionieren normal und werden als Grafikkarte betrachtet. Grafikkarte RTX 3060 c 12Gb.

 
Viktor Kudriavtsev #:

Der Expert Advisor aus diesem Artikel Faza1 besteht den Test ebenfalls korrekt ohne Fehler im Log, aber die Datei GoExploer.bd wird auch mit einer Größe von 1kb erstellt.


Der Expert Advisor Faza1 fügt der Datenbank nur dann Daten hinzu, wenn die Testergebnisse positiv ausfallen. Wenn alle Durchläufe unrentabel waren, wird er nichts speichern. Versuchen Sie, ihn mehrere Male im Optimierungsmodus laufen zu lassen.
 
star-ik #:
Auf der Demo ist er ausdrücklich im Minus. Er füllt sich bei jedem Öffnen eines neuen Balkens. Ich verstehe nicht, wie er im Tester ein Plus gemacht hat.

Was ist die Trainingsperiode? Eine kurze Einarbeitungszeit erlaubt nur zu sehen, ob das Modell lernen kann. Aber solche Erfahrungen reichen nicht aus, um sie auf zukünftige Zustände des Systems zu interpolieren.