Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 51): Behavior-Guided Actor-Critic (BAC)"
Danke Sir @Dmitriy
//+------------------------------------------------------------------+
Hallo zusammen. Ich habe diese Version nach etwa 3-4 Zyklen (Datenbank Sammlung - Training - Test) begann, nur eine gerade Linie auf Tests geben. Die Deals öffnen sich nicht. Training hat alle Zeiten 500 000 Iterationen. Ein weiterer interessanter Punkt - zu einem bestimmten Zeitpunkt der Fehler von einem der Kritiker wurde sehr groß, und dann allmählich die Fehler der beiden Kritiker sank auf 0. Und für 2-3 Zyklen die Fehler der beiden Kritiker sind bei 0. Und auf die Tests Test.mqh gibt eine gerade Linie und keine Geschäfte. In Research.mqh gibt es Durchgänge mit negativem Gewinn und Abschlüssen. Es gibt auch Durchgänge ohne Abschlüsse und mit einem Ergebnis von Null. In einem der Zyklen gab es nur 5 Durchgänge mit einem positiven Ergebnis.
Im Allgemeinen ist das seltsam. Ich habe strikt nach Dmitrys Anweisungen in allen Artikeln trainiert, und ich war nicht in der Lage, ein Ergebnis aus irgendeinem Artikel zu erhalten. Ich verstehe nicht, was ich falsch mache....
Der neue Artikel Neuronale Netze leicht gemacht (Teil 51): Behavioral Actor-Criticism (BAC) wurde veröffentlicht:
Autor: Dmitriy Gizlyk
Ich habe den gezippten Ordner heruntergeladen, aber es waren viele andere Ordner darin.
Wenn möglich, möchte ich, dass Sie mir erklären, wie ich das Programm einsetze und trainiere.
Herzlichen Glückwunsch zu einer großartigen Arbeit!
Herzlichen Dank!

- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Neuer Artikel Neuronale Netze leicht gemacht (Teil 51): Behavior-Guided Actor-Critic (BAC) :
Die letzten beiden Artikel befassten sich mit dem Soft Actor-Critic-Algorithmus, der eine Entropie-Regularisierung in die Belohnungsfunktion integriert. Dieser Ansatz schafft ein Gleichgewicht zwischen Umwelterkundung und Modellnutzung, ist aber nur auf stochastische Modelle anwendbar. In diesem Artikel wird ein alternativer Ansatz vorgeschlagen, der
sowohl auf stochastische als auch auf deterministische Modelle anwendbar ist.
Lassen Sie uns zunächst über die Notwendigkeit sprechen, die Umgebung im Allgemeinen zu untersuchen. Ich denke, alle sind sich einig, dass dieser Prozess notwendig ist. Aber wofür genau und in welchem Stadium?
Lassen Sie uns mit einem einfachen Beispiel beginnen. Angenommen, wir befinden uns in einem Raum mit drei identischen Türen und müssen auf die Straße gehen. Was sollen wir tun? Wir öffnen die Türen eine nach der anderen, bis wir die richtige gefunden haben. Wenn wir denselben Raum wieder betreten, öffnen wir nicht mehr alle Türen, um nach draußen zu gelangen, sondern gehen sofort zu dem bereits bekannten Ausgang. Wenn wir eine andere Aufgabe haben, dann sind einige Optionen möglich. Wir können wieder alle Türen öffnen, bis auf den Ausgang, den wir schon kennen, und nach dem richtigen suchen. Oder wir können uns erst einmal daran erinnern, welche Türen wir früher auf der Suche nach einem Ausweg geöffnet haben und ob die, die wir brauchen, darunter war. Wenn wir uns an die richtige Tür erinnern, gehen wir auf sie zu. Ansonsten prüfen wir die Türen, die wir noch nicht ausprobiert haben.
Schlussfolgerung: In einer ungewohnten Situation müssen wir die Umgebung studieren, um das richtige Verhalten zu wählen. Nachdem die gewünschte Route gefunden wurde, kann eine weitere Erkundung der Umgebung nur hinderlich sein.
Wenn sich jedoch die Aufgabe in einem bekannten Zustand ändert, müssen wir möglicherweise zusätzlich die Umgebung untersuchen. Dazu kann auch die Suche nach einer optimaleren Route gehören. Im obigen Beispiel könnte dies der Fall sein, wenn wir durch mehrere Räume gehen müssen oder uns auf der falschen Seite des Gebäudes befinden.
Daher benötigen wir einen Algorithmus, der es uns ermöglicht, die Erkundung der Umgebung in unerforschten Zuständen zu verbessern und in bereits erforschten Zuständen zu minimieren.
Autor: Dmitriy Gizlyk