Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 40): Verwendung von Go-Explore bei großen Datenmengen"

 

Neuer Artikel Neuronale Netze leicht gemacht (Teil 40): Verwendung von Go-Explore bei großen Datenmengen :

In diesem Artikel wird die Verwendung des Go-Explore-Algorithmus über einen langen Trainingszeitraum erörtert, da die Strategie der zufälligen Aktionsauswahl mit zunehmender Trainingszeit möglicherweise nicht zu einem profitablen Durchgang führt.

Mit zunehmender Trainingszeit des Go-Explore-Algorithmus treten gewisse Schwierigkeiten auf. Einige von ihnen sind:

  1. Fluch der Dimensionalität: Mit zunehmender Trainingszeit steigt die Anzahl der Zustände, die ein Agent besuchen kann, exponentiell an, sodass es schwieriger wird, die optimale Strategie zu finden.

  2. Umweltveränderungen: Mit zunehmender Dauer des Trainings können Veränderungen in der Umgebung auftreten, die sich auf die Lernergebnisse des Agenten auswirken können. Dies kann dazu führen, dass eine zuvor erfolgreiche Strategie unwirksam oder sogar unmöglich wird.

  3. Schwierigkeiten bei der Auswahl von Aktionen: Mit zunehmender Dauer des Trainings muss der Agent möglicherweise den breiteren Kontext der Aufgabe berücksichtigen, um fundierte Entscheidungen zu treffen. Dies kann die Auswahl der optimalen Aktion erschweren und komplexere Methoden zur Optimierung des Algorithmus erfordern.

  4. Erhöhte Ausbildungszeit: Mit zunehmender Trainingsdauer steigt auch der Zeitaufwand für die Sammlung ausreichender Daten und das Training des Modells. Dies kann die Effizienz und Geschwindigkeit der Agentenschulung verringern.

Mit zunehmender Trainingsdauer kann sich das Problem ergeben, dass die Dimension des zu untersuchenden Zustandsraums zunimmt. Dies kann zu dem Problem des „Fluches der Dimensionalität“ führen, bei dem die Anzahl der möglichen Zustände mit zunehmender Dimensionalität exponentiell ansteigt. Dies macht die Erkundung des Zustandsraums schwierig und kann dazu führen, dass der Algorithmus zu viel Zeit mit der Erkundung irrelevanter Zustände verbringt.

Um die Qualität und Effizienz des trainierten Modells zu überprüfen, testen wir es an Trainings- und Testproben. Es ist wichtig anzumerken, dass unser Modell in der Lage war, mit den historischen Daten der ersten Maiwoche 2023, die nicht im Trainingssatz enthalten waren, sondern direkt darauf folgten, einen Gewinn zu erzielen.

Prüfmuster (Mai 2023) Testmuster (Mai 2023)

Autor: Dmitriy Gizlyk

 
Hallo. Faza2 kompiliert nicht, bis ich Unsupervised aus einem anderen EA in den Ordner verschoben habe. Vielleicht ist das, warum der Fehler bleibt um 0,18 ?
 

Guten Tag zusammen. Ist es jemandem gelungen, dieses neuronale Netz zu trainieren? Wenn ja, wie haben Sie es gemacht?

Ich habe in Phase 1 Daten für denselben Zeitraum wie der Autor des Artikels gesammelt (4 Monate). Ich erhielt eine bd-Datei von etwa 1,2 GB (190 000 Merkmale). Dann habe ich mit dem Training von Phase 2 begonnen. Phase 2 hat eine Voreinstellung von 100.000 Iterationen. Ich habe Phase 2 mehrere Male durchlaufen lassen. Ich habe auch versucht, 1.000.000 und 10.000.000 Iterationen einzustellen. Bei all diesen Versuchen schwankt der Fehler, den Phase 2 anzeigt, zwischen 1,6 ... 1,8 und geht nicht zurück. Oder er wächst auf 0,3 an (mit anderen bd-Dateien). Wenn Sie Phase 3 (im Testprogramm) ausführen, wird der Handel nicht verwirrt. Es wird nur dummerweise ein Handel eröffnet und gehalten, bis die Testzeit vorbei ist. Ich habe versucht, Phase 3 im Testprogramm im Optimierungsmodus auszuführen. Ich habe 200, 500 und 1000 Durchläufe versucht. Es hat keine Auswirkungen. Das Einzige ist, dass der Expert Advisor ein Geschäft entweder etwas früher oder etwas später eröffnet und es bis zum Ende des Tests hält, wodurch er in seltenen Fällen mit einem kleinen Plus abschließen kann. Aber er schließt das Geschäft nicht selbst ab, sondern der Tester schließt es, weil die Zeit abgelaufen ist. Ich habe auch versucht, den Parameter #define lr 3.0e-4f in der Datei NeuroNet.mqh auf 1.0e-4f oder 2.0e-4f zu ändern, aber auch das funktioniert nicht. Was mache ich falsch?

Kann mir bitte jemand erklären, wie Sie es trainieren? Wenn möglich im Detail.

Bei welchem Fehler gehen Sie zu Phase 3 über?

Wie viele Iterationen führen Sie mit Phase 2 durch?

Was tun Sie, wenn der Fehler in Phase 2 nicht abnimmt?

Bei welcher Anzahl von Iterationen beginnen Sie, etwas zu ändern? Was genau ändern Sie?

Ist es normal, dass der EA in Phase 3 nur einen Handel eröffnet und nicht versucht zu handeln? Ist es sinnvoll, ihn mit Phase 3 im Optimierungsmodus zu trainieren?



 
Victor, ich habe das gleiche Problem wie Sie. Konnten Sie Phase 2 ausführen, ohne den Ordner "Unsupervised" zu verschieben?
 
Ich habe keine Probleme mit der Kompilierung in diesem EA. Alles wird normal kompiliert. Ich habe einfach die Archive aller Artikel in einer Reihe nach oben entladen (mit Ersetzung der Dateien durch neue).