Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 40): Verwendung von Go-Explore bei großen Datenmengen"

Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Neuer Artikel Neuronale Netze leicht gemacht (Teil 40): Verwendung von Go-Explore bei großen Datenmengen :
In diesem Artikel wird die Verwendung des Go-Explore-Algorithmus über einen langen Trainingszeitraum erörtert, da die Strategie der zufälligen Aktionsauswahl mit zunehmender Trainingszeit möglicherweise nicht zu einem profitablen Durchgang führt.
Mit zunehmender Trainingszeit des Go-Explore-Algorithmus treten gewisse Schwierigkeiten auf. Einige von ihnen sind:
Fluch der Dimensionalität: Mit zunehmender Trainingszeit steigt die Anzahl der Zustände, die ein Agent besuchen kann, exponentiell an, sodass es schwieriger wird, die optimale Strategie zu finden.
Umweltveränderungen: Mit zunehmender Dauer des Trainings können Veränderungen in der Umgebung auftreten, die sich auf die Lernergebnisse des Agenten auswirken können. Dies kann dazu führen, dass eine zuvor erfolgreiche Strategie unwirksam oder sogar unmöglich wird.
Schwierigkeiten bei der Auswahl von Aktionen: Mit zunehmender Dauer des Trainings muss der Agent möglicherweise den breiteren Kontext der Aufgabe berücksichtigen, um fundierte Entscheidungen zu treffen. Dies kann die Auswahl der optimalen Aktion erschweren und komplexere Methoden zur Optimierung des Algorithmus erfordern.
Erhöhte Ausbildungszeit: Mit zunehmender Trainingsdauer steigt auch der Zeitaufwand für die Sammlung ausreichender Daten und das Training des Modells. Dies kann die Effizienz und Geschwindigkeit der Agentenschulung verringern.
Mit zunehmender Trainingsdauer kann sich das Problem ergeben, dass die Dimension des zu untersuchenden Zustandsraums zunimmt. Dies kann zu dem Problem des „Fluches der Dimensionalität“ führen, bei dem die Anzahl der möglichen Zustände mit zunehmender Dimensionalität exponentiell ansteigt. Dies macht die Erkundung des Zustandsraums schwierig und kann dazu führen, dass der Algorithmus zu viel Zeit mit der Erkundung irrelevanter Zustände verbringt.
Um die Qualität und Effizienz des trainierten Modells zu überprüfen, testen wir es an Trainings- und Testproben. Es ist wichtig anzumerken, dass unser Modell in der Lage war, mit den historischen Daten der ersten Maiwoche 2023, die nicht im Trainingssatz enthalten waren, sondern direkt darauf folgten, einen Gewinn zu erzielen.
Autor: Dmitriy Gizlyk