Discusión sobre el artículo "Redes neuronales: así de sencillo (Parte 45): Entrenando habilidades de exploración de estados"

Dmitriy Gizlyk 2023.06.18 21:02 #11

Oleg Pavlenko #:

Se han borrado todos los registros de los probadores y se ha ejecutado la optimización de Investigación para los 4 primeros meses de 2023 en EURUSD H1.

Lo ejecuté en ticks reales:

Resultado: 4 muestras en total, 2 en positivo y 2 en negativo:

¿Quizás estoy haciendo algo mal, optimizando los parámetros equivocados o algo mal con mi terminal? No me queda claro... Estoy intentando repetir tus resultados como en el artículo...

Los errores empiezan desde el principio.

El conjunto y el resultado de la optimización, así como los registros del agente y del probador se adjuntan en el archivo Research.zip

1. He puesto optimización completa, no optimización rápida. Esto permite una enumeración completa de los parámetros dados. Y, en consecuencia, habrá más pasadas.
2. El hecho de que haya pasadas rentables y no rentables al lanzar Research es normal. En la primera pasada, la red neuronal se inicializa con parámetros aleatorios. El ajuste del modelo se realiza durante el entrenamiento.

Preguntas de los principiantes Aprendizaje automático en el Librerías: BestInterval

Viktor Kudriavtsev 2023.06.19 10:39 #12

Dmitriy Gizlyk #:

El problema es que ejecutas "tester.ex5", que comprueba la calidad de los modelos entrenados, y aún no los tienes. Primero tienes que ejecutar Research.mq5 para crear una base de datos de ejemplos. Después StudyModel.mq5, que entrenará el autoencoder. El actor se entrena en StudyActor.mq5 o StudyActor2.mq5 (función de recompensa diferente. Y sólo entonces funcionará tester.ex5. Tenga en cuenta que en los parámetros de este último debe especificar el modelo de actor Act o Act2. Depende del Asesor Experto utilizado para estudiar Actor.

¡Dmitry buen día!

¿Me puede decir cómo entender que el progreso de la formación va en absoluto? ¿Importan los porcentajes de error en el aprendizaje por refuerzo o se fijan en el resultado comercial real de la red?

¿Cuántos ciclosestudiaste (StudyModel.mq5 -> StudyActor2.mq5 ) hasta que obtuviste un resultado adecuado?

En el artículo indicas que inicialmente recogiste una base de 50 ejecuciones. ¿Hiciste recopilaciones adicionales en el proceso de entrenamiento? ¿Completaste la base inicial o la eliminaste y volviste a crear en el proceso de entrenamiento?

¿Utiliza siempre 100.000 iteraciones en cada pasada o cambia el número de pasada en pasada? ¿De qué depende?

Le di una lección a la red durante 3 días, hice unos 40-50 ciclos. El resultado es como la captura de pantalla. A veces sólo da una línea recta (no abre o cierra operaciones). A veces se abre una gran cantidad de operaciones y no los cierra. Sólo cambia la equidad. He probado diferentes ejemplos de base. Traté de crear 50 ejemplos y luego hacer bucles. Intenté crear 96 ejemplos y añadir otros 96 ejemplos cada 10 ciclos, y así hasta 500. El resultado es el mismo. El resultado es el mismo. ¿Cómo lo aprendo? ¿Qué estoy haciendo mal?

Discusión sobre el artículo Discusión sobre el artículo Discusión sobre el artículo

Oleg Pavlenko 2023.06.21 08:30 #13

Viktor Kudriavtsev #:

Buenas tardes, Dimitri.

¿Puedes decirme cómo entender que el progreso del entrenamiento va en absoluto? ¿Importan los porcentajes de error en el aprendizaje por refuerzo o se fijan en el resultado real de negociación de la red?

¿Cuántos ciclosestudiaste (StudyModel.mq5 -> StudyActor2.mq5 ) hasta obtener un resultado adecuado?

En el artículo indicas que inicialmente recogiste una base de 50 ejecuciones. ¿Hiciste recopilaciones adicionales en el proceso de entrenamiento? ¿Completaste la base inicial o la eliminaste y volviste a crear en el proceso de entrenamiento?

¿Utiliza siempre 100.000 iteraciones en cada pasada o cambia el número de pasada en pasada? ¿De qué depende?

Le di una lección a la red durante 3 días, hice unos 40-50 ciclos. El resultado es como la captura de pantalla. A veces sólo da una línea recta (no abre o cierra operaciones). A veces se abre una gran cantidad de operaciones y no los cierra. Sólo cambia la equidad. He probado diferentes ejemplos de base. Traté de crear 50 ejemplos y luego hacer bucles. Intenté crear 96 ejemplos y añadir otros 96 ejemplos cada 10 ciclos, y así hasta 500. El resultado es el mismo. El resultado es el mismo. ¿Cómo lo enseño? ¿Qué estoy haciendo mal?

Lo mismo...

Pasé unos días, pero el resultado es el mismo.

No está claro cómo enseñarlo...

No he logrado obtener el resultado como en el artículo....

Discusión sobre el artículo "Redes neuronales: así de sencillo (Parte 45): Entrenando habilidades de exploración de estados" - página 2