Discusión sobre el artículo "Redes neuronales: así de sencillo (Parte 52): Exploración con optimismo y corrección de la distribución"

 

Artículo publicado Redes neuronales: así de sencillo (Parte 52): Exploración con optimismo y corrección de la distribución:

A medida que el modelo se entrena con el búfer de reproducción de experiencias, la política actual del Actor se aleja cada vez más de los ejemplos almacenados, lo cual reduce la eficacia del entrenamiento del modelo en general. En este artículo, analizaremos un algoritmo para mejorar la eficiencia del uso de las muestras en los algoritmos de aprendizaje por refuerzo.

Pero a nosotros, como siempre, nos interesa mucho más el rendimiento del modelo con los nuevos datos. La capacidad de generalización y el rendimiento del modelo con datos desconocidos se han probado en un simulador de estrategias con datos históricos para junio de 2023. Como podemos ver, el periodo de prueba sigue inmediatamente a la muestra de entrenamiento. Esto garantiza la máxima homogeneidad de las muestras de entrenamiento y de prueba. Ahora le presentamos los resultados de las pruebas.

Resultados de las pruebas

El gráfico presentado muestra una zona de descenso en los primeros diez días del mes. Sin embargo, le sigue un periodo de rentabilidad que dura hasta finales de mes. Como resultado, el asesor ha obtenido un beneficio del 7,7% en el mes, con una reducción máxima de la equidad del 5,46%. La reducción del balance ha sido aún menor y no ha superado el 4,87%.

Resultados de las pruebas

La tabla de resultados muestra que durante las pruebas el asesor ha realizado operaciones comerciales multidireccionales. En total se han abierto 48 posiciones. Y el 54,17% de ellas se han cerrado con beneficios. En ese caso, la operación rentable máxima ha sido más de 3 veces superior a la operación perdedora máxima. Y la media de las operaciones rentables ha sido casi la mitad de la media de las operaciones perdedoras. En términos cuantitativos, de media, hay 2 operaciones perdedoras por cada 3 operaciones rentables. Todo ello ha proporcionado un factor de beneficio de 1,74 y un factor de recuperación de 1,41.

Autor: Dmitriy Gizlyk

 
Dmitry hola. ¿Por qué cuando la formación de este Asesor Experto Study.mq5, el error de las críticas no se muestra y es -nan(ind). En el registro también escribe al final del estudio.
 
Viktor Kudriavtsev #:
Dmitry hola. ¿Por qué cuando la formación de este Asesor Experto Study.mq5, el error de la crítica no se muestra y es -nan(ind). También escribe en el log al final del estudio.

Tengo el error contado. ¿Tomaste el Expert Advisor del artículo o modificaste el tuyo propio?

 

Acabo de descargar el archivo del artículo y descomprimido todo sobre los artículos anteriores con la sustitución de archivos.

 
Ahora he probado a borrar todos sus archivos antiguos de la carpeta MQL5/Experts y los he copiado en una carpeta vacía sin reemplazarlos. Sigue sin calcular el error, dice -nan(int).
 
Hola. Tengo la misma historia. Archivo desempaquetado, nan(int). En la carpeta de datos comunes el archivo SoftAC_DICE.set parece estar vacío (16 bytes).
 
star-ik #:
En la carpeta de datos compartidos el archivo SoftAC_DICE.set parece estar vacío (16 bytes).

Esto es normal. Sólo 4 variables de tipo float están guardadas allí

 
¿Qué ocurre con el indicador de error? ¿Realmente no lo calcula o simplemente no lo emite? Aunque esto no sea tan importante, ¿se está produciendo el proceso de aprendizaje? Según los resultados de las pruebas, no.
 
Las flechas están en casi todas las barras, lo que no debería ser el caso por la propia lógica del mercado.
Archivos adjuntos:
 

Ejecuté el entrenamiento a través de la tarjeta de vídeo y obtuve -nan en lugar de errores. Intenté ejecutarlo a través del procesador y los errores se mostraron normalmente. Si alguien ha descubierto cómo solucionar este error (a través de la tarjeta de vídeo), por favor comparta sus ideas.

 
star-ik #:
¿Qué ocurre con el indicador de error? ¿Realmente no lo calcula o simplemente no lo emite? Aunque esto no sea tan importante, ¿se está produciendo el proceso de aprendizaje? A juzgar por los resultados de la prueba, no.

Me di cuenta de un error tipográfico en el código del Asesor Experto Study.mq5.

Debería ser