Discusión sobre el artículo "Redes neuronales: así de sencillo (Parte 57): Stochastic Marginal Actor-Critic (SMAC)" - página 2
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Para insertar el código que necesita para aplicar el botón correspondiente
Saludos, Vladimir.
Cada pasada del EA Test genera resultados drásticamente diferentes como si el modelo fuera diferente a todos los anteriores. Es obvio que el modelo evoluciona en cada pasada de Test pero el comportamiento de este EA no es una evolución, ¿qué hay detrás?
He aquí algunas imágenes:
Las transacciones de compra y venta parecen estar insuficientemente controladas en los scripts de Prueba y posiblemente de Investigación. He aquí algunos mensajes:
2024.04.27 13:40:29.423 Core 01 2024.04.22 18:30:00 estado de la cuenta corriente: Saldo: 9892.14, Crédito: 0.00, Comisión: 0.00, Acumulado: 0.00, Activo: 0.00, Pasivo: 0.00, Patrimonio 9892.14, Margen: 0.00, MargenLibre: 9892.14
2024.04.27 13:40:29.423 Core 01 2024.04.22 18:30:00 fallida compra de mercado 0.96 EURUSD.pro sl: 1.06306 tp: 1.08465 [No hay dinero]
A menos que se pretenda sobrepasar el margen, unos simples límites puestos en buy_lot después de la línea 275 y después de la línea 296 puestos en sell_lot eliminarían este comportamiento del script de prueba.
Cada pasada del EA Test genera resultados drásticamente diferentes como si el modelo fuera diferente a todos los anteriores. Es obvio que el modelo evoluciona en cada pasada de Test pero el comportamiento de este EA no es una evolución, ¿qué hay detrás?
He aquí algunas imágenes:
Este modelo utiliza la política estocástica del Actor. Así que al principio del estudio podemos ver tratos aleatorios en cada pase. Recogemos estos pases y reiniciamos el estudio del modelo. Y repetimos este proceso algunas veces. Mientras el Actor encuentra una buena politica de acciones.
Planteemos la pregunta de otro modo. Una vez recogidas las muestras (Investigación) y procesadas (Estudio), ejecutamos el script de prueba. En varias ejecuciones conscutivas, sin ninguna Investigación o Estudio, los resultados obtenidos son completamente diferentes.
El script de prueba carga un modelo entrenado en la subrutina OnInit (línea 99). Aquí alimentamos el EA con un modelo que no debe cambiar durante el procesamiento de la Prueba. Debería ser estable, según tengo entendido. Entonces, los resultados finales no deberían cambiar.
Mientras tanto, no realizamos ningún entrenamiento del modelo. La prueba se limita a recoger más muestras.
La aleatoriedad se observa más bien en el módulo Investigación y posiblemente en el Estudio mientras se optimiza una política.
El Actor es invocado en la línea 240 para calcular los resultados feedforward. Si no se inicializa aleatoriamente en el momento de la creación, creo que este es el caso, no debería comportarse aleatoriamente.
¿Encuentras algún error en el razonamiento anterior?
Planteemos la pregunta de otro modo. Una vez recogidas las muestras (Investigación) y procesadas (Estudio), ejecutamos el script de prueba. En varias ejecuciones conscutivas, sin Investigación ni Estudio, los resultados obtenidos son completamente diferentes.
El script de prueba carga un modelo entrenado en la subrutina OnInit (línea 99). Aquí alimentamos el EA con un modelo que no debe cambiar durante el procesamiento de la Prueba. Debería ser estable, según tengo entendido. Entonces, los resultados finales no deberían cambiar.
Mientras tanto, no realizamos ningún entrenamiento del modelo. La Prueba sólo recoge más muestras.
La aleatoriedad se observa más bien en el módulo Investigación y posiblemente en el Estudio mientras se optimiza una política.
El Actor es invocado en la línea 240 para calcular los resultados feedforward. Si no se inicializa aleatoriamente en el momento de la creación, creo que este es el caso, no debería comportarse aleatoriamente.
¿Encuentras algún error en el razonamiento anterior?
El Actor utiliza una política estocástica. La implementamos mediante VAE.
La capa CNeuronVAEOCL utiliza los datos de la capa anterior como media y STD de la distribución Gaussiana y muestrea la misma acción de esta distribución. Al principio ponemos en el modelo pesos aleatorios. Así se generan medias y STD aleatorias. Al final tenemos acciones aleatorias en cada paso de la prueba del modelo. En el momento del estudio el modelo encontrará algunas medias para cada estado y STD tiende a cero.