¿Qué alimentar a la entrada de la red neuronal? Tus ideas... - página 29

 
He probado todas las arquitecturas MLP y RNN
Hasta 5 capas, hasta 20 neuronas por capa. El optimizador MT5 no permite más

El resultado es curioso: cuantas más capas - peor. Cuantas más neuronas - peor.

Record: 1 entrada, 1 capa, 1 neurona - resultó ser el mejor.

No lo entiendo en absoluto.

Es decir, 1 entrada es suficiente para que incluso 1 neurona, multiplicando sólo 1 peso por esa entrada, mantenga una operación estable durante el mayor tiempo.

Bueno, como estable: lo mejor de lo peor, es decir - los conjuntos con forward estable aparecen incluso en las primeras líneas del optimizador.

Al parecer, tenemos que cavar en este lugar: localmente dentro de un pequeño pero acogedor "caja de gato"
 
Ivan Butko #:
He probado todas las arquitecturas MLP y RNN
Hasta 5 capas, hasta 20 neuronas por capa.
El optimizador MT5 no permite más

El resultado es curioso: cuantas más capas - peor. Cuantas más neuronas, peor.

El récord: 1 entrada, 1 capa, 1 neurona - resultó ser el mejor.

No lo entiendo en absoluto.

Es decir, 1 entrada es suficiente para que incluso 1 neurona, multiplicando sólo 1 peso por esa entrada, mantenga una operación estable durante el mayor tiempo.

Cómo de estable: lo mejor de lo peor, es decir, los conjuntos con avance estable aparecen incluso en las primeras líneas del optimizador.

Aparentemente, tenemos que cavar en este lugar: localmente dentro de una pequeña pero acogedora "caja de gatos"

El factor principal es el número de variables

[Eliminado]  
Ivan Butko #

No lo entiendo en absoluto.

Compensación sesgo-varianza, fundamentos de ML.
 
Maxim Dmitrievsky #:
Compensación sesgo-varianza, fundamentos de ML.

Probé lo contrario: reentrené al extremo, casi punto a punto, para que drenara constantemente en el forward, y luego di la vuelta a las posiciones. Sí, el drenaje se detuvo, pero se convirtió en un piso debido a la propagación de un gran número de operaciones. Un fallo compensa otro.

[Eliminado]  
Ivan Butko #:

Lo probé al revés: lo reentrené hasta el extremo, casi punto a punto, para que drenara constantemente en el avance, y luego le di la vuelta a las posiciones. Sí, el drenaje se detuvo, pero se convirtió en un piso debido a la propagación de un gran número de operaciones. Un fallo compensa otro.

Así es como lo hacen. Primero, se entrena una gran red, luego se descartan capas y neuronas hasta llegar a algún óptimo, minimizando el sesgo en los nuevos datos. Paralelamente, aumenta la varianza (dispersión del error) en los datos de entrenamiento. Si nada funciona, el problema está en los datos.

Es decir, que sea decente en los datos de entrenamiento y aceptable en los datos de prueba. Compromiso. Si no te gusta el resultado, tienes que cambiar los datos. Y así una y otra vez, hasta el final de la zanahoria.
[Eliminado]  
Pruebe la volatilidad (indicador std). Será mejor en los nuevos datos, porque siempre es más o menos el mismo, dependiendo del tiempo. Sólo habrá una diferencia si en los nuevos datos con la misma volatilidad el mercado se mueve en una dirección diferente en promedio. Entonces también se puede añadir un filtro de tiempo para encontrar cuando es el mismo.
 
Maxim Dmitrievsky #:
Pruebe la volatilidad (indicador std). Será mejor en los nuevos datos, porque siempre es más o menos el mismo. Sólo habrá una diferencia si en los nuevos datos con la misma volatilidad el mercado se mueve en una dirección diferente.




Gracias por el consejo. tuve una idea para normalizar los datos (cortar la cola) a un decimal .0; Mol, para crear estacionariedad, porque reacciona a estos pequeños números y debido a ellos estúpidamente recuerda la "trayectoria" del precio como si fuera un número pequeño.

[Eliminado]  
Ivan Butko #:




Gracias por el consejo. Tuve una idea para normalizar los datos (cortar la cola) a un decimal .0; Para crear estacionariedad, porque reacciona a estos pequeños números y debido a ellos estúpidamente recuerda el "camino" del precio como si fuera el mismo.

No va a ahorrar mucho, al igual que se puede añadir ruido aleatorio a las características. Será un poco mejor en algunos casos, porque estará menos reentrenado, pero no es una panacea en absoluto.
[Eliminado]  
Si piensa con lógica, necesita algún tipo de indicador de tendencia a largo plazo y volatilidad. La tendencia muestra en qué dirección se abren las operaciones, y la volatilidad especifica los momentos. No se puede pensar en otra cosa fuera de los indicadores.

Y es necesario incluir diferentes tendencias en el entrenamiento para que aprenda a distinguirlas.
 

Puedes introducir lo que quieras:

hora del día, día de la semana, fases lunares, etc. etc.

Una red normal clasificará por sí misma los datos necesarios y los innecesarios.

Lo principal es ¡qué enseñar!

El aprendizaje con un profesor no encaja aquí. Las redes con propagación de errores hacia atrás son sencillamente inútiles.