Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1330

 
Aleksey Vyazmikin:

Me desconcierta más otra cuestión: por qué los gráficos son muy parecidos en diferentes modelos sobre diferentes muestras, parece que los modelos consiguen captar algún patrón evidente, que aparece con una periodicidad frecuente y sobre diferentes tamaños de muestra (al menos este trozo está constantemente en la ventana), y es este patrón el que explota el modelo.

He llegado a la conclusión de que es muy posible asignar entre el 30% y el 70% de la muestra de todos los datos a un gráfico de validación en busca de patrones interesantes, pero parece que el 30% sigue siendo óptimo.

¿tal vez porque tienes el mismo modelo pero con una semilla diferente? ))

Si el modelo es aleatorio no significa que el valor inicial del generador afecte mucho al resultado.

Los modelos normales apenas cambiarán, es completamente aleatorio. Es sólo una comprobación de solidez.

Todas estas conclusiones se podrían haber sacado sin hacer nada en absoluto, ningún experimento, sino puramente a partir de la teoría.

30\70 son resultados puramente aleatorios. La conclusión de que entre 30 y 70 está asintóticamente cerca de 50. Sólo fue una submuestra.

 
Maxim Dmitrievsky:

¿Tal vez porque tienes el mismo modelo pero con una semilla diferente? ))

Si el modelo es aleatorio, no significa que el valor inicial del generador afecte mucho al resultado.

Los modelos normales apenas cambiarán, es completamente aleatorio. Es sólo una comprobación de solidez.

Todas estas conclusiones se podrían haber sacado sin hacer nada en absoluto, ningún experimento, sino puramente a partir de la teoría.

Si se observa con atención, se puede ver que los resultados financieros de los modelos en una muestra pueden variar mucho: de 5000 a 1500, es decir, de forma significativa, lo que significa que Seed tiene un impacto en los modelos. Supongo que son los modelos seleccionados los que son similares (lo comprobaré), y tienen márgenes de beneficio ligeramente diferentes, pero casi todos los modelos son planos en el centro, lo que es sorprendente, se equivocan en los mismos márgenes (¿anomalía en los nuevos datos?).

No entiendo la afirmación "los modelos normales apenas cambiarán, los totalmente aleatorios sí": la segunda parte de la afirmación se contradice con la primera.

Maxim Dmitrievsky:

30\70 son resultados puramente aleatorios. La conclusión de que entre 30 y 70 está asintóticamente cerca de 50. Es sólo una submuestra.

Esa es la cuestión, aleatoria o no, es decir, depende del contenido de la muestra en este apartado o del volumen de datos en las muestras, esto es lo que tenemos que entender, lo que tiene más influencia.

 
Aleksey Vyazmikin:

Si se observa con atención, se puede ver que los resultados financieros de los modelos en la misma muestra pueden ser muy diferentes: de 5000 a 1500, es decir, de forma significativa, lo que significa que Seed afecta a los modelos. Supongo que son los modelos seleccionados los que son similares (lo comprobaré), y tienen márgenes de beneficio ligeramente diferentes, pero casi todos los modelos son planos en el centro, lo que es sorprendente, se equivocan en los mismos márgenes (¿anomalía en los nuevos datos?).

No entiendo la afirmación "los modelos normales apenas cambiarán, los absolutamente aleatorios sí": la segunda parte de la afirmación se contradice con la primera.

Esa es la cuestión, aleatoria o no, es decir, depende del contenido de la muestra en esa parcela o de la cantidad de datos en las muestras, eso es lo que hay que entender, que tiene más impacto.

Los modelos con poco error, es decir, los modelos cualitativos, no se ven afectados por el cambio de semilla. Si tienes un valor de Azar alrededor de 0,5 obtendrás un montón de modelos diferentes porque te sobrealimentarás por cada estornudo de azar.

 
Maxim Dmitrievsky:

Los modelos con bajo error, es decir, los modelos de calidad, no se ven afectados por los cambios de semillas. Si Random está en torno a 0,5, entonces tendrá muchos modelos diferentes, porque se sobreadapta a cada estornudo de Random

Esto es probablemente cierto para un 99% de precisión, mientras que mi Recall es bajo - 20% para una buena medida, es decir, potencialmente la mayoría de los 1 no se detectan y no hay entradas, por lo que se espera que los diferentes modelos funcionen dentro del rango de 0-100 con una ventana del 20%.

 
Aleksey Vyazmikin:

Esto es probablemente relevante con un 99% de precisión, pero mi Recall es bajo - 20% para una buena medida, es decir, potencialmente la mayoría de los 1 no se detectan y no se hacen entradas, por lo que se espera que los diferentes modelos funcionen entre 0 y 100 con una ventana del 20%.

este no es el camino a seguir, hay que reducir el error global del modelo y no reinventar la rueda

entonces todo tipo de enfoques extraños caerán por sí solos.

He escrito 50 veces - no es necesario reinventar la rueda, este camino no lleva a ninguna parte
 
Maxim Dmitrievsky:

este no es el camino a seguir, hay que reducir el error global del modelo y no reinventar la rueda

entonces todos estos enfoques extraños se caerán por sí solos.

Te lo he dicho 50 veces: no hace falta reinventar la rueda, este camino no lleva a ninguna parte

Estoy escuchando atentamente, ¿qué más se puede utilizar para reducir el error?

Para estos fines, cambio la composición de la muestra, cambio los ajustes de la creación del modelo, ¿qué más puedo hacer?

 

Cualquiera que se pregunte sobre el efecto de las semillas en los modelos - tomó una muestra del 30%, todos los modelos - haga clic en la animación


 
Maxim Dmitrievsky:

este no es el camino a seguir, hay que reducir el error global del modelo y no reinventar la rueda

entonces todo tipo de enfoques extraños caerán por sí solos

Escribí 50 veces - no hay necesidad de reinventar la rueda, este camino no va a ninguna parte.
No estoy de acuerdo. Si los métodos estándar de OI funcionaran en el mercado, todo el mundo ganaría dinero con ellos.
Aleksey Vyazmikin:

Pero hay que inventar bicicletas durante el día. Y dormir por la noche. Salve su salud.
 
Elibrarius:
No estoy de acuerdo. Si los métodos estándar de OI funcionaran en el mercado, todo el mundo ganaría dinero con ellos.
Pero la recuperación de las bicicletas debe hacerse durante el día. Y dormir por la noche. Salve su salud.

El problema no es con los métodos estándar, sino con una falta de comprensión básica de lo que se intenta hacer con ellos y con qué proceso se está trabajando

es decir, la falta de educación económica y matemática.

así que es como una partícula browniana que vaga por ahí... tal vez por aquí o por allá...

Y todo el mundo se niega a leer libros "complicados", especialmente en inglés.

 
Maxim Dmitrievsky:

El problema no estriba en los métodos estándar, sino en un malentendido básico de lo que se intenta hacer con ellos.

un ejemplo de estupidez es la salida en zigzag.

La máquina nuclear de Reshetov es la misma bicicleta que algunos utilizan aquí. Y parece que tiene más éxito en el trato con el mercado que algo estándar.

Así que estoy a favor de las bicicletas. ) Pero, por supuesto, también hay que saber qué hacer con ellos.

Razón de la queja: