Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3009

 
mytarmailS #:

Primero hay que darse cuenta de que el modelo está lleno de basura por dentro...

Si descompones un modelo de madera entrenado en las reglas que hay dentro y las estadísticas sobre esas reglas.

como:

y analizar la dependencia del error de la regla err de la frecuencia freq de su ocurrencia en la muestra

obtenemos

Sólo un rayo de sol en la oscuridad de los últimos posts
Si analizamos correctamente los errores del modelo, podemos encontrar algo interesante. Aceptaremos muy rápidamente y sin gpu, sms y registros.
 
Maxim Dmitrievsky #:
Sólo un rayo de sol en la oscuridad de los últimos posts
Si analizas bien los errores del modelo, puedes encontrar algo interesante. Vamos a aceptar muy rápidamente y sin gpu, sms y registros.

habrá un artículo al respecto, si lo hay.

 
mytarmailS #:

habrá un artículo sobre ello, si es que lo hay.

Norm, mi último artículo era sobre lo mismo. Pero si tu manera es más rápida, eso es una ventaja.
 
Maxim Dmitrievsky #:
Norm, mi último artículo trataba de lo mismo. Pero si tu manera es más rápida, eso es una ventaja.

¿Qué quieres decir con más rápido?

 
mytarmailS #:

¿Qué quieres decir con más rápido?

En términos de velocidad.
 
Maxim Dmitrievsky #:
En términos de velocidad.

unos 5-15 segundos en una muestra de 5k

 
mytarmailS #:

unos 5-15 segundos en una muestra de 5k.

Me refiero a todo el proceso desde el principio hasta obtener el TC.

Tengo 2 modelos siendo reentrenados varias veces, así que no es muy rápido, pero es aceptable.

Y al final no sé qué es exactamente lo que han filtrado.

 
Maxim Dmitrievsky #:

Es decir, todo el proceso desde el principio hasta conseguir el TC.

Tengo 2 modelos que se reentrenan varias veces, así que no es muy rápido, pero aceptable.

y al final, no sé qué es exactamente lo que han filtrado.

Entrenar 5k.

Validar 60k.


entrenamiento del modelo - 1-3 segundos

extracción de reglas - 5-10 segundos

comprobación de la validez de cada regla (20-30k reglas) 60k 1-2 minutos


por supuesto, todo es aproximado y depende del número de características y datos

 
Forester #:

Por desgracia nadie lo encontró, de lo contrario estaría en islas tropicales en lugar de aquí))))

Sí. Incluso 1 árbol o regresión puede encontrar un patrón si está ahí y no cambia.

Es fácil. Puedo desgenerar docenas de conjuntos de datos. Ahora estoy explorando TP=50 y SL=500. Hay una media del 10% de error en el marcado del profesor. Si hay 20%, será un modelo de ciruela.
Así que no es el error de clasificación que es el punto, pero el resultado de sumar todas las ganancias y pérdidas.

Como se puede ver, el modelo superior tiene un error del 9,1%, y se puede ganar algo con un error del 8,3%.
Los gráficos muestran sólo OOS, obtenidos por Walking Forward con reentrenamiento una vez a la semana, un total de 264 reentrenamientos en 5 años.
Es interesante que el modelo funcionara a 0 con un error de clasificación del 9,1%, y 50/500 = 0,1, es decir, el 10% debería ser. Resulta que el 1% se comió el diferencial (mínimo por barra, el real será mayor).

Esa prueba fue con volúmenes reales de CME para EURUSD: volumen acumulado, delta, divergencia y convergencia para 100 barras. Total 400 columnas + 5 más de algún tipo.
Sin cambiar ninguna configuración del modelo, simplemente eliminé 405 columnas con datos de CME (los deltas y zigzags de precios permanecieron) para un total de 115 columnas y obtuve resultados ligeramente mejores. Resulta que los volúmenes a veces se seleccionan en splits, pero resultan ser ruido en OOS. Y el entrenamiento se ralentiza 3,5 veces.

Para comparar, dejé los gráficos con volúmenes arriba y sin volúmenes abajo.

Esperaba que los volúmenes con CME aportaran información adicional/regularidades que mejoraran el aprendizaje. Pero como se puede ver, los modelos sin volúmenes son un poco mejores, aunque los gráficos son muy similares.
Esta ha sido mi 2ª aproximación a CME (lo intenté hace 3 años) y de nuevo sin éxito.
Resulta que todo se tiene en cuenta en el precio.

¿Alguien más ha probado a añadir volúmenes al entrenamiento? ¿Los resultados son los mismos? ¿O les dan mejoras?

 
Forester #:

Esa prueba fue con volúmenes reales de CME para EURUSD: volumen acumulado, delta, divergencia y convergencia por 100 barras. Total 400 columnas + 5 más de algún tipo.
Sin cambiar ninguna configuración del modelo, simplemente eliminé 405 columnas con datos de CME (los deltas y zigzags de precios permanecieron) para un total de 115 columnas y obtuve resultados ligeramente mejores. Resulta que los volúmenes a veces se seleccionan en splits, pero resultan ser ruido en OOS. Y el entrenamiento se ralentiza 3,5 veces.

Para comparar, dejé los gráficos con volúmenes arriba y sin volúmenes abajo.

Esperaba que los volúmenes con CME aportaran información adicional/regularidades que mejoraran el aprendizaje. Pero como se puede ver, los modelos sin volúmenes son un poco mejores, a pesar de que los gráficos son muy similares.
Esta ha sido mi 2ª aproximación a CME (lo intenté hace 3 años) y de nuevo sin éxito.
Resulta que todo se tiene en cuenta en el precio.

¿Alguien más ha probado a añadir volúmenes al entrenamiento? ¿Los resultados son los mismos? ¿O les dan mejoras?

¿Has probado con nuestro mercado, parece que es menos eficiente?

O futuros de grano, puede haber algunos ciclos estacionales allí.

Razón de la queja: