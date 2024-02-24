Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3009
Primero hay que darse cuenta de que el modelo está lleno de basura por dentro...
Si descompones un modelo de madera entrenado en las reglas que hay dentro y las estadísticas sobre esas reglas.
como:
y analizar la dependencia del error de la regla err de la frecuencia freq de su ocurrencia en la muestra
obtenemos
Sólo un rayo de sol en la oscuridad de los últimos posts
habrá un artículo al respecto, si lo hay.
Norm, mi último artículo trataba de lo mismo. Pero si tu manera es más rápida, eso es una ventaja.
¿Qué quieres decir con más rápido?
En términos de velocidad.
unos 5-15 segundos en una muestra de 5k
Me refiero a todo el proceso desde el principio hasta obtener el TC.
Tengo 2 modelos siendo reentrenados varias veces, así que no es muy rápido, pero es aceptable.
Y al final no sé qué es exactamente lo que han filtrado.
Entrenar 5k.
Validar 60k.
entrenamiento del modelo - 1-3 segundos
extracción de reglas - 5-10 segundos
comprobación de la validez de cada regla (20-30k reglas) 60k 1-2 minutos
por supuesto, todo es aproximado y depende del número de características y datos
Por desgracia nadie lo encontró, de lo contrario estaría en islas tropicales en lugar de aquí))))
Sí. Incluso 1 árbol o regresión puede encontrar un patrón si está ahí y no cambia.
Es fácil. Puedo desgenerar docenas de conjuntos de datos. Ahora estoy explorando TP=50 y SL=500. Hay una media del 10% de error en el marcado del profesor. Si hay 20%, será un modelo de ciruela.
Así que no es el error de clasificación que es el punto, pero el resultado de sumar todas las ganancias y pérdidas.
Como se puede ver, el modelo superior tiene un error del 9,1%, y se puede ganar algo con un error del 8,3%.
Los gráficos muestran sólo OOS, obtenidos por Walking Forward con reentrenamiento una vez a la semana, un total de 264 reentrenamientos en 5 años.
Es interesante que el modelo funcionara a 0 con un error de clasificación del 9,1%, y 50/500 = 0,1, es decir, el 10% debería ser. Resulta que el 1% se comió el diferencial (mínimo por barra, el real será mayor).
Esa prueba fue con volúmenes reales de CME para EURUSD: volumen acumulado, delta, divergencia y convergencia para 100 barras. Total 400 columnas + 5 más de algún tipo.
Sin cambiar ninguna configuración del modelo, simplemente eliminé 405 columnas con datos de CME (los deltas y zigzags de precios permanecieron) para un total de 115 columnas y obtuve resultados ligeramente mejores. Resulta que los volúmenes a veces se seleccionan en splits, pero resultan ser ruido en OOS. Y el entrenamiento se ralentiza 3,5 veces.
Para comparar, dejé los gráficos con volúmenes arriba y sin volúmenes abajo.
Esperaba que los volúmenes con CME aportaran información adicional/regularidades que mejoraran el aprendizaje. Pero como se puede ver, los modelos sin volúmenes son un poco mejores, aunque los gráficos son muy similares.
Esta ha sido mi 2ª aproximación a CME (lo intenté hace 3 años) y de nuevo sin éxito.
Resulta que todo se tiene en cuenta en el precio.
¿Alguien más ha probado a añadir volúmenes al entrenamiento? ¿Los resultados son los mismos? ¿O les dan mejoras?
¿Has probado con nuestro mercado, parece que es menos eficiente?
O futuros de grano, puede haber algunos ciclos estacionales allí.