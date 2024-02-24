Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2727
¿No lo ha intentado experimentalmente? Al fin y al cabo, según tu planteamiento teórico en esta pregunta, tras un aumento crítico del tamaño de la muestra, los patrones de la muestra llegarán viejos, ya no funcionarán, y por tanto el aprendizaje debería deteriorarse en sentido cualitativo y sobre nuevos datos los resultados serán peores al aumentar la muestra.
Probablemente te des cuenta de que es una tarea computacional completamente inmensa entrenar sobre un gran número de variantes para la longitud de la historia para un gran número de puntos en el tiempo. Incluso si por algún milagro consigues recopilar todas estas estadísticas, entonces se planteará la cuestión de la sistematización significativa de este montón de información. Seguramente alguna longitud diferente de la historia resultará ser óptima para cada momento. ¿Y cómo interpretar esto y, lo que es más importante, cómo extrapolarlo al futuro?
Me gustaría ir en la dirección contraria: idear una heurística para reducir drásticamente el número de variantes para la longitud del historial de entrenamiento (literalmente, hasta unas pocas variantes).
Empiezo sacando sólo trozos de trabajo de los datos nuevos y aplico el filtro como un segundo modelo para que funcione tanto con los datos antiguos como con los nuevos, luego lo compruebo con otros datos nuevos como en el artículo.
También es una especie de ajuste, pero sobre la base de los errores del modelo. Como si seleccionáramos al menos aquellas variantes que es capaz de clasificar bien, por lo que hay algo en ellas además de aleatoriedad (al menos en entrenamiento y validación y alguna otra validación).
Si a priori establecer algo, probablemente tiene sentido tomar cualquier seguimiento de larga duración, que dará al menos un poco de marcado adecuado. Recoger las señales.
Se me ocurrió un nuevo spammer de características y objetivos (parece ser informativo, y así es en comparación con el muestreo aleatorio habitual). Pero hay algunas variantes, no lo he probado todavía.
Tendré que reflexionar sobre ello. Realmente no entiendo cómo traducirlo a mis propias ideas y conceptos.
Tengo que pensar en ello. No entiendo muy bien cómo traducirlo al lenguaje de mis percepciones y conceptos.
Además, cambiar de ticks a barras reduce mucho el poder predictivo.
pero elimina posibles conflictos con los dts).
Además, el cambio de ticks a barras reduce mucho la capacidad de predicción.
pero elimina posibles conflictos con dts :)
Por cierto, esta es también una cuestión práctica importante y teóricamente interesante. Se puede formular como una dependencia del diferencial real entre la oferta y la demanda con respecto al volumen (liquidez, volatilidad), calcular la regresión correspondiente, comparar el mercado de divisas con los instrumentos bursátiles, etc. Otra cosa es que sea interesante sólo para aquellos cuyas ST negocian grandes volúmenes)
El problema del experimento tiene solución, ya he hecho algo parecido.
En ese momento se me ocurrió la idea de que debía indagar hacia métodos de estimación de la comparabilidad de la muestra. Pero no pude ponerlo en práctica - no entendía la fórmula.
El problema del experimento tiene solución, yo he hecho algo parecido.
Técnicamente es bastante solucionable, probablemente. La cuestión es cómo interpretar los resultados de tal experimento.
Entonces se me ocurrió la idea de que deberíamos investigar métodos para evaluar la comparabilidad de una muestra. Pero no pude realizarlo, no entendía la fórmula.
Matstat tiene un montón de pruebas para comprobar la homogeneidad de las muestras, por ejemplo. Si he entendido bien su terminología.
Es un lío tan grande que resulta incomprensible. De dónde sacan esas cotizaciones con volúmenes, qué proveedores utilizan, si existen, y todo eso. Al final, aunque salga bien, prohibirán una TS tan tóxica como todas las demás por principios similares
Creo que fxsaber escribió que los problemas empiezan con algunas grandes rotaciones. Tal vez sus TS hayan sido víctimas de una popularidad demasiado alta entre los copistas)
a la elección de los intervalos de entrenamiento (optimización)
podemos partir del modelo clásico Random-Walk, del que no nos hemos alejado mucho y en el que las desviaciones son ~2*sqrt(T). (dos son los restos de las tendencias)
Es notable en que
(a) es escalable (exactamente las mismas parábolas, las mismas líneas que en la captura de pantalla se mantendrá cuando se cambia a la menor TFs y ticks),
(b) vamos a comparar los resultados directa y directamente con él de todos modos
(c) tiene intervalos característicos. El mismo foco de la misma parábola.
estos son los intervalos en los que hay que orientarse.