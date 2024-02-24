Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3005
La presencia de una señal constante en los datos implica casi inmediatamente la generalización, y el ruido se convierte en error. Si no hay señal, obtenemos memorización, en la que el error de clasificación es simplemente la superposición de muestras con etiquetas diferentes y los mismos valores de características. El segundo modelo no tiene valor predictivo. Esta es la respuesta a mi pregunta. Y lo confirman las pruebas con datos sintéticos y reales.
Las regularidades tienen una probabilidad flotante, que puede ser cíclica o desaparecer por completo. Trabajo con grandes intervalos de tiempo y he observado estos fenómenos.
Diré que es posible entrenar un modelo para 2008-2017 (10 años), que funcionará hasta hoy. Un modelo de este tipo tendrá pocas señales: recordará hasta un 30% como máximo, pero esto también dice que hay pocos patrones para diez años que funcionarían para los dos años siguientes (muestra de prueba).
Pero qué tipo de patrones son éstos - cíclicos o únicos (quizá con un ciclo de decenas de años) - aún no puede establecerse, y por tanto es imposible seleccionar un modelo que siga funcionando.
Lo ideal es encontrar patrones cíclicos con una frecuencia de al menos una vez cada 3 meses, y entonces podemos esperar que el modelo sea capaz de salir del bache.
Un paquete de modelos de este tipo entrenados en diferentes patrones cíclicos reducirá la caída.
Por lo tanto, lo importante es la señal inicial + objetivo + predictores que tengan una regularidad cíclica positiva con respecto al objetivo.
Su enfoque - sacudir y tamizar - es similar al trabajo de un prospector - por supuesto, usted puede encontrar una gran cantidad de interesantes y no se aprende, pero ¿cómo se puede estar seguro de que será estable?
Me gusta descifrar la fecha a mí mismo, y tengo ideas en esta dirección, pero ahora quiero cavar en la dirección de aumentar la probabilidad de estabilidad del modelo.
Escribí una comprensión básica sin la cual no vale la pena hacer nada en absoluto. Aunque sólo sea para confirmar cada punto (si no lo entendiste la primera vez 🙂 )
No discuto tus descripciones ni el planteamiento en general, yo mismo lo describí en esencia hace tiempo, aunque con una implementación diferente.
Mis experimentos artificiales han demostrado que a menudo basta con sacar filas con 10 regularidades simples (en mi caso, un segmento cuántico en el que cayó el valor del predictor) para que toda la muestra desplace la probabilidad en un 15-20% hacia uno, reduciendo al mismo tiempo la muestra en un 35%. Esto no se puede conseguir con métodos de aprendizaje automático. En esencia, se trata de la lixiviación de datos inútiles/contradictorios. Pero queremos hacerlo más cerca de la fecha actual, es decir, no conociendo estadísticamente el historial, sino mediante algunos métodos de selección de patrones sólo falsos/contradictorios.
Si establecemos una tarea, según la cual el modelo debe funcionar con cualquier instrumento, entonces es posible realizar pruebas, pero hay aún menos patrones estables de este tipo. Y simplemente correr a través de la historia o, peor aún, tomar sintéticos - no creo que sea eficaz. A lo sumo, es posible hacer sintéticos a partir de incrementos diarios barajando días, pero esto no está disponible para mí todavía. ¿Lo has probado?
Estoy completamente fuera de onda, pero me pregunto si un precio puede representarse mediante un gráfico, y si tiene alguna ventaja sobre la representación bidimensional habitual.
Podría tomar la representación de Mandelbrot del precio como un bosque de árboles ternarios, donde cada movimiento se divide en tres (dos movimientos en la misma dirección y una corrección entre ellos).
La ventaja es el acceso a la recopilación de cualquier estadística sobre la estructura fractal del precio. Las desventajas son la complejidad de los algoritmos y la dificultad de evitar mirar hacia delante.
¿Y cómo se relaciona esto con las matrices y ejemplos de plataformas "paralelas" que he dado antes?
Por ejemplo, tomo matrices desde el enlace a keras, llamar a ellos:
y obtengo ceros.
El ejemplo de control no encaja.
La entropía cruzada categórica se usa en modelos de clasificación donde hay más de dos clases. Y después de softmax. Softmax convierte un conjunto de valores en un conjunto de probabilidades cuya suma es 1.
Pruebe con un ejemplo de control como éste
pred: 0.1, 0.1, 0.2, 0.5, 0.1
verdadero: 0, 0, 1, 0, 0, 0
¿Puede representarse como reglas asociativas?
No lo he pensado, pero creo que es poco probable, porque el orden de los movimientos es importante en los precios.
Por si acaso, una imagen para ilustrar la idea de Mandelbrot. Cada movimiento del precio, si es posible, se divide en tres movimientos (seleccionando la corrección máxima dentro de él), entonces se convierte en un nodo del árbol. Si no hay ninguna corrección dentro del movimiento (o es inferior a un valor determinado), entonces se convierte en una hoja del árbol.
porque el orden de los movimientos es importante en los precios.
Cuando se realizan permutaciones arbitrarias de los incrementos, se pierde la estructura del precio y se obtiene una SB. Esto se utiliza, por ejemplo, en Montecarlo, cuando el precio se compara con un gran número de variantes de SB obtenidas a partir de él mediante permutaciones.