Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3005

 
Maxim Dmitrievsky #:
La presencia de una señal constante en los datos implica casi inmediatamente la generalización, y el ruido se convierte en error. Si no hay señal, obtenemos memorización, en la que el error de clasificación es simplemente la superposición de muestras con etiquetas diferentes y los mismos valores de características. El segundo modelo no tiene valor predictivo. Esta es la respuesta a mi pregunta. Y lo confirman las pruebas con datos sintéticos y reales.

En presencia de patrones (wavelets, shaplets, etc.), pero en ausencia de una señal, sólo funcionará la división en entrenable y no entrenable. Lo entrenable se clasifica, lo no entrenable se filtra. Aquí la buena memorización funciona como un filtro, y la generalización como generalización de patrones.

Cuando no hay patrones persistentes pronunciados (como en el mercado), pero sí ineficiencias, el enfoque debe ser aún más refinado, porque las ineficiencias no siempre pueden describirse mediante patrones. Aquí hay que separar lo uno de lo otro: lo que hay que recordar y lo que hay que generalizar. Algorítmicamente.

Transformar los datos cambiará su representación, pero no resolverá el problema en sí mismo, ya que lo que se negocia en última instancia es la serie original.

Las regularidades tienen una probabilidad flotante, que puede ser cíclica o desaparecer por completo. Trabajo con grandes intervalos de tiempo y he observado estos fenómenos.

Diré que es posible entrenar un modelo para 2008-2017 (10 años), que funcionará hasta hoy. Un modelo de este tipo tendrá pocas señales: recordará hasta un 30% como máximo, pero esto también dice que hay pocos patrones para diez años que funcionarían para los dos años siguientes (muestra de prueba).

Pero qué tipo de patrones son éstos - cíclicos o únicos (quizá con un ciclo de decenas de años) - aún no puede establecerse, y por tanto es imposible seleccionar un modelo que siga funcionando.

Lo ideal es encontrar patrones cíclicos con una frecuencia de al menos una vez cada 3 meses, y entonces podemos esperar que el modelo sea capaz de salir del bache.

Un paquete de modelos de este tipo entrenados en diferentes patrones cíclicos reducirá la caída.

Por lo tanto, lo importante es la señal inicial + objetivo + predictores que tengan una regularidad cíclica positiva con respecto al objetivo.


Su enfoque - sacudir y tamizar - es similar al trabajo de un prospector - por supuesto, usted puede encontrar una gran cantidad de interesantes y no se aprende, pero ¿cómo se puede estar seguro de que será estable?

Me gusta descifrar la fecha a mí mismo, y tengo ideas en esta dirección, pero ahora quiero cavar en la dirección de aumentar la probabilidad de estabilidad del modelo.

 
Aleksey Vyazmikin #:

Su enfoque - sacudir y tamizar - es como el trabajo de un prospector - por supuesto, usted puede encontrar una gran cantidad de interesantes y no aprendido, pero ¿cómo estar seguro de que será estable?

Yo mismo como para sacudir la fecha, y tengo ideas en esta dirección, pero ahora quiero cavar en la dirección de aumentar la probabilidad de estabilidad del modelo.

Escribí una comprensión básica sin la cual no vale la pena hacer nada en absoluto. Aunque sólo sea para confirmar cada uno de los puntos (si usted no lo consiguió la primera vez 🙂 )

Para verificar la estabilidad, pruebas, pruebas y más pruebas, nada más. MO es lo más adecuado para eso.

Porque los quejicas teóricos hablan mucho de tsos y demás tonterías, sin entender siquiera lo básico de MO, por lo visto. Este entretenimiento no es para débiles mentales y morales, es más fácil lloriquear :).
 
Maxim Dmitrievsky #:
Escribí una comprensión básica sin la cual no vale la pena hacer nada en absoluto. Aunque sólo sea para confirmar cada punto (si no lo entendiste la primera vez 🙂 )

Para verificar la estabilidad, pruebas, pruebas y más pruebas, nada más. MO es lo más adecuado para eso.

No discuto tus descripciones ni el planteamiento en general, yo mismo lo describí en esencia hace tiempo, aunque con una implementación diferente.

Mis experimentos artificiales han demostrado que a menudo basta con sacar filas con 10 regularidades simples (en mi caso, un segmento cuántico en el que cayó el valor del predictor) para que toda la muestra desplace la probabilidad en un 15-20% hacia uno, reduciendo al mismo tiempo la muestra en un 35%. Esto no se puede conseguir con métodos de aprendizaje automático. En esencia, se trata de la lixiviación de datos inútiles/contradictorios. Pero queremos hacerlo más cerca de la fecha actual, es decir, no conociendo estadísticamente el historial, sino mediante algunos métodos de selección de patrones sólo falsos/contradictorios.

Si establecemos una tarea, según la cual el modelo debe funcionar con cualquier instrumento, entonces es posible realizar pruebas, pero hay aún menos patrones estables de este tipo. Y simplemente correr a través de la historia o, peor aún, tomar sintéticos - no creo que sea eficaz. A lo sumo, es posible hacer sintéticos a partir de incrementos diarios barajando días, pero esto no está disponible para mí todavía. ¿Lo has probado?

 
mytarmailS #:
Estoy completamente fuera de onda, pero me pregunto si un precio puede representarse mediante un gráfico, y si tiene alguna ventaja sobre la representación bidimensional habitual.
¿Quién sabe de esto?

Podría tomar la representación de Mandelbrot del precio como un bosque de árboles ternarios, donde cada movimiento se divide en tres (dos movimientos en la misma dirección y una corrección entre ellos).

La ventaja es el acceso a la recopilación de cualquier estadística sobre la estructura fractal del precio. Las desventajas son la complejidad de los algoritmos y la dificultad de evitar mirar hacia delante.

 
Stanislav Korotky #:

¿Y cómo se relaciona esto con las matrices y ejemplos de plataformas "paralelas" que he dado antes?

Por ejemplo, tomo matrices desde el enlace a keras, llamar a ellos:

y obtengo ceros.

El ejemplo de control no encaja.

La entropía cruzada categórica se usa en modelos de clasificación donde hay más de dos clases. Y después de softmax. Softmax convierte un conjunto de valores en un conjunto de probabilidades cuya suma es 1.

Pruebe con un ejemplo de control como éste

pred: 0.1, 0.1, 0.2, 0.5, 0.1

verdadero: 0, 0, 1, 0, 0, 0

 
Aleksey Vyazmikin #:

A lo sumo, es posible hacer sintéticos los incrementos diarios barajando los días - pero esto no está disponible para mí todavía. ¿Lo ha intentado?

No entiendo en qué se basan tales suposiciones, y esto es de nuevo trabajar con rasgos, no mejorar la forma de aprender. Así que es secundario.

Es como la escuela. Puedes enseñar de un libro de texto y puedes enseñar de otro. La información no cambiará en esencia, igual que con las transformaciones. Pero entrará por una cabeza y saldrá por la otra :)

Es difícil trabajar con sintéticos cuando el objetivo final no está claro. Es mejor utilizarla para probar algunas propiedades de las secuencias, mezclarlas en diferentes partes y ver cómo cambian los resultados. ¿Qué pasaría si...? Para alinear desplazamientos en los datos todavía.
En general, es útil para mejorar la generalizabilidad reduciendo la memorización de los datos originales, pero sigue siendo incompleto en cuanto a la creación de una TS lista. Se puede obtener un resultado similar en los datos originales, al entrenar un conjunto de modelos diferentes, que incluye desde modelos simples hasta lineales.

Bueno, ya sabes la respuesta aproximada: sigue siendo imposible obtener algo magnífico a través de él, pero es posible mejorarlo.

 
Aleksey Nikolayev #:

Podemos tomar la representación de Mandelbrot del precio como un bosque de árboles ternarios, donde cada movimiento se descompone en tres (dos movimientos en la misma dirección y una corrección en medio).

La ventaja es el acceso a la recopilación de cualquier estadística sobre la estructura fractal del precio. Las desventajas son la complejidad de los algoritmos y la dificultad de evitar mirar hacia delante.

¿Puede presentarse en forma de reglas asociativas?
 
mytarmailS #:
¿Puede representarse como reglas asociativas?

No lo he pensado, pero creo que es poco probable, porque el orden de los movimientos es importante en los precios.

Por si acaso, una imagen para ilustrar la idea de Mandelbrot. Cada movimiento del precio, si es posible, se divide en tres movimientos (seleccionando la corrección máxima dentro de él), entonces se convierte en un nodo del árbol. Si no hay ninguna corrección dentro del movimiento (o es inferior a un valor determinado), entonces se convierte en una hoja del árbol.


 
Aleksey Nikolayev #:

porque el orden de los movimientos es importante en los precios.

¿Es una afirmación?
 
mytarmailS #:
¿Es una afirmación?

Cuando se realizan permutaciones arbitrarias de los incrementos, se pierde la estructura del precio y se obtiene una SB. Esto se utiliza, por ejemplo, en Montecarlo, cuando el precio se compara con un gran número de variantes de SB obtenidas a partir de él mediante permutaciones.

Razón de la queja: