Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 269

 

La historia del error de ajuste del modelo cero publicada aquí es de naturaleza puramente alquímica.

1. error de ajuste del modelo = 0. Pues no funciona así, no puede ser. ¿Cómo puede ser? ¿El 1% puede o no puede? ¿Y el 5% puede o no puede tampoco? ¿Cuántos %% necesita para que "pueda"?

2. Dos conceptos: redibujar y mirar hacia adelante. ¿Qué son? Se utilizó una prueba sorprendente: de alguna manera se encontraron indicadores sospechosos, se desecharon y se obtuvo un error de ajuste = 50%. Eso es todo. Probado. Mirando al futuro. Cuál es el objeto de la prueba, cuál es la prueba misma .... Sin comentarios.

¿O quizás el asunto es mucho más profundo y la alquimia no ha permitido entrar en el problema?

El problema lo llamé arriba: los métodos de análisis y los métodos de predicción son diferentes, tienen sus propias especificidades y no se puede simplemente transferir los métodos de análisis a las predicciones - hay que demostrar la admisibilidad de aplicar los métodos de análisis a las predicciones.

En nuestro ejemplo.

Tomamos algunos indicadores (ninguno de ellos realmente importante) y calculamos sus valores para toda la muestra sobre la que vamos a enseñar y probar el modelo. No hay ningún problema para el análisis del pasado. Pero para la predicción este enfoque debe ser probado, porque estamos interesados en la siguiente barra después de la que tenemos. Significa que debemos tomar una ventana y calcular todos los indicadores en ella, y luego ajustar el modelo. Cuando llegue un nuevo bar, debemos repetir este procedimiento de nuevo. Que la historia haya cambiado o no no tiene ningún interés. El modelo debe construirse sobre los valores de la última barra indicadora. Cuando calculamos el indicador para todo el muestreo, entonces es probable que los valores de este indicador NO contengan los valores de la última barra durante el movimiento de la ventana.

Por lo tanto.

Si queremos enseñar modelos EN TIEMPOS, debemos utilizar los valores del indicador que se derivan de los valores de la última barra cuando la ventana se mueve a lo largo de la muestra de entrenamiento.

PS.

Si utiliza este método para un zigzag, entonces, dependiendo del algoritmo del zigzag, obtendrá ceros o motas o líneas que no tienen nada que ver con el zigzag. Y no se habla de redibujar y mirar hacia adelante: no se puede usar, eso es todo.

 
Vladimir Perervenko:

Existe un nuevo y muy prometedor paquete RKEEL de entrada a KEEL.

Buena suerte

¿Puede decir al menos en dos palabras cuál es la promesa del paquete? o tres )

SanSanych Fomenko:

La historia publicada aquí con cero error de ajuste del modelo es de naturaleza puramente alquímica..................

No he entendido ni una palabra :)

 
mytarmailS:

¿Puede decir al menos en dos palabras cuál es la promesa del paquete? O tres )

===========================================================

Explicando:

1. El producto de software "KEEL" permite crear, probar e investigar diferentes clases de modelos para resolver problemas de regresión, agrupación y clasificación sin necesidad de tener un conocimiento profundo del lenguaje R. Es un programa similar a rattl , pero más avanzado.

El programa está construido con "cubos"/módulos listos para usar, rápidos y claros, similares a KNIME, pero más simples. Después de crear el prototipo, el programa terminado se transfiere simplemente a R con el paquete "RKEEL

Esta representación gráfica del programa, formada por módulos, acelera enormemente y facilita su creación, especialmente para los principiantes en programación, que son en su mayoría comerciantes. Existen programas análogos para R - "RedR" y "RAnaliticFlow", pero están mal soportados.

2. Se ofrece un gran número de módulos para el preprocesamiento y la transformación de variables, lo cual es bueno.

3. Se proponen muchos algoritmos originales que no están en R.

La variedad de métodos de extracción de conocimientos a partir de los datos permite resolver las tareas comerciales con mayor flexibilidad.

Buena suerte

 
Vladimir Perervenko:
Gracias
 
mytarmailS:

¿Qué has dicho? No lo entiendo :)

Tienes que escribir los últimos valores

for(i in ...)
{

    X29_1 <- TrendDetectionSMA(D[i:i+windows,])

    X29[i+windows] <- X29_1[windows]
}

Como resultado, X29 consistirá en . Los valores del penúltimo no se corregirán para redibujar los indicadores.

 
SanSanych Fomenko:

Si queremos aprender modelos EN TIEMPOS, debemos utilizar los valores de los indicadores obtenidos de la última barra mientras se mueve la ventana a lo largo de la muestra de entrenamiento.

Lo hice yo mismo, mira el código que adjunté hace un par de páginas y su descripción.

El problema es que esos 6 indicadores dan resultados NA para la última barra. Y luego, al analizar las barras posteriores - cambiar este valor de NA por otro, el resultado de las barras anteriores se cambia de acuerdo con los nuevos datos (en el lenguaje común - "re-flipping").
Como resultado, enseñamos el modelo usando los mismos resultados, pero cuando queremos recibir una previsión con nuevos datos - estos indicadores nos dirán NA en lugar de los valores necesarios, lo cual es inaceptable.

Si quieres analizar estos indicadores, aquí tienes el archivo rdata, con los valores de los indicadores obtenidos en la ventana deslizante. Los valores de esos seis indicadores de redibujado se toman no para la última barra sino para la penúltima para tener algo en lugar de NA.

Archivos adjuntos:
 
Dr.Trader:

Lo hice yo mismo, mira el código que adjunté hace un par de páginas y su descripción.

El problema es que esos 6 indicadores dan resultado NA en la última barra. Y luego, al analizar las barras posteriores, cambiar este valor NA por otro, se produce el cambio del resultado de las barras anteriores de acuerdo con los nuevos datos (en el lenguaje común - "re-flipping").
El resultado será que enseñamos el modelo usando los mismos resultados redibujados y cuando queramos hacer una previsión con nuevos datos esos indicadores nos dirán NA en lugar de los valores necesarios, lo cual es inaceptable.

Si quieres analizar estos indicadores, aquí tienes el archivo rdata, con los valores de los indicadores obtenidos en la ventana deslizante. Los valores de esos seis indicadores se tomaron no para la última barra, sino para la penúltima, para que hubiera algo en lugar de NA.

Así que no lo entendemos: no necesitamos entrar en él. Recuerda el último compás. Si es NA, entonces no hay valor nunca. Por cierto, ese es exactamente el valor de ZZ en la última barra.
 
Una revisión del Aprendizaje Profundo en R se encontró con
 
SanSanych Fomenko:
Encontré una reseña sobre Deep Learning en R

Un artículo superficial con muchas inexactitudes. Evidentemente, escrito por los estudiantes como un trabajo trimestral.

Quería escribir un comentario, pero no he encontrado dónde hacerlo.

Está bien como revisión popular, pero no como guía.

Buena suerte

 

¿por qué todo el mundo está tan obsesionado con los modelos? ¿por qué nadie habla de los signos? ¿por qué nadie habla de la no estacionalidad? ¿Por qué nadie intenta resolver estos problemas? ¿Por qué nadie piensa en lo que impulsa los precios?

Si se utiliza un estocástico, no importa el modelo que se utilice, ya sea un KNN habitual o la red profunda más sofisticada,la precisión será del 51-53%, independientemente de su profundidad. ¿De qué sirven estos modelos si la información es una porquería? No, pero el 95% de la atención va a los modelos, para mí personalmente los modelos son la última etapa del sistema, y es sólo el 2% del trabajo

Mientras tanto, compartiré mis resultados...

Mi algoritmo extremo ....

Hasta ahora, no hay MO en el sentido clásico en absoluto, pero el reconocimiento está presente.

El sistema de toma de decisiones es semiautomático.

en la primera etapa, el algoritmo reconoce algunas formaciones y me las da

En la segunda etapa evalúo con mis ojos lo que ha calculado y tomo una decisión comercial. Aunque evalúa muy fácilmente y sin ambigüedades, todavía no puedo transferir la segunda etapa al modo automático de reconocimiento, por lo que en esencia el sistema es semimanual

El sistema es intradía, el comercio es en 5M marco de tiempo, un día hay cerca de 20 operaciones en promedio, en 15 días de negociación fue sólo dos días con una pequeña pérdida

En el gráfico de rentabilidad rojo es el mismo negro pero teniendo en cuenta la comisión

й

también transfirió las operaciones a un software de análisis tecnológico para una comprensión más flexible y profunda

р

Y añadiré más sobre la no estacionariedad, miren este pico salvaje de volatilidad, que marqué con una flecha hace unos días, les digo con confianza que todos los sistemas que operaron en parámetros fijos, todos fueron aplastados, de hecho toda esta volatilidad es su stop loss, pero divago de esto ....

Así que lo que quiero decir es que para reaccionar más o menos adecuadamente a los movimientos del mercado el sistema de toma de decisiones debería corregirse constantemente en sus parámetros adecuadamente al mercado(lo que dije una vez sobre Fourier) o el sistema debería ser generalmente no paramétrico, de lo contrario no sé cómo ((

Y ninguna rejilla ayudará por muy profunda que sea si se usa estocástica

л

Buena suerte

Razón de la queja: