Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 388

 
Maxim Dmitrievsky:


Ya tengo predictores, por extraño que parezca. Tengo un bot listo, que construí en menos de un mes. Lo más importante - los predictores, eso está fuera de discusión, sí. Bueno, eso es quién tiene experiencia en qué... Por ejemplo, con mi inflamada imaginación los pronósticos se recogen en un santiamén, yo trabajo como analista desde hace 5 años :) En mi opinión, la selección de predictores no es una tarea tan difícil como el estudio de las arquitecturas de las SN, lo principal es sentarse y seleccionar, tarda 2-3 semanas :)



¿Y en números?

En la muestra de entrenamiento, la muestra de prueba y la muestra de validación.

Y lo que es más importante: en un nuevo archivo que originalmente estaba separado de los tres anteriores.

Estos cuatro valores no deben diferir demasiado entre sí. Si difieren en más de un 10% de error (30% de desviación y 35% de desviación, por ejemplo), que se jodan.


Y lo que tengo en la cuenta real no tiene ninguna importancia: las señales mueren después de un año o incluso después de dos años.

 
SanSanych Fomenko:

¿Y qué pasa con el hecho de que los incrementos no indican de ninguna manera las tendencias?

Sí, lo hacen.

El modelo predice el incremento o la dirección, para eso están los modelos de clasificación.

No conozco ningún modelo de clasificación que reconozca los movimientos en las noticias. Y en el caso de GARCH, este es el objetivo del modelo: calcular el movimiento ocurrido. Colas gordas: se trata del movimiento en las noticias cuando se rompen las tendencias y se producen retrocesos bruscos.


Puede observar el aumento en diferentes plazos.

Hay modelos GARCH interesantes para varios marcos temporales. El significado es el siguiente.

Supongamos que predecimos el incremento en H1. El modelo requiere datos de entrada que caractericen la distribución. Como datos de entrada (normalmente la volatilidad) no tomamos la hora anterior, sino los minutos dentro de la hora actual.

En mi opinión, es importante dividir toda la historia en intervalos con el mismo comportamiento. Por ejemplo, aquí hay una imagen del precio de cierre del EURUSD durante 5 años, se puede ver que hubo una tendencia hasta aproximadamente el 2T14, luego el resto del 14 y el comienzo del 15 es otra, y después de eso la tercera comenzó y aún continúa. Intentar obtener la temperatura media del hospital y utilizarla para diagnosticar el estado de un solo paciente es un error, en mi opinión.


Si tomamos, por ejemplo, la tendencia actual desde principios del siglo XV hasta la actualidad, y al menos aislamos/extrapolamos las tendencias, la periodicidad, obtenemos un resultado bastante creíble, en mi opinión. Aquí está la imagen, en verde está la previsión de precios de cierre para las próximas dos semanas.


 
SanSanych Fomenko:


¿Y en números?

En la muestra de entrenamiento, la muestra de prueba y la muestra de validación.

Y lo que es más importante: en un nuevo archivo que originalmente estaba separado de los tres anteriores.

Estos cuatro valores no deben diferir demasiado entre sí. Si difieren en más de un 10% de error (30% de desviación y 35% de desviación, por ejemplo), que se jodan.


Si difieren en más del 10% (desviación del 30% y del 25%, por ejemplo, entonces que se jodan.) Lo que vale el dinero real - no es nada, las señales mueren después de un año o incluso dos años.


No necesito tantas muestras inútiles, hay suficiente entrenamiento y pruebas, elijo los parámetros a través de GA, luego elijo los resultados que son máximamente similares a los de atrás y adelante. Nunca entrenarás un modelo para todo el historial de cotizaciones, además ofreces 3 periodos independientes, y operar en el 4º no tiene sentido cuando se opera en el mercado, ya que el mercado cambia durante ese tiempo. Por lo tanto, sólo hay que asegurarse de que el modelo no está sobreajustado, en la sección fuera de la muestra de entrenamiento, y eso es todo.

Me entreno cada semana, hasta ahora la segunda semana está en +35%. De qué se trata, es dinero real )

 
SanSanych Fomenko:

Y lo que vale el dinero real no es nada, hay señales que mueren en un año o incluso dos ...

¿De verdad quieres crear un modelo de mercado para los próximos años...?
 
Maxim Dmitrievsky:


Ya tengo los predictores, curiosamente. Ya hay un bot listo, que se mantiene en lo real, escrito en menos de un mes. Lo más importante son los predictores, que están fuera de toda duda, sí. Por ejemplo, con mi inflamada imaginación los pronósticos se pueden recoger en el acto, he estado trabajando como analista durante 5 años :) En mi opinión, la selección de predictores no es una tarea tan difícil como el estudio de las arquitecturas de las SN, lo principal es sentarse y seleccionar, tarda 2-3 semanas :)

Por favor, ¿qué predictores utiliza?
 
Maxim Dmitrievsky:


En números allenorm, no hay necesidad de tantas muestras inútiles, el entrenamiento y la prueba esto es suficiente, a través de GA elijo los parámetros, a continuación, elijo los resultados que son lo más similar posible a la espalda y hacia adelante. Nunca entrenarás un modelo para todo el historial de cotizaciones, además ofreces 3 periodos independientes, y operar en el 4º no tiene sentido cuando se opera en el mercado, ya que el mercado cambia durante ese tiempo. Por lo tanto, sólo hay que asegurarse de que el modelo no está sobreajustado, en una sección fuera de la muestra de entrenamiento, y eso es todo.

Me entreno cada semana, hasta ahora la segunda semana está en +35%. Me doy cuenta de lo que se trata, esto es dinero real).

Usted es quien mejor conoce las muestras.
 
pantural:
Por favor, dígame qué predictores utiliza.
Uno que ya he descrito aquí es el valor de la pendiente de la línea de regresión e incluso un ejemplo de bot, los otros son un secreto :)
 
Ivan Negreshniy:
¿De verdad quieres crear un modelo de mercado para los próximos años...?

No, claro que no.

Estoy ocupado en conseguir algunas garantías para un futuro.

 
Maxim Dmitrievsky:


En números allenorm, no hay necesidad de tantas muestras inútiles, el entrenamiento y la prueba esto es suficiente, a través de GA selecciono los parámetros, a continuación, elijo los resultados que son lo más similar posible a la espalda y hacia adelante. Nunca entrenarás un modelo para todo el historial de cotizaciones, además ofreces 3 periodos independientes, y operar en el 4º no tiene sentido cuando se opera en el mercado, ya que el mercado cambia durante ese tiempo. Por lo tanto, sólo hay que asegurarse de que el modelo no está sobreajustado, en una sección fuera de la muestra de entrenamiento, y eso es todo.

Me entreno cada semana, hasta ahora la segunda semana está en +35%. De lo que se trata es de dinero real )

Yo también tengo dos parcelas.

La primera parcela: se toman tres muestras al azar de ella y se aprende-verifica-verifica. La última sección, que sigue a la primera, es un recorrido secuencial, preferiblemente con un probador.

Completamente olvidado, aunque ya he escrito muchas veces.

El paso descrito anteriormente es el segundo paso.

El primer paso es la selección de predictores "relevantes" para la variable objetivo. Puedo demostrar que se obtienen muy buenos resultados con aquellos conjuntos de predictores en los que prevalecen los predictores que no tienen nada que ver con la variable objetivo: el ruido. Los resultados de la formación son muy buenos en cuanto al ruido. Y logré obtener un error de menos del 10% en las tres partes mencionadas, ¡hasta el 3%! Y luego obtuve un error completamente aleatorio en la segunda parte.

Si se empieza a eliminar los predictores de ruido, el error aumenta durante el entrenamiento, pero disminuye en la segunda sección. Si se eliminan los predictores de ruido, se obtiene aproximadamente el mismo valor de error. En mi conjunto de predictores es un poco menos del 30%.

 
No hay que entrenar a las máquinas, primero hay que tener nervios de acero y contactos en las altas esferas del poder para poder comerciar de forma rentable
Razón de la queja: