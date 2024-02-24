Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 388
Ya tengo predictores, por extraño que parezca. Tengo un bot listo, que construí en menos de un mes. Lo más importante - los predictores, eso está fuera de discusión, sí. Bueno, eso es quién tiene experiencia en qué... Por ejemplo, con mi inflamada imaginación los pronósticos se recogen en un santiamén, yo trabajo como analista desde hace 5 años :) En mi opinión, la selección de predictores no es una tarea tan difícil como el estudio de las arquitecturas de las SN, lo principal es sentarse y seleccionar, tarda 2-3 semanas :)
¿Y en números?
En la muestra de entrenamiento, la muestra de prueba y la muestra de validación.
Y lo que es más importante: en un nuevo archivo que originalmente estaba separado de los tres anteriores.
Estos cuatro valores no deben diferir demasiado entre sí. Si difieren en más de un 10% de error (30% de desviación y 35% de desviación, por ejemplo), que se jodan.
Y lo que tengo en la cuenta real no tiene ninguna importancia: las señales mueren después de un año o incluso después de dos años.
¿Y qué pasa con el hecho de que los incrementos no indican de ninguna manera las tendencias?
Sí, lo hacen.
El modelo predice el incremento o la dirección, para eso están los modelos de clasificación.
No conozco ningún modelo de clasificación que reconozca los movimientos en las noticias. Y en el caso de GARCH, este es el objetivo del modelo: calcular el movimiento ocurrido. Colas gordas: se trata del movimiento en las noticias cuando se rompen las tendencias y se producen retrocesos bruscos.
Puede observar el aumento en diferentes plazos.
Hay modelos GARCH interesantes para varios marcos temporales. El significado es el siguiente.
Supongamos que predecimos el incremento en H1. El modelo requiere datos de entrada que caractericen la distribución. Como datos de entrada (normalmente la volatilidad) no tomamos la hora anterior, sino los minutos dentro de la hora actual.
En mi opinión, es importante dividir toda la historia en intervalos con el mismo comportamiento. Por ejemplo, aquí hay una imagen del precio de cierre del EURUSD durante 5 años, se puede ver que hubo una tendencia hasta aproximadamente el 2T14, luego el resto del 14 y el comienzo del 15 es otra, y después de eso la tercera comenzó y aún continúa. Intentar obtener la temperatura media del hospital y utilizarla para diagnosticar el estado de un solo paciente es un error, en mi opinión.
Si tomamos, por ejemplo, la tendencia actual desde principios del siglo XV hasta la actualidad, y al menos aislamos/extrapolamos las tendencias, la periodicidad, obtenemos un resultado bastante creíble, en mi opinión. Aquí está la imagen, en verde está la previsión de precios de cierre para las próximas dos semanas.
No necesito tantas muestras inútiles, hay suficiente entrenamiento y pruebas, elijo los parámetros a través de GA, luego elijo los resultados que son máximamente similares a los de atrás y adelante. Nunca entrenarás un modelo para todo el historial de cotizaciones, además ofreces 3 periodos independientes, y operar en el 4º no tiene sentido cuando se opera en el mercado, ya que el mercado cambia durante ese tiempo. Por lo tanto, sólo hay que asegurarse de que el modelo no está sobreajustado, en la sección fuera de la muestra de entrenamiento, y eso es todo.
Me entreno cada semana, hasta ahora la segunda semana está en +35%. De qué se trata, es dinero real )
Y lo que vale el dinero real no es nada, hay señales que mueren en un año o incluso dos ...
Por favor, dígame qué predictores utiliza.
¿De verdad quieres crear un modelo de mercado para los próximos años...?
No, claro que no.
Estoy ocupado en conseguir algunas garantías para un futuro.
Yo también tengo dos parcelas.
La primera parcela: se toman tres muestras al azar de ella y se aprende-verifica-verifica. La última sección, que sigue a la primera, es un recorrido secuencial, preferiblemente con un probador.
Completamente olvidado, aunque ya he escrito muchas veces.
El paso descrito anteriormente es el segundo paso.
El primer paso es la selección de predictores "relevantes" para la variable objetivo. Puedo demostrar que se obtienen muy buenos resultados con aquellos conjuntos de predictores en los que prevalecen los predictores que no tienen nada que ver con la variable objetivo: el ruido. Los resultados de la formación son muy buenos en cuanto al ruido. Y logré obtener un error de menos del 10% en las tres partes mencionadas, ¡hasta el 3%! Y luego obtuve un error completamente aleatorio en la segunda parte.
Si se empieza a eliminar los predictores de ruido, el error aumenta durante el entrenamiento, pero disminuye en la segunda sección. Si se eliminan los predictores de ruido, se obtiene aproximadamente el mismo valor de error. En mi conjunto de predictores es un poco menos del 30%.