Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 426

 
Ivan Negreshniy:

Tienes razón, predecir el indicador es redundante. Pero predecir el precio también es redundante, porque el objetivo de la estrategia de negociación no es el precio sino el beneficio.

Siguiendo esta lógica, no debemos modelar indicadores ni gráficos de precios, sino el comportamiento del trader, y la mejor función objetivo serían los indicadores de su operativa rentable.

En la práctica, debe tomar el historial de operaciones o ejecutar el Asesor Experto en el Probador de Estrategias y enseñar el modelo con patrones de precios como entrada y transacciones como salida.

Así que el "beneficio" es el retorno (rentabilidad, rendimiento), es decir, el aumento del precio normalizado por suvalor absoluto, y este es el notorio indicador "Momentum", conociendo el futuro Momentum, eres el gobernante del universo.

 
Maxim Dmitrievsky:

Y lo que se discute aquí ahora es una especie de aplicación de parvulario del zigzag o no, qué demonios importa si el propio enfoque de previsión es erróneo desde el principio (es decir, no llevará al éxito) :)

Es cierto, la cuestión está en los detalles, no te precipites. Y este "infantilismo" no sólo se refiere al zigzag, es una verdadera trampa...

 
Aliosha:

No me atrevo a hacerlo, ni con tu actitud ni con la de nadie. No estás solo en tu ilusión.

Tiene mucho sentido lo que has escrito, el artículo es genial, lo digo sinceramente, de forma breve y concisa. Pero hay un pequeño defecto, y lo he señalado, ya que yo mismo me he engañado de la misma manera durante mucho tiempo.


Permítanme que intente explicar mi posición una vez más.


El artículo que mencionas es material de promoción del aprendizaje automático: muestra que el concepto de aprendizaje automático incluye no sólo los modelos, sino también la preparación de los datos para el modelo y la evaluación del mismo. También demuestra que cualquier persona interesada en el aprendizaje automático puede probarlo todo con un esfuerzo mínimo.


Mis pensamientos no están en el artículo en absoluto. Es un anuncio.


Mi pensamiento en este hilo y en otros hilos del foro es que lo principal, lo básico en el aprendizaje automático NO es el modelo, el razonamiento de que"los predictores son relevantes para la variable objetivo".

Es "relevante", no el objetivo en sí ni un conjunto específico de predictores. Dicho esto, pongo mi propio significado en el sentido de "tener una relación", diferente del definido por la "importancia de los predictores".

Nunca he anunciado ni justificado el uso de ZZ en ningún sitio: simplemente lo he utilizado en mis ejemplos como el más destacado de los predictores. También he indicado que para mi propio conjunto de predictores obtengo menos del 30% de error de predicción, lo que no es un mal resultado, debo decir.

Pero una vez más: este resultado se obtiene porque soy capaz de filtrar los predictores y dejar fuera los que son "relevantes" para la variable objetivo. En mi ejemplo, a la ZZ. Pero para mi método el objetivo no importa, lo que importa es el conjunto "objetivo-predicadores".

 
SanSanych Fomenko:

Aparte de eso, también señalé que para mí personalmente, para el conjunto de predictores que tengo, obtengo un error de predicción inferior al 30%, un resultado muy bueno, debo decir.

Pero una vez más: este resultado se obtiene porque soy capaz de filtrar los predictores y dejar fuera los que son "relevantes" para la variable objetivo. En mi ejemplo, a la ZZ. Pero para mi método no importa el objetivo, sino todo el conjunto de "objetivos-predictores".

No es un mal resultado, es fantástico, estoy seguro de que ni siquiera Renaissance lo tiene cerca, con sus terabytes de datos al día. Mira el live-score en numer.ai y piensa por qué ellos tienen al menos un 45% de error(logloss~0,69) y tú un 30%.

Pero lo que dices es cierto, has creado tu función de objetivo sintético, que está funcionalmente ligado a las características de una manera inteligente (obviamente no es obvio para ti) y tienes una exploración tan agradable en Lorn y la prueba y todo se ve bien ... Pero ¿por qué no eres un multimillonario todavía, aunque fácilmente podría convertirse en uno en alrededor de un año si tenía 30% de error en la predicción de color de la vela siguiente, porque usted predice no futuro, pero pasado mezclado con el futuro a través de indicador. Intenta predecir un rendimiento futuro puro y todo encajará.

 
Aliosha:

No es un mal resultado, es un resultado fantástico, estoy seguro de que ni siquiera Renaissance lo tiene cerca, con sus terabytes de datos al día. Mira la puntuación en vivo en numer.ai y piensa por qué ellos tienen al menos un 45% de error(logloss~0,69) y tú un 30%.

Pero lo que dices es cierto, has creado tu función objetivo sintética, que está funcionalmente ligada a las características de una manera inteligente (obviamente no obvia para ti) y tienes un indicador tan bonito en Lorn y en el test, todo parece correcto... Pero aún no eres multimillonario, aunque podrías convertirte fácilmente en uno en aproximadamente un año si tuvieras un 30% de error en la predicción del color de la próxima vela, es porque no predices el futuro sino el pasado mezclado con el futuro a través del indicador. Intenta predecir un rendimiento futuro puro y todo encajará.

ZZ es una mala variable objetivo porque el inicio y el final de su hombro tienen el mismo peso. Si se toma la variable objetivo ANTES de la inversión y DESPUÉS de la inversión de ZZ, no he podido encontrar predictores para dicha variable objetivo, todos los predictores que conozco para dicha variable objetivo son sólo ruido. He colaborado con uno de los foreros en esto, él tiene su propio conjunto de predictores, y ambos tenemos el mismo resultado.

No es multimillonario por una razón muy sencilla: la estimación del modelo de aprendizaje automático para mi modelo con un objetivo en ZZ (ese 30%) es irrelevante para los resultados en el probador, ya que ese error se distribuye arbitrariamente a lo largo del hombro ZZ, es decir, las señales falsas se mezclan con las reales. Opero tendencias, parece, pero predigo la siguiente vela. Para superar esta contradicción tengo un Asesor Experto que operó con éxito durante más de un año y que el 7 de octubre saltó un stop que fijaba el nivel máximo de riesgo.

Pero esto es comercio de tendencia.

Sigues sugiriendo operar con DIVERSOS, no con tendencias. Esta es una operación diferente y hay modelos mejor diseñados para ello: GARCH. Extremadamente bien desarrollado, muchas herramientas listas para usar, montones de ejemplos para operar en los mercados financieros, incluyendo el forex. Eso es lo que estoy haciendo ahora. Únete.


PS.

Sobre mirar hacia adelante en la ZZ.

Hay que escribir con cuidado. Cuando entrenas, en el historial siempre tienes un valor hasta la última barra del extremo derecho. No es el caso de los EAs: en el lado derecho de ZZ siempre hay un hombro sin formar, y además, el hombro anterior también puede estar sobredimensionado. Por lo tanto, tenemos que aprender de la historia. A continuación, pase a un nuevo archivo y vuelva a entrenar allí a lo largo del gráfico, teniendo en cuenta sólo los valores ZZ que ya se han formado. Y eso son 100 bares o más de retraso. Y nada de "asomarse", sino lo contrario de retrasarse.

 

Permítanme resumirlo para que quede claro para muchos ....

En efecto, hay funciones objetivo complejas, o más bien el investigador decide que el problema está en la variable de salida y empieza a complicarla. Solía pasar, yo también lo hacía. Pero con el tiempo comprendí que no es necesario hacerlo, basta con prever el cambio de precios y si no se puede hacer con el nivel de calidad adecuado, entonces ninguna salida más complicada no salvará la situación.

En cuanto a la curva de equilibrio, es una consecuencia de la calidad del entrenamiento. Es el tipo de esta curva lo que determina la calidad del aprendizaje. Dos condiciones.

Crecimientouniforme de la curva de equilibrio en un ángulo de 45 grados

Ausencia de saltos y caídas fuertes.

Así....

 
SanSanych Fomenko:

ZZ es una mala variable objetivo porque el inicio y el final de su hombro tienen el mismo peso. Si tomamos la variable objetivo ANTES de la inversión y DESPUÉS de la inversión ZZ, no he podido encontrar predictores para dicha variable objetivo - todos los predictores que conozco para dicha variable objetivo son sólo ruido. Colaboré con uno de los foristas en esto, él tiene su propio conjunto de predictores, y ambos tenemos el mismo resultado.

No es multimillonario por una razón muy sencilla: la estimación del modelo de aprendizaje automático para mi modelo con un objetivo en ZZ (ese 30%) es irrelevante para los resultados en el probador, ya que ese error se distribuye arbitrariamente a lo largo del hombro ZZ, es decir, las señales falsas se mezclan con las reales. Parece que comercio tendencias, pero predice la siguiente vela. Para superar esta contradicción tengo un Asesor Experto que operó con éxito durante más de un año y que el 7 de octubre saltó un stop que fijaba el nivel máximo de riesgo.

Pero esto es comercio de tendencia.

Sigues sugiriendo operar con DIVERSOS, no con tendencias. Esta es una operación diferente y hay modelos mejor diseñados para ello: GARCH. Extremadamente bien desarrollado, muchas herramientas listas para usar, montones de ejemplos para operar en los mercados financieros, incluyendo el forex. Eso es lo que estoy haciendo ahora. Únete.


PS.

Sobre mirar hacia adelante en la ZZ.

Hay que escribir con cuidado. Cuando entrenas, en el historial siempre tienes un valor hasta la última barra del extremo derecho. No es el caso de los EAs: en el lado derecho de ZZ siempre hay un hombro sin formar, y además, el hombro anterior también puede estar sobredimensionado. Por lo tanto, tenemos que aprender de la historia. A continuación, pase a un nuevo archivo y vuelva a entrenar allí a lo largo del gráfico, teniendo en cuenta sólo los valores ZZ que ya se han formado. Y eso es 100 bares o más de retraso. Y nada de "asomarse", sino lo contrario de retrasarse.


En cuanto a la incoherencia del "probador" y los resultados de la predicción que escribí anteriormente, si predecimos los retornos, todo encaja perfectamente, he estado pensando durante mucho tiempo, pero estoy seguro de que hay una formalización matemática inequívoca de la función de dependencia de la previsión ML en la relación de Sharpe, porque la relación empírica es bastante inequívoca. Técnicamente el resultado del "probador" no es muy diferente de una simple convolución (producto escalar) de una serie de predicciones sobre los rendimientos realizados (perdónenme los HFT), en consecuencia cuanto más correlacionadas estén las predicciones con los rendimientos mejores serán los resultados del probador, los verdaderos difieren en los costes de las operaciones. Por supuesto, dicha función (predict2Sharp) no será de precisión, sino de logloss, ya que el número de conjeturas por sí mismo es menos importante que multiplicado por los retornos que fueron adivinados.


Sobre el GARCH por lo que sé es un modelo lineal para predecir la volatilidad, no predice la dirección del mercado, ¿o me equivoco?

 
Aliosha:

En cuanto a la inconsistencia de los resultados de "probador" y las predicciones que escribí anteriormente por qué, si usted predice los retornos, todo encaja perfectamente, durante mucho tiempo madura la idea, pero no puedo conseguir el tiempo, matemáticamente formalizar la función de dependencia predicción ML en la relación de Sharpe, estoy seguro de que hay una pantalla sin ambigüedades, porque la relación empírica es bastante inequívoca. Técnicamente el resultado del "probador" no es muy diferente de una simple convolución (producto escalar) de una serie de predicciones sobre los rendimientos realizados (perdónenme los HFT), en consecuencia cuanto más correlacionadas estén las predicciones con los rendimientos mejores serán los resultados del probador, los verdaderos difieren en los costes de las operaciones. Por supuesto, dicha función (predict2Sharp) no será de precisión, sino de logloss, ya que el número de conjeturas por sí mismo es menos importante que multiplicado por los retornos que fueron adivinados.


Sobre el GARCH por lo que sé es un modelo lineal para predecir la volatilidad, no predice la dirección del mercado, ¿o me equivoco?


Confieso que intenté utilizar los coeficientes de Sharpe, Sortino, etc. para clasificar una señal de la estrategia subyacente y llegué a la conclusión de que todos estos coeficientes son consecuencia de la estrategia subyacente. Es decir, el resultado de Sharp es exactamente el mismo, ya que la señal se cerró con tal o cual beneficio y no en el overrun..... Aunque no soy muy buen programador, así que puede que haya calculado estos coeficientes por error. Pero mi Sharp estaba en el rango de -2 a 2. Así que creo que lo tengo bien....

 
Mihail Marchukajtes:

Confieso que intenté utilizar Sharpe, Sortino, etc. para clasificar la señal de la estrategia subyacente y llegué a la conclusión de que todos estos coeficientes son consecuencia de la estrategia subyacente. Es decir, el resultado de Sharp es exactamente el mismo, ya que la señal se cerró con tal o cual beneficio y no en el overrun..... Aunque no soy muy buen programador, así que puede que haya calculado estos coeficientes por error. Pero mi Sharp estaba en el rango de -2 a 2, así que creo que lo tengo bien....

Hay muchos SR genéricos, pero el SR clásico es la métrica más sencilla y común para evaluar el rendimiento de una estrategia/operador/fondo. ¡SR <1,5 se considera una mierda, >=2 es genial!

La RS es, a grandes rasgos, la relación entre el beneficio y el riesgo, en términos cuantitativos.
 
Aliosha:

Hay muchos SR genéricos, pero el SR clásico es la métrica más sencilla y común para evaluar el rendimiento de la estrategia de fondos de un operador. ¡SR <1,5 se considera espeluznante, >=2 es genial!

La RS es aproximadamente la relación entre el beneficio y el riesgo, cuantitativamente hablando.

En principio, no importa. Hay cero poder de predicción allí....

Razón de la queja: