Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1806

 

Hola amigos

Estoy utilizando Deep Reinforcement Learning (usando Python) y el aprendizaje ya está ocurriendo (como se muestra):

Trabajo de aprendizaje por refuerzo profundo


Hoy en día sólo utilizo las medias móviles como observación del mercado para aprender.

Este modelo realiza varias acciones (comprar, vender y esperar). Así, tras el entrenamiento, el modelo converge en muchas acciones para "esperar" sólo con las mejores acciones.

Sin embargo, en este modelo el entrenamiento es muy lento porque utiliza todos los ticks.

¿Qué sugiere como datos de observación del mercado para mejorar la precisión y reducir las pérdidas?

Pido disculpas por mis errores de traducción.

 
ipsec:

¿Qué propone como datos de observación del mercado para mejorar la precisión y reducir las pérdidas?


1) Crear un modelo de mercado y entrenar a un agente en él, esto reducirá la dimensionalidad y acelerará el entrenamiento, incluso aquí se hizo así

2) Elección de características, es como se dice una tarea creativa, si hay muchas entonces también ayudará a reducir la dimensionalidad, hay muchas desde clustering hasta pca, umap y demás.

Si tomamos los niveles de soporte y resistencia y decidimos comprar o vender sólo si el precio está en ese nivel, podemos disminuir la muestra de entrenamiento en órdenes de magnitud.

Podrías combinar todos los puntos juntos .

 
ipsec:

Hola amigos

Estoy utilizando Deep Reinforcement Learning (usando Python) y el aprendizaje ya está ocurriendo (como se muestra):


Hoy en día sólo utilizo las medias móviles como observación del mercado para aprender.

Este modelo realiza varias acciones (comprar, vender y esperar). Así, tras el entrenamiento, el modelo converge en muchas acciones para "esperar" sólo con las mejores acciones.

Sin embargo, en este modelo el entrenamiento es muy lento porque utiliza todos los ticks.

¿Qué sugiere como datos de observación del mercado para mejorar la precisión y reducir las pérdidas?

Disculpe mis errores de traducción

Adelgaza las garrapatas hasta un error aceptable.

Identifique las áreas en las que el error supera el error aceptable cuando se eliminan todas las marcas.

Entrenar el modelo para encontrar esas zonas, si puede, de curso))))

 
Maxim Dmitrievsky:

Bueno, estos son modelos de espacio de estado, también funcionan de vez en cuando.

Y puedes vincular el objetivo a un cambio de tendencia. La tarea no consiste en beneficiarse, sino en reconocer y predecir. Está claro que son tareas completamente diferentes, NS no es capaz de reconocer y predecir al mismo tiempo)))) El beneficio objetivo, el balance reconoce los puntos de inflexión de forma indirecta, sin reconocimiento directo.

Si tomamos las reversiones en zigzag diarias, de 4 horas, horarias (o cualquier otra) y miramos, por ejemplo, en cada (todo) el marco de tiempo 120 barras y 120 ticks antes y después del punto de giro. El diario y el 4h miran solo hasta el siguiente y anterior retroceso o no saben hacerlo mejor. Entonces habría que escribir algo manualmente, por supuesto, para preparar los datos.

O hay algo similar.

 
Valeriy Yastremskiy:

O puede vincular el objetivo a un cambio de tendencia. La tarea no consiste en beneficiarse, sino en reconocer y predecir. Está claro que son tareas completamente diferentes, NS no puede reconocer y predecir al mismo tiempo)))) El beneficio objetivo, el balance reconoce los puntos de inflexión de forma indirecta, sin reconocimiento directo.

Si tomamos las reversiones en zigzag diarias, de 4 horas, horarias (o cualquier otra) y miramos, por ejemplo, en cada (todo) el marco de tiempo 120 barras y 120 ticks antes y después del punto de giro. El diario y el 4h miran solo hasta el siguiente y anterior retroceso o no saben hacerlo mejor. Entonces habría que escribir algo manualmente, por supuesto, para preparar los datos.

¿O hay algo similar?

Se comprueba muy fácilmente por la presencia de regularidad entre las rupturas en zigzag, es decir, la reducción de la entropía. Si hay una diferencia con respecto a sb, entonces puedes mirar. Pero no he encontrado esas cosas. Hay paquetes especiales que se utilizan en medicina para analizar el ADN y obtener fórmulas de medicamentos. La entropía de reordenación, por ejemplo, o casos más complicados con aproximadores, optimizadores como el q-learning
 
ipsec:

Hola amigos

Estoy utilizando Deep Reinforcement Learning (usando Python) y el aprendizaje ya está ocurriendo (como se muestra):


Hoy en día sólo utilizo las medias móviles como observación del mercado para aprender.

Este modelo realiza varias acciones (comprar, vender y esperar). Así, tras el entrenamiento, el modelo converge en muchas acciones para "esperar" sólo con las mejores acciones.

Sin embargo, en este modelo el entrenamiento es muy lento porque utiliza todos los ticks.

¿Qué sugiere como datos de observación del mercado para mejorar la precisión y reducir las pérdidas?

Perdón por mis errores de traducción.

Creo que el refuerzo profundo sólo se utiliza para tareas multivariadas, no para las de 1-5 dimensiones, como los mercados financieros. Así que puede probar métodos más sencillos y rápidos como REINFORCE con red neuronal o aproximador lineal.

 
Maxim Dmitrievsky:
Esto se comprueba muy fácilmente por la presencia de regularidad entre las rupturas en zigzag, es decir, la reducción de la entropía. Si hay una diferencia con respecto a sb, entonces puedes mirar. Pero no he encontrado esas cosas. Existen paquetes especiales, utilizados en medicina para analizar el ADN y obtener fórmulas de medicamentos. Por ejemplo, la entropía de permutación o casos más complicados con aproximadores, optimizadores como el aprendizaje q.

No, la regularidad de la fractura no funciona)))) Hay que coger algo antes de una fractura sin tener en cuenta la regularidad) En general hay una posibilidad de coger aquellas fracturas que tienen las mismas diferencias de SB antes de la fractura. No se puede hacer eso con los paquetes normales. Y no creo que haya nada significativo para una ruptura en medio de la tendencia, excepto una duración demasiado larga de la tendencia))))

 
Valeriy Yastremskiy:

No, la regularidad de la fractura no funciona)))) Hay que coger algo antes de la fractura, sin tener en cuenta la regularidad) En general, existe la posibilidad de coger aquellas fracturas que tienen las mismas diferencias que la SB antes de la fractura. No se puede hacer eso con los paquetes normales. Y no creo que haya nada significativo para una ruptura en la mitad de la tendencia que no sea que la tendencia sea demasiado larga))))

Ya veo, por analogía con la correlación TF. Puede probar

 
Maxim Dmitrievsky:

Creo que el refuerzo profundo sólo se utiliza para tareas multivariadas, no para las de 1-5 dimensiones, como los mercados financieros. Así que puede probar métodos más sencillos y rápidos como REINFORCE con red neuronal o aproximador lineal.

Si miras diferentes TFs obtendrás más dimensiones))))

 
Maxim Dmitrievsky:

Ya veo, por analogía con la correlación TF. Podemos intentarlo.

Sí. Sólo hay que ver las TFs todas, es imposible determinar cuáles son necesarias a la vez. Tal vez uno o dos TFs sería mejor, o tal vez todos ellos son necesarios)). Es difícil pensar en ello)).

Razón de la queja: