Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2031

 
mytarmailS:

podemos intentar expresar el objetivo de una manera más compleja en forma de 4 parámetros a la vez


digamos que decidimos comprar...

y la red no sólo nos dice que compremos o vendamos

nos dice

a qué precio comprar, a qué precio cerrar, después de cuánto tiempo comprar y después de cuánto tiempo cerrar

también puede añadir un stop loss

Estas previsiones tan precisas y distantes me parecen pesadas de aprender...

Para las tomas de beneficios, creo que deberíamos hacer una clasificación con diferentes variantes de toma de beneficios y el modelo debería elegir la más rentable. Es similar a la ZZ, pero el modelo debería trabajar en cada barra a partir de un punto determinado, pero este punto no aparecerá en cada movimiento del precio desde la posición abierta.

Un buen lugar para entrar es donde se puede obtener la mínima pérdida, es decir, es importante conocer inmediatamente el punto de salida adecuado para fijar el SL, si el SL está ligado a algún indicador de nivel, entonces los puntos de entrada son bastante fáciles de encontrar y cribar, son similares, y por lo tanto la formación debe ser mejor.

Así que la pregunta es cómo encontrar esos puntos...

 
Aleksey Vyazmikin:

Un deseo de éxito está ahí :)

¿Necesitas una regresión, entonces? No tengo mucha experiencia en este tipo de modelos.

Conozco este concepto - hay gente que lo hace - la cuestión es cómo crear estrategias - en el propio motor...

Entonces, ¿para la clasificación hacen el objetivo? Voy a dejar la primera parte de la tabla, que es sobre la entrada, SL, TP y la última columna +-1 como el resultado de la operación. Por ejemplo, si tengo una salida, la última columna debería ser +-1.

¿De qué motor estamos hablando? En la fuerza bruta o en la genética, para empezar.

 
Rorschach:

Entonces, ¿para clasificar el objetivo hacer? Voy a dejar la primera parte de la tabla, que es sobre la entrada, SL, TP y la última columna +-1 como el resultado de la operación. No creo que deba dar información sobre la salida, porque es posible espiarla.

¿De qué motor estamos hablando? En la fuerza bruta o en la genética, para empezar.

Se puede hacer una regresión, se puede hacer un modelo, siempre y cuando sea sólo una investigación, según tengo entendido. Pero para evaluar la calidad no es más complicado - tendrá que evaluar la desviación del plan, no sé si se puede evaluar de inmediato el vector de desviación o no modulo - no se dedica.

Sobre un motor que tomará sabiamente los datos correctos, para no generar condiciones comerciales obviamente sin sentido - el proceso de generación de la estrategia en sí, y después de eso podemos pensar en la genética o alguna otra forma de mejorar el modelo.

 
Aleksey Vyazmikin:

También se puede hacer una regresión, se puede hacer un modelo, siempre y cuando sea sólo una investigación, según entiendo. Pero es más complicado con la estimación de la calidad - necesitaremos estimar la desviación del plan, no sé si es posible estimar el vector de desviación o el módulo - no lo he hecho.

Sobre el motor que tomará sabiamente los datos necesarios, para no generar condiciones de negociación sin sentido a sabiendas - el proceso de generación de la estrategia en sí, y después podemos pensar en la genética o algo más para entrenar el modelo.

De hecho, es interesante ver la agrupación, cómo se agrupará, habrá alguna lógica.

Podemos empezar con martin, antimartin y anular. Y luego ifelse: si la operación se cerró en menos, la siguiente se abre con doble lote o sólo en sentido contrario o ambos. Es difícil pensar en algo más complicado desde cero.

 
Rorschach:

Es realmente interesante ver la agrupación, cómo se agrupará, si habrá alguna lógica allí.

Podríamos empezar con un martín, un antimartín y una inversión. Y luego sielse: si una operación cerró con pérdidas, entonces la siguiente se abre con doble lote o justo en la dirección opuesta o ambas. Es difícil pensar en algo más complicado desde cero.

Puedo proporcionar recursos, no puedo hacer más por el momento.

 
Aleksey Vyazmikin:

Puedo proporcionar recursos, no puedo hacer más por el momento.

Catbust tiene feature_importances, la capacidad de buscar grupos, como en los bosques?

¿Su máquina digiere la tabla 14 por 180.000.000?

 
Rorschach:

¿Tiene catbust feature_importances, la capacidad de mirar los clusters, como en el andamiaje?

¿Su máquina digiere la tabla 14 por 180.000.000?

"Feature_importances" es la importancia de las características, ¿qué tiene que ver con los clusters? O me estoy perdiendo algo. Existe esta característica, pero no la uso mucho, porque esta importancia se cuenta esencialmente por las copas de los árboles, lo que no se ajusta a mi concepto.

He entrenado modelos en tablas de 6 gigabytes. Y no consumía más de 2 gigabytes de memoria, según recuerdo ahora.

 
Aleksey Vyazmikin:

"feature_importances" es la importancia de las características, ¿qué tiene que ver con los clusters? ¿O me estoy perdiendo algo? Existe esta característica, pero no la uso mucho, porque esta importancia se cuenta esencialmente por las copas de los árboles, lo que no se ajusta a mi concepto.

He entrenado modelos en tablas de 6 gigabytes. Y no consumía más de 2 gigabytes de memoria, según recuerdo ahora.

Para el bosque es posible ver la importancia y las agrupaciones. En catbust es probablemente plot_tree.

Se prepararán los datos y se publicarán.

Hice una versión de prueba para 6 columnas, que ocupó 11GB. Notepad++ no pudo abrirlo, dice que el archivo es demasiado grande. BD Browser for SQLite se ha colgado durante unos 20 minutos.
 
Rorschach:

En el caso de un bosque, existe la opción de mirar la importancia y los clusters. En catbust es probablemente plot_tree.

Prepararé los datos y los publicaré.

Hice una versión de prueba para 6 columnas, que ocupó 11GB. Notepad++ no pudo abrirlo, dice que el archivo es demasiado grande. BD Browser for SQLite se ha colgado durante unos 20 minutos.
El visor de comandos total toma archivos grandes, lo que hace que Notepad++ se cuelgue
 
Aleksey Vyazmikin:

"feature_importances" es la importancia de las características, ¿qué tiene que ver con los clusters? ¿O me estoy perdiendo algo? Existe esta característica, pero no la uso mucho, porque esta importancia se cuenta esencialmente por las copas de los árboles, lo que no se ajusta a mi concepto.

He entrenado modelos en tablas de 6 gigabytes. Y no consumía más de 2 gigabytes de memoria, según recuerdo ahora.

Me pregunto cómo se entrenan los árboles sin tomar todos los datos en la memoria. Si tenemos una tabla de 6 gigabytes, también deberían utilizarse unos 6 gigabytes de memoria. Un árbol tiene que ordenar cada columna como un todo. Si no ponemos todo en la memoria, sino que leemos los datos del disco cada vez, será demasiado lento.
La única variante es mantener los datos en memoria en tipo float en lugar de double, pero esto reducirá la precisión. Para nosotros, con una precisión de 5 dígitos, puede no ser tan malo, pero catbust es un software universal, creo que los problemas físicos y matemáticos deberían resolverse en doble precisión.

Razón de la queja: