Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2018

 
Maxim Dmitrievsky:

Creo que el artículo quería... Esboza la esencia del enfoque. Sigo sin entender lo que estás haciendo :D

Me adhiero a la opinión de que las características deben ser extraídas automáticamente por el propio modelo a partir de las series temporales (si las hay). Y no es necesario hacer nada manualmente. Los incrementos son suficientes. La cuestión es la arquitectura. Por ejemplo, como en la PNL (procesamiento neural del lenguaje), la propia red neural determina el contexto en las secuencias de palabras, es decir, la conexión entre las muestras de las series temporales.

El árbol genético y CatBoost están débilmente conectados, el artículo que pienso escribir sobre CatBoost. Aplazado para escribir por la razón de que he encontrado fallas en la estabilidad de los indicadores de los predictores y han lanzado todas las fuerzas en la corrección de la misma, al mismo tiempo y los nuevos predictores han hecho. Para el final de la semana tengo previsto iniciar el proceso de cálculo (de lo contrario, es molesto que los servidores estén inactivos) e intentaré escribir la primera parte del artículo para finales de mes. El artículo tratará sobre mi cocina de fabricación de modelos en CatBoost.

Con los árboles genéticos es más complicado, todavía no habrá un artículo sobre ello, pero el planteamiento es que seleccionamos hojas de árboles que clasifican de forma estable una parte de los datos sobre el historial - de hecho el 0,5%-3% de todas las respuestas de la muestra, cuantas más hojas de este tipo, mejor, ahora unas 1000 para la compraventa, además busco hojas que también filtren las hojas seleccionadas, es decir, realizo un entrenamiento adicional que aumenta su precisión. Las hojas se agrupan según su similitud (aún queda trabajo por hacer), luego se ponderan sus respuestas dentro de cada grupo en el historial y se determina el umbral en el que se genera la señal de un grupo de hojas. Un filtro adicional es un árbol genético basado en las respuestas de todas las hojas o sólo de grupos de hojas. Este enfoque permite aumentar significativamente la exhaustividad de la clasificación en un muestreo desequilibrado, en mi caso con 3 objetivos, donde el objetivo "0" es de aproximadamente el 65%.

El trabajo sobre los criterios de selección de las hojas y la metodología de su agregación tiene un gran potencial de mejora, y por tanto los modelos pueden ser de mayor calidad.

 
Aleksey Vyazmikin:

¿Qué tienen que ver los predictores?

Debe haber estado confundido, pensando en los suyos)

 
Maxim Dmitrievsky:

Considero que las características deben ser extraídas automáticamente por el propio modelo a partir de las series temporales (si las hay). Y no es necesario hacer nada manualmente. Los incrementos son suficientes. La cuestión es la arquitectura. Por ejemplo, como en la PNL (procesamiento neural del lenguaje), la propia red neural determina el contexto en las secuencias de palabras, es decir, la conexión entre las muestras de las series temporales.

Estoy de acuerdo sobre la arquitectura, necesitamos una arquitectura completamente diferente, necesitamos un conjunto de redes:

1. Identificación de imágenes.

2. Determinación del ordenamiento espacial de las imágenes

3. buscar patrones en las imágenes colocadas en el espacio

Ahora tengo mi propio cerebro resolviendo para las redes 1 y 2 - haciendo predictores, y con la tercera tarea el CatBoost está haciendo. Combinar estas redes en una sola será difícil, ¿quizás intentar trabajar con cada dirección por separado, y luego unir estas redes?

 
Aleksey Vyazmikin:

Ahora estoy resolviendo para las redes 1 y 2 con mi cerebro - componiendo predictores, y CatBoost está manejando la tercera tarea. Sería difícil fusionar estas redes en una sola, ¿quizás intentar trabajar con cada dirección por separado y luego fusionar estas redes?

Hay que estar atento a las innovaciones, que mejoran constantemente. Las parrillas modernas tienen exactamente la misma tarea, hacer todo a la vez.

Buscar predictores manualmente es como golpear una piedra con un pico. Y, como todo el mundo ha visto, casi no funciona
 
Maxim Dmitrievsky:

hay que estar atento a los nuevos productos, que mejoran constantemente. Las parrillas modernas tienen exactamente la misma tarea, hacer todo a la vez.

Buscar predictores manualmente ya es cosa del pasado, como un pico en una roca. Y, como todo el mundo ha visto, casi no funciona

Tiene que ser una arquitectura muy compleja para hacer todo a la vez, y cuanto más compleja es la arquitectura, más potencia de procesamiento se necesita.

Sin embargo, si hay necesidad en capacidades (hay servidores antiguos y GPU), estoy dispuesto a proporcionarlos por la idea ;)

 
Aleksey Vyazmikin:

Cuanto más compleja sea la arquitectura, más potencia de procesamiento se necesitará.

Sin embargo, si hay necesidad de potencia (hay servidores y GPUs antiguos), estoy dispuesto a proporcionarla por la idea ;)

no es complicado, sólo hay que entender

No necesito nada de energía. Tengo LSTM en mi portátil aprende en pocos minutos sin ninguna tarjeta gráfica. Lo del poder es un mito.

 
Aleksey Vyazmikin:

Cuanto más compleja sea la arquitectura, más potencia de procesamiento se necesitará.

Sin embargo, si hay necesidad de energía (hay servidores y GPUs antiguos), entonces estoy dispuesto a proporcionarla por la idea ;).

¿Preparado para hacer flotar una idea, en persona?

 
Maxim Dmitrievsky:

no es complicado, sólo hay que descubrirlo.

No necesitas nada de energía. Puedo enseñar LSTM en mi portátil en unos minutos sin necesidad de tarjetas de vídeo. Lo del poder es un mito.

Las arquitecturas no complejas no funcionan, tú mismo lo has dicho. Los no complicados necesitan estacionariedad... ciclos.

Vaya, un par de minutos es genial, ¿y qué topología de red es, cuántas capas, neuronas?

 
dr.mr.mom:

¿Preparado para sondear ideas, en persona?

Puedes hacerlo en persona.

 
Aleksey Vyazmikin:

Las arquitecturas sin complicaciones no funcionan, tú mismo lo has dicho. Los no complicados necesitan estacionariedad... ciclos.

Vaya, es genial en un par de minutos, ¿y qué topología de red es esa, cuántas capas, neuronas?

Oh, hombre... no es complicado en el sentido de que puedas averiguar

normalmente un par de capas es suficiente, no se necesita mucha profundidad en forex

Hay redes más avanzadas para la RV, más frescas que el lstm. Podría ser rentable a partir de ahí, aún no lo he comprobado. Todos los "clásicos" como los boostings y los perseptrons no son adecuados para la BP.

Razón de la queja: