Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3352

 
Forester #:

Está claro que todas ellas. Pero si utilizamos incrementos entre barras vecinas, entonces para entender que hubo una tendencia en las últimas 100 barras, el modelo debe sumar las 100 barras y obtener el incremento desde la barra 0. Y al alimentarse desde la barra 0 a la vez, - facilitamos su trabajo. Y alimentando desde 0 bar a la vez, - hacemos su trabajo más fácil.
Tal vez las redes neuronales pueden tener en cuenta todos los 100 incrementos y encontrar una tendencia, pero los modelos de madera son poco probables. Usted mismo dijo (y tengo el mismo resultado) que los modelos funcionan mejor en varias características (hasta 10), y una tendencia completa de 100 no se formará a partir de 10. Y además de incrementos puede haber señales más útiles.

Por eso mi desfase arbitrario para los incrementos es siempre desde 0 barra, para que el modelo vea la tendencia. Los incrementos entre barras vecinas no los uso nunca, porque los considero ruido. Por ejemplo, un incremento de 0,00010 pt entre las barras 120 y 121, es decir, hace 2 horas, ¿qué influencia puede tener en la situación actual? - Ninguna.

Una tendencia es un desplazamiento de los incrementos medios. Así que también está en el gráfico de incrementos. El problema de los atributos múltiples se explica desde el punto de vista de los factores de confusión, es decir, resulta más difícil separar la influencia de cada atributo de todos los demás. Al fin y al cabo, cada uno de ellos introduce un error adicional en la estimación final. La inferencia causal se complica y se añade incertidumbre. Aparentemente, existe cierta limitación en la complejidad del modelo de primer plano, que depende de la relación señal/ruido.

El desfase de los incrementos está directamente relacionado con la duración del comercio predicho en barras. Por ejemplo, si la duración es de 1 barra, es mejor tomar incrementos con un desfase pequeño y una profundidad de ventana pequeña. A medida que aumenta la duración de las operaciones, el desfase de los incrementos también aumenta de forma natural. Y, por supuesto, influye el diferencial.
 

Escribí un Asesor Experto que registra los datos de cada tick y forma un archivo csv con los datos, y junto a él corrí una red neuronal que analiza este archivo, realiza un entrenamiento y, en base a la última línea del primer archivo, emite un pronóstico de hacia dónde irá el precio y por cuántos puntos. Escrito en python. Quien ha hecho ya algo parecido y que datos se pueden aprender para cubrir el cuadro completo. Ahora la experiencia se basa en 'Apertura', 'Máximo', 'Mínimo', 'Cierre', 'Volumen'.

No sé cómo insertar una pantalla

 
Андрей Escribí un Asesor Experto que registra los datos de cada tick y forma un archivo csv con los datos, y junto a él inicié una red neuronal que analiza este archivo, realiza un entrenamiento y, basándose en la última línea del primer archivo, emite un pronóstico de hacia dónde irá el precio y por cuántos puntos. Escrito en python. ¿Hay alguien que ya ha hecho algo similar y qué datos se pueden aprender para cubrir el cuadro completo. Ahora la experiencia se basa en 'Apertura', 'Máximo', 'Mínimo', 'Cierre', 'Volumen'.

No sé cómo insertar una pantalla

registrar y analizar los ticks de TODOS los pares de divisas y metales.

añadir hora del día, día de la semana

clasificación de las noticias esperadas

segundos antes de la noticia

clasificación de noticias pasadas

segundos después de la noticia

===

en general algo para mantenerse ocupado y python :-)

 
Aún no hemos revisado todos los modus operandi, así que no podemos darte ninguna pista :)
 
Maxim Dmitrievsky #:
Aún no dominamos todas las OI, así que no podemos decírtelo de entrada :)

¿Por qué dominar todas las OI? Sólo hay varios cientos de modelos... Y los modelos son claramente menos de la mitad del problema.

Tal vez dominar un par de modelos, pero aprender a lograr de forma consistente aproximadamente el mismo error de clasificación en OOV y OOS de menos del 20%? ¿Teniendo en la base la prueba de que no hay sobreaprendizaje, mirando hacia adelante y, lo que es más importante, la prueba del error de clasificación resultante en el futuro?

 
СанСаныч Фоменко #:

¿Por qué dominar todos los MdD? Sólo hay varios cientos de modelos... Y los modelos son claramente menos de la mitad del problema.

¿Qué tal dominar un par de modelos, pero aprendiendo a lograr sistemáticamente aproximadamente el mismo error de clasificación en OOV y OOS de menos del 20%? ¿Teniendo en la base la prueba de no sobreaprender, mirando hacia el futuro y, lo que es más importante, la prueba del error de clasificación resultante en el futuro?

Debajo de todos los OI hay enfoques y prácticas comunes. Por ejemplo, ¿se pueden obtener probabilidades de clase para la clasificación binaria? En caso afirmativo, ¿de qué manera?
 
Maxim Dmitrievsky #:
Debajo de todos los MOE hay enfoques y prácticas comunes. Por ejemplo, ¿se pueden obtener probabilidades de clase para la clasificación binaria? Si es así, ¿de qué manera?

No puedo pensar inmediatamente en paquetes que NO produzcan probabilidades de clase. Así que tenía la impresión de que ésta era la norma.

 
СанСаныч Фоменко #:

No puedo pensar inmediatamente en paquetes que NO emitan probabilidades de clase. Así que me pareció que esta era la norma.

El pensamiento por lotes está de moda. Esas no son esas probabilidades, se llaman así por el phs de loess aplicado, para estimación de verosimilitud.

¿Cómo se obtienen probabilidades de clase reales?
 
Maxim Dmitrievsky #:
El pensamiento por lotes está de moda. Estas no son esas probabilidades, se llaman así por el loess fi utilizado, para estimar la probabilidad.

¿Cómo obtener probabilidades reales de clase?

No hay otra forma de pensarlo. Utilizamos algoritmos de MO estándar que van acompañados de un conjunto de funciones adicionales. Todo junto se denomina "paquete".

¿Qué son las "probabilidades de clase reales"? Por ejemplo, la función

predict(object, newdata, type = c("vector", "probs", "both","F"))
devuelve "estimaciones de clases de probabilidad".El algoritmo no puede contener más probabilidades que las "estimaciones".



 

No os peleéis, chicos, os estamos leyendo.

abre las cerraduras ;)


Razón de la queja: