Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 952

 
Dr. Trader:

Para el último archivo tenía esto con el árbol :

2016, formación


y_pred

y_true-101
-113392388444472
010803767146029
17413376787415


2015, prueba:


y_pred

y_true-101
-19552392625429
011495721317509
18581403776835

al predecir -1: en realidad -1 ocurrirá ligeramente más a menudo que 1. Pero el 0 será el más frecuente de todos, y probablemente todo acabará en pérdidas. Lo mismo ocurre con la clase "1".


El problema del árbol salió a la luz. La genética eligió el parámetro de árbol cp = 0, y esto da permiso al árbol para un montón de ramas. Desafortunadamente, deberíamos haber restringido este parámetro a algún valor pequeño no nulo.

¿Es posible representar la cifra en términos de probabilidades, como antes? ¿Tal vez haya más ramas significativas en los datos de la prueba?

Dr. Trader:

No creo que haya suficientes predictores en los datos para clasificar "0". Necesita algunos indicadores de planicidad, por ejemplo.

En general es malo con el árbol. La madera de SanSanych es mucho mejor.


Mala configuración del modelo y, en consecuencia, reentrenamiento.

¡Sólo cogió un archivo 2016 (por cierto en 2015 había 1 predictor menos - lo corregí, puedo volver a descargarlo), y este año 2016 tenía tendencia al alza!

El árbol se aferra a los datos de los TFs superiores, y hay esencialmente pocas estadísticas sobre ellos, y por eso puede haber un kazoon en la historia, cuando el vector de movimiento global cambia (2015 arriba y 2016 abajo) o hay un flat total (2017).

En cuanto a la plana, tenemos objetivos que trabajan la entrada en el mercado desde la plana, así como para la inversión, ¿podemos tratar de separarlos de alguna manera?

El piso está bien identificado por los predictores de tipo Levl, el único problema es que el árbol no puede conectarlos entre sí, al menos en un TF.

 

Has hecho un robot rentable ahí :)

Entrada en largo - sólo cuando se predice "1" (en azul), de los cuales >90% será beneficio (en verde).
Entrar en corto - sólo cuando se predice "-1" (en rojo), de los cuales de nuevo >90% será el beneficio (verde).
Las predicciones de "0" significan no abrir nuevas posiciones y esperar a un mejor momento, por lo que no importa en absoluto cuál es la precisión real antes de una predicción de esta clase.

Pero es mejor, por ejemplo, entrenar el bosque en el archivo de 2015, y comprobarlo en el archivo de 2016. Sólo falta una columna en 2015, debería quitarse también de 2016, para que no se confunda esa matraca.

 
Aleksey Vyazmikin:

¿Se puede representar la cifra en términos de probabilidades como antes?

No, se trata de un modo de aprendizaje de árboles diferente, adecuado sólo para 2 clases. O para la regresión.

 
SanSanych Fomenko:

Qué frescura hay - el reentrenamiento y nada más, no tiene ni un solo predictor que se relacione con su variable objetivo - todo ruido. Y se sienta en el traqueteo y en lugar de comprobar el ruido, publica archivos con basura aquí.

Sí, los objetivos no tienen una relación clara con los predictores, sólo muestran el resultado financiero de entrar en el mercado en un momento determinado.

Crees que el resultado será mejor si la lógica de las entradas está ligada a los indicadores de algunos de los predictores, es decir, si entramos en el cruce de МА, definimos el resultado (1 o -1) y damos información sobre el hecho del cruce de MA en los predictores?

 
Aleksey Vyazmikin:

El árbol se aferra a los datos de los TFs superiores, y hay pocas estadísticas sobre ellos, lo que puede llevar a un kazoon en la historia, cuando el vector de movimiento global cambia (2015 al alza y 2016 a la baja) o hay un plano total (2017).

En cuanto a la plana, tenemos objetivos que trabajan la entrada en el mercado desde la plana, así como para la inversión, ¿podemos tratar de separarlos de alguna manera?

El piso está bien identificado por predictores como Levl, el único problema es que el árbol no puede conectarlos, al menos en un TF.

Está claro que ya tenemos diferentes indicadores planos, pero el árbol no puede conectarlos entre sí. Entonces es probable que eso sea todo, es el límite de las posibilidades del árbol.

Ayer obtuve los resultados casi tan precisos, pero con menos número de entradas en las ofertas. Lo que tengo hoy no es mucho mejor. Algo ha fallado y voy a pensar qué ajustes se pueden corregir.

 
Aleksey Vyazmikin:

Sí, los objetivos no están claramente vinculados a los predictores, sólo muestran el resultado financiero de entrar en el mercado en un momento determinado.

¿Crees que el resultado será mejor si la lógica de las entradas está conectada con los indicadores de algunos de los predictores, es decir, si entramos en el cruce de la MA, determinamos el resultado (1 o -1) y si damos información sobre el hecho del cruce de la MA en los predictores?

Y esa es mi opinión: ¡la basura en la entrada es la basura en la salida! Son las primeras líneas de los libros de texto de estadística.

 
El Dr. Trader:

Has hecho un robot rentable ahí :)

Ir en largo sólo sería una predicción de "1" (en azul), de la cual >90% sería rentable (en verde).
Entrando en corto - sólo cuando se predice "-1" (en rojo), de los cuales de nuevo >90% será beneficio (en verde).
La predicción "0" significa no abrir nuevas posiciones y esperar un mejor momento, por lo que no importa realmente cuál es la precisión real en esta clase de predicción.

Pero es mejor, por ejemplo, entrenar el bosque en el archivo de 2015, y comprobarlo en el archivo de 2016. Sólo falta una columna en 2015, debería quitarse también de 2016, para que no se confunda esa matraca.

No construí nada - tomé un archivo listo y construí randomForest, pero fui demasiado perezoso para dividirlo en dos archivos. Alexey lo ha hecho por mí y ha mostrado un resultado demoledor, que cubre completamente mis "logros".

 
Dr. Trader:

Ah, ya veo, ya hay varios indicadores planos, pero el árbol no sabe cómo enlazarlos. Entonces es probable que eso sea todo, este es el límite de las capacidades del árbol.

Ayer obtuve casi los mismos resultados en términos de precisión, pero con un menor número de entradas en las ofertas. Lo que tengo hoy no es mucho mejor. Algo ha ido mal, voy a considerar qué ajustes se pueden corregir.

Sí, creo que necesitamos un árbol que pueda servir de ayuda, para mostrar las relaciones probables entre los predictores y para establecer las condiciones de las comparaciones probables para la toma de decisiones.

¿Cómo explicarle al árbol que la tendencia global es ascendente y descendente? Por supuesto, puedo utilizar la misma herramienta, dibujar un canal, hacer porcentajes, es decir, indicar claramente hacia dónde se dirige el vector de tendencia, pero el árbol puede simplemente ignorar este predictor, mientras que, en mi opinión, debería dividir todo el grupo en al menos dos según el vector de tendencia global.

No sé, quizá habría que ajustar (dividir en partes) la muestra de situaciones, entrenar sobre ella y luego identificar a la fuerza la misma tendencia global en el Expert Advisor y hacer caso a uno u otro árbol en función del vector.

 
SanSanych Fomenko:

Qué tiene que ver esto con mi opinión: ¡basura que entra, basura que sale! Estas son las primeras líneas de los libros de texto de estadística.

No se trata de basura: la entrada es en realidad un conjunto de probabilidades de resultados de eventos, estas probabilidades están influenciadas por predictores, y la salida es el resultado de muchos eventos diferentes e independientes, aunque el resultado puede ser el mismo. Voy a pensar en la entrada clara y la eliminación de todas las variantes sin señal de entrada - será interesante ver el resultado. Aunque todavía no puedo obtener ninguna respuesta de los participantes aquí - ¿deberíamos marcar la entrada explícitamente en los predictores, si se utilizan diferentes estrategias de entrada?

 

Todos buscamos puntos de entrada, pero tal vez deberíamos intentar buscar un piso.

¿Tal vez alguien tenga un indicador/script para detectar los pisos en el historial?

Creo que podemos tomar un canal de regresión con el rango de 100, desplazarlo en cada barra y si la pendiente es mayor/menor que X, podemos considerar que el área descrita por el canal es plana. ¿Qué te parece?

Razón de la queja: