Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1305

 

Cambio en el rendimiento en función del desplazamiento del umbral de "probabilidad" para la clasificación 0/1 de 0,45 a 0,65

Esencialmente, la precisión

Los histogramas muestran que el aumento de la precisión de la clasificación se produce de forma bastante suave con un cambio en el umbral de probabilidad para la clasificación, lo que no puede decirse de los beneficios.

Resulta que no sólo debemos considerar la eficacia de la clasificación, sino también estimar cómo se distribuye el beneficio entre las reglas (hojas) y cuál es su umbral de sensibilidad. En otras palabras, se mire como se mire, hay que sacar reglas individuales y darles una estimación.

 
elibrarius:
sierra)
Hay una confusión general sobre la terminología.

¿qué pasa con la validación cruzada? todos los sabbets están involucrados, por lo que la validación es mejor que la prueba.

De todos modos, sí, lo que sea. Mi prueba es la 2ª parte de la submuestra, pero entonces la llamaré validación

 
Aleksey Vyazmikin:

Cambio en el rendimiento en función del desplazamiento del umbral de "probabilidad" para la clasificación 0/1 de 0,45 a 0,65

Esencialmente, la precisión

Los histogramas muestran que el aumento de la precisión de la clasificación se produce de forma bastante suave con un cambio en el umbral de probabilidad para la clasificación, lo que no puede decirse de los beneficios.

Resulta que no sólo debemos considerar la eficacia de la clasificación, sino también estimar cómo se distribuye el beneficio entre las reglas (hojas) y cuál es su umbral de sensibilidad. Se mire como se mire, hay que tirar de reglas individuales y estimarlas.

Los beneficios son menores en 0,65 porque hay menos operaciones. Por ejemplo, en lugar de 100, habrá 10 operaciones. Puede aumentar el lote

 
Aleksey Vyazmikin:

Cambio en el rendimiento en función del desplazamiento del umbral de "probabilidad" para la clasificación 0/1 de 0,45 a 0,65

Esencialmente, la precisión

Los histogramas muestran que el aumento de la precisión de la clasificación se produce de forma bastante suave con un cambio en el umbral de probabilidad para la clasificación, lo que no puede decirse de los beneficios.

Resulta que no sólo debemos considerar la eficacia de la clasificación, sino también estimar cómo se distribuye el beneficio entre las reglas (hojas) y cuál es su umbral de sensibilidad. Así que, da igual cómo lo hagas, tienes que sacar las normas individuales y darles una estimación.

Aumentar el umbral, cuando el modelo va mal habrá cada vez menos acuerdos en los nuevos datos, las probabilidades rodarán alrededor de cero, es un buen momento para el reentrenamiento

para elevar los umbrales, el error debe ser bajo, de lo contrario no habrá señales
 
elibrarius:

Los beneficios son menores a 0,65 porque también hay menos operaciones. Por ejemplo en lugar de 100 tendremos 10 operaciones. podemos aumentar el tamaño del lote.

El número de operaciones, y las operaciones rentables sólo varía bastante suavemente (una operación es una operación/2 por la lógica de MT)

La pérdida no es estable por operación, porque el stop loss no es fijo.

 
elibrarius:
sierra)
En general, la terminología es confusa

Propongo mi terminología (de momento me quedo con ella):

1. Muestra de entrenamiento - la que tiene lugar la creación del modelo

2. muestra de prueba: se utiliza para controlar la calidad del entrenamiento del modelo, incluida la interrupción del entrenamiento

3. muestra de examen: se utiliza para estimar la calidad del modelo, independientemente de la formación

 
Maxim Dmitrievsky:

Aumente el umbral, cuando el modelo se deteriore habrá cada vez menos operaciones con los nuevos datos, las probabilidades girarán en torno a cero, este es un buen momento para el reentrenamiento

Se necesita un error bajo para elevar los umbrales, de lo contrario no habrá ninguna señal

Sí, eso es comprensible. Es que las señales desaparecen por falta de conexiones de repetición en las hojas, sobre todo si su gran parte de activación total se movía cerca de 0,5 y se ve como 0,1+0,05+0,08+0,25+0,03 - una de las sumas se ha caído y ya está, no hay activación.

 
Aleksey Vyazmikin:

Eso es comprensible. Sólo las señales desaparecen debido a la falta de enlaces de reproducción en las hojas, especialmente si su gran parte de activación total giró en torno a 0,5, y parecía la suma de 0,1+0,05+0,08+0,25+0,03 - cayó una de las sumas y todo, no se produce la activación.

Significa que el algoritmo no se generaliza adecuadamente a los nuevos datos, es necesario retorcerlo más ) aproximadamente - reentrenado

 
Maxim Dmitrievsky:

10% de error por prueba y traza para ~10k ejemplos, aumenta suavemente con el incremento

a este error, los modelos comenzaron a trabajar con nuevos datos

en la validación de manera diferente, es cuestión de ir a través de las opciones

Ya no revelo algoritmos, sólo comunico

¡О! ¡Ese es el trato! ¡Casi como el mío! Te dije que no era necesario escuchar todo tipo de ales y magos :)

 
Maxim Dmitrievsky:

Significa que el algoritmo no generaliza bien a los nuevos datos, hay que retorcerlo más ) aproximadamente - reentrenado

Así que estoy dando vueltas y vueltas, no quiero engañarme :)

Ahora añadiré una nueva dosis de predictores...

Razón de la queja: