Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2114

 
Aleksey Vyazmikin:

Maxim, ¿cómo se configura esta cosa?

¿Qué es id_tl?

No sé, necesito un enlace.

tal vez el id_tl de los ejemplos transformados simplemente

 
Aleksey Vyazmikin:

Gracias. Todo salió bien.

Creo que es correcto - sólo entrenar convertir, porque en la prueba sólo va de control - así lo hice, pero el resultado es muy extraño - error logloss supera 1 en la muestra de prueba y crece - ¿cómo puede ser esto en absoluto - Estoy sorprendido.

puedes probar diferentes cosas, sólo para ver

aquí hay un buen cuaderno https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

puede copiar y probar

Resampling strategies for imbalanced datasets
Resampling strategies for imbalanced datasets
  • www.kaggle.com
Explore and run machine learning code with Kaggle Notebooks | Using data from Porto Seguro’s Safe Driver Prediction
 
Maxim Dmitrievsky:

No sé, necesito un enlace.

Probablemente la idiosincrasia de los ejemplos transformados sólo

Es el mismo artículo - no hay nada claro allí.

 
Aleksey Vyazmikin:

Sigue siendo el mismo artículo - no hay nada claro allí.

está copiado, te he dado un enlace al original.

 
Maxim Dmitrievsky:

puedes probar diferentes cosas, sólo para ver

aquí hay un buen cuaderno https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

puede copiar y comprobar.

Así que este es el original del artículo que estaba viendo en ruso.

 
Maxim Dmitrievsky:

es copyedit, te he dado un enlace al original.

Pero de qué sirve, de todos modos no hay información, el código fue arrancado.

 
Aleksey Vyazmikin:

De qué sirve, sigue sin haber información, el código está arrancado.

Todo está perfectamente escrito allí. No tengo clases de desequilibrio, pero las hacía artificialmente, sólo para mirar

 
Maxim Dmitrievsky:

todo está perfectamente escrito allí. No tengo clases de desequilibrio, pero las he hecho artificialmente, sólo para ver


Resultó que el método "Tomek links" no iguala la muestra - redujo el número de líneas nulas de 4005 a 3402, por lo que pensé que no funcionaba.
 
Aleksey Vyazmikin:


Resultó que el método "Tomek links" no iguala la muestra - redujo el número de líneas nulas de 4005 a 3402, por eso pensé que no funcionaba.
Uh-huh. Tienes que hacer primero el sobremuestreo, luego el tomo
 
Maxim Dmitrievsky:
Ajá. Primero hay que sobremuestrear y luego el volumen

Hasta ahora el sobremuestreo no da nada, pero el "tomo" ha mejorado un poco los resultados - significa que hay algo en los datos, lo principal es cavar bien.

Histograma de modelos con diferentes ajustes de cuantificación en la muestra.


Razón de la queja: