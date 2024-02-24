Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2114
Maxim, ¿cómo se configura esta cosa?
¿Qué es id_tl?
No sé, necesito un enlace.
tal vez el id_tl de los ejemplos transformados simplemente
Gracias. Todo salió bien.
Creo que es correcto - sólo entrenar convertir, porque en la prueba sólo va de control - así lo hice, pero el resultado es muy extraño - error logloss supera 1 en la muestra de prueba y crece - ¿cómo puede ser esto en absoluto - Estoy sorprendido.
puedes probar diferentes cosas, sólo para ver
aquí hay un buen cuaderno https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets
puede copiar y probar
Es el mismo artículo - no hay nada claro allí.
está copiado, te he dado un enlace al original.
Así que este es el original del artículo que estaba viendo en ruso.
Pero de qué sirve, de todos modos no hay información, el código fue arrancado.
Todo está perfectamente escrito allí. No tengo clases de desequilibrio, pero las hacía artificialmente, sólo para mirar
Resultó que el método "Tomek links" no iguala la muestra - redujo el número de líneas nulas de 4005 a 3402, por lo que pensé que no funcionaba.
Ajá. Primero hay que sobremuestrear y luego el volumen
Hasta ahora el sobremuestreo no da nada, pero el "tomo" ha mejorado un poco los resultados - significa que hay algo en los datos, lo principal es cavar bien.
Histograma de modelos con diferentes ajustes de cuantificación en la muestra.