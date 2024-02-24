Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3360
Lo siento, pero sin enlaces a bibliotecas, cuadernos o artículos, me lo sigo tomando más o menos así
Eh, todo lo que necesitas son paquetes...
Ojalá tuvieran bolsas.
Después de calibrar cualquier clasificador por el método CV, se puede ver inmediatamente el potencial de este modelo. Si no es capaz de nada, las probabilidades se agrupan en torno a 0,5 después de este procedimiento. Aunque antes era demasiado confiado. Seguir jugueteando con un modelo así no tiene ningún interés. No se puede mejorar. Es decir, ni siquiera puede calibrarse normalmente, no hay peces. Es muy cómodo.
No hay ningún "corte cuántico", en sus palabras, ningún rango o recipiente donde daría un beneficio probable.
Ok, por último, para cerrar el tema. Me las arreglé para exportar la calibración sigmoide a metac.
Dado: retrained gradient bousting, luego calibrado a este estado:
En el umbral de 0,5 todo es obvio, se puede ver dónde está el OOS:
Ejecuto umbral y detener la optimización:
Obtengo todo tipo de variaciones, la mejor en los umbrales 0,75-0,85. Incluso un poco en los nuevos datos es un poco fuera, aunque con un umbral de 0,5 no hay variantes normales.
Todo un juguete divertido.
Si te permite automatizar la selección de modelos, eso ya es bueno.
Yo tengo una visualización del modelo por su índice de probabilidad-confianza con un paso de 0,05 y ahí lo veo todo a la primera. Lo principal es la transformación del resultado sobre la muestra de entrenamiento y otras - ahí las probabilidades se arrastran, por eso hablo de no representatividad. Por eso veo la calibración como una medida ineficaz en nuestro caso. Si no hay un fuerte sesgo de muestra a muestra en sus modelos, es bastante sorprendente.
Y, observaré que sólo un modelo poco entrenado producirá probabilidades en un rango estrecho.
Un modelo entrenado normalmente se encontrará a menudo precisamente en las zonas de fuerte confianza - por eso tiene sentido establecer no un umbral de clasificación, sino una ventana - por ejemplo, de 0,55 a 0,65 considerar la clase devuelta como una unidad, e ignorar el resto. En los extremos, el modelo tiene confianza, pero a menudo hay muy pocas observaciones, por lo que la significación estadística es pequeña.
