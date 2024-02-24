Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3353
¡No hay otra forma de pensar! Utilizamos algoritmos de MO listos para usar que van acompañados de un conjunto de funciones adicionales. Todo junto se denomina "paquete".
¿Qué son las"probabilidades de clase reales"? Por ejemplo, la funcióndevuelve "probabilidades de clase estimadas". El algoritmo no puede contener otras probabilidades que no sean "estimaciones".
Parece que no se trata de la estimación puntual de la probabilidad, sino de su estimación por intervalos. Para matstat, este es un enfoque común - no sólo para obtener una estimación numérica específica de la probabilidad, sino también para obtener un intervalo en el que el verdadero valor de esta probabilidad estimada cae con una precisión dada (probabilidad). Aquí hay cierta dificultad de comprensión, porque el concepto de probabilidad participa de dos hipóstasis diferentes - tanto el valor estimado en sí como la precisión de su estimación. Y se trata de probabilidades bastante diferentes)
La cuestión no es qué puede hacer. Se trata de cómo obtener probabilidades de clase fiables. Para que pueda estar seguro de que con una probabilidad de clase de 0,8, el 80% de los casos se predicen correctamente. Y podrías usar un umbral, por ejemplo. La salida del clasificador no es cierta en la mayoría de los casos, repito otra vez. O sobreestiman o subestiman "por diseño". Por eso el umbral no funciona. Las probabilidades reales son cuando ni sobrestiman ni subestiman.
Eso no es lo que tienes. La cifra de 0,8 citada es una de las probabilidades de clase. Aquí tienes un histograma de las probabilidades de clase.
Y yo lo tengo exactamente así y de ninguna otra manera, porque si es de otra manera, significa sobreentrenamiento. Para mí, en un umbral fijo, el desajuste de error de predicción en el OOV y OOS y en el archivo VNE es el principal signo de sobreentrenamiento. El umbral me funciona bien. Y las "probabilidades reales" pertenecen al reino de la ficción que no tiene nada que ver con el código real y la terminología utilizada en este caso.
Se equivoca. la cifra de 0,8 indicada es uno de los valores de probabilidad de clase. aquí tiene un histograma de las probabilidades de clase.
¿Cómo te diste cuenta de que tu umbral funcionaba perfectamente?
Error de predicción de coincidencia en los ficheros ALE y OOS y en el fichero SNE
¿Cómo te diste cuenta de que el clasificador da las probabilidades correctas? No sólo los valores del intervalo. ¿Estás leyendo lo que te escriben?
Las probabilidades de los modelos vienen dadas por las estadísticas de la muestra de entrenamiento.
En consecuencia, sin una muestra representativa no son precisas, así que supéralo :)
O averiguas en qué consiste el modelo y vuelves a ponderar las hojas según el algoritmo que hayas ideado...
Las probabilidades del modelo vienen dadas por la sigmoidea, no por esto.
Sí, bueno, ¿qué número pones en la función, de dónde viene?