Discusión sobre el artículo "Remuestreo avanzado y selección de modelos CatBoost con el método de fuerza bruta" - página 5
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Entonces es necesario promediar exactamente. De lo contrario será "diferente" en los nuevos datos.
No es necesario promediar exactamente. El muestreador ya tiene el promedio incorporado.
El muestreador GMM puede crear una mala muestra, con clases sesgadas, etc., el muestreo es aleatorio. ¿Tiene sentido tenerlo en cuenta?
definitivamente no necesitan promediar
El muestreador GMM puede crear una mala muestra, con clases sesgadas, etc., el muestreo es aleatorio. ¿Tiene sentido tenerlo en cuenta?
De forma similar, un bosque aleatorio crea un conjunto de árboles exitosos y no tan exitosos. Al promediar todos los modelos se obtienen mejores resultados con los nuevos datos que con un único árbol óptimo.
De forma similar, un bosque aleatorio crea un conjunto de árboles buenos y no tan buenos. Al promediar todos los modelos se obtienen mejores resultados con los datos nuevos que con un único árbol óptimo.
y si se componen varios bosques, habrá aproximadamente cero operaciones, las señales se solaparán.
y si compone varios andamios, las operaciones serán aproximadamente nulas, las señales se solaparán.
Varios (por ejemplo, 10) bosques de 100 es lo mismo que un bosque de 1000 árboles. Da muchas señales.
Unos cuantos (por ejemplo, 10) bosques de 100 es lo mismo que un bosque de 1000 árboles. Da muchas señales.
¿Alguna práctica? Ya lo he hecho antes. Las señales se vuelven pocas.
Si tienes una sangría de 0,5, sólo tienes que reducirla.
Estoy de acuerdo con eso, de todas formas no estaba teniendo suficiente. Y no entiendo muy bien por qué añadir modelos malos al azar. Componer geniales que se mejoran entre sí - otra conversación.
Es el promedio de todo lo que se necesita. Las descripciones básicas del principio de andamiaje lo dicen. Como si la multitud supiera más que un experto.
Hice esto con madera hace unos 2 años, entrenado 1000, tomó la mejor 10-50. No funcionó, al parecer el resultado en los nuevos datos no era muy bueno.
Es el promedio de todo en una fila lo que se necesita. Lo dicen las descripciones básicas del principio de andamiaje. Como si la multitud supiera más que un experto.