Discusión sobre el artículo "Gradient boosting (CatBoost) en las tareas de construcción de sistemas comerciales. Un enfoque ingenuo" - página 7

 
Este enfoque es totalmente erróneo. No se puede generar un modelo basado en el mismo conjunto de datos de entrenamiento y de prueba, y luego decir que funciona. Se llama ajuste curvo del modelo. Tales modelos parecen buenos sobre el papel pero nunca funcionarán en el mundo real. Por favor, utilice el enfoque correcto para el aprendizaje automático, hay varias maneras de hacerlo, pero la suya es completamente errónea.
[Eliminado]  
Jacob James:
Este enfoque es totalmente erróneo. No se puede generar un modelo basado en el mismo conjunto de datos de entrenamiento y de prueba, y luego decir que funciona. Se llama ajuste curvo del modelo. Tales modelos parecen buenos sobre el papel pero nunca funcionarán en el mundo real. Por favor, utilice el enfoque correcto para el aprendizaje automático, hay varias maneras de hacerlo, pero la suya es completamente errónea.

Creo que los dos estáis completamente equivocados, chicos. El artículo marcado como "enfoque ingenuo" es una introducción al modelo CatBoost. Nadie te prohíbe probar el modelo con nuevos datos. Además, al final del artículo se puede ver la prueba con nuevos datos y el periodo de aprendizaje.

Sólo tienes que leer un artículo con más cuidado, porque la siguiente parte en el camino.
 
Maxim Dmitrievsky:

Debo haberme quemado los ojos mientras averiguaba lo que estás haciendo aquí, aunque todo es simple hasta el punto de lo imposible, pero sigue siendo difícil percibir los pensamientos de otra persona....

¿Qué puedo decir?

1) los signos definitivamente no son los mejores, hay un gran alcance.

2) no es necesario mezclar los datos antes de entrenar el clasificador (lo he comprobado).

3) lo realmente valioso es el objetivo, es lo que tira de todo el artículo (lo comparé con ZZ, ZZ es basura).


En general, el enfoque resultó ser el siguiente - al máximo todos "mover sólo para obtener un buen resultado en la validación"

Y seleccionamos el mejor modelo ))))

Y me las arreglé para "mover" de esta manera.

Pero, de hecho, es la misma manera que estaba hablando cuando optimicé los pesos de las neuronas, sólo que inmediatamente en el máximo beneficio "movido".

Bueno, no sé qué más escribir ...

[Eliminado]  
mytarmailS:

Debo haberme quemado los ojos mientras averiguaba lo que estabas haciendo aquí, aunque todo es simple hasta el punto de la imposibilidad, pero sigue siendo difícil percibir los pensamientos de otra persona....

¿Qué puedo decir?

1) la señalización no es la mejor, hay un espacio enorme.

2) no es necesario barajar los datos antes de entrenar al clasificador (lo he comprobado).

3) lo realmente valioso es el objetivo, es el que tira de todo el artículo (comparado con ZZ, ZZ es basura)


En general, el planteamiento resultó ser el siguiente: "barajamos todo lo posible para obtener un buen resultado en la validación".

Y seleccionamos el mejor modelo ))))

Y me las arreglé para "mover" de esta manera.

Pero, de hecho, es la misma manera que yo estaba hablando cuando optimicé los pesos de neuronkey, sólo que yo estaba moviendo a la máxima ganancia.

Bueno, no se que mas escribir...

No funciona así sin GMM. Además no te has dado cuenta del intervalo tan corto en el que puedes entrenar y el tiempo que vive el modelo con datos nuevos. Ese no es el límite, hay formas de alargar la vida. Todo el enfoque es orgánico, no puedes separar las partes.

Sí, puedes probar otros más significativos. Úsalo, mejóralo

 
Maxim Dmitrievsky:

No funciona así sin GMM. Además, no has comprobado en qué intervalo corto puedes entrenar y cuánto tiempo vive el modelo con datos nuevos. Ese no es el límite, hay formas de alargar la vida. Todo el enfoque es orgánico UNO, no puedes separar las partes.

Sí, puedes probar otros más significativos. Úsalo, mejóralo

Lo probaré con gmm mañana.

[Eliminado]  
mytarmailS:

Lo probaré con gmm mañana.

Oh, ese es el artículo que escribiste. Entonces sí. Es uno introductorio, para no volar completamente la mente del lector.
 
Maxim Dmitrievsky:
Oh, ese es el artículo sobre el que escribiste. Sí. Es un artículo introductorio para evitar que el lector se vaya completamente por las ramas.

Sí, pensé en repasarlo en orden

 
En general, sin Shuffle, el sistema comienza inmediatamente a drenarse de forma esperada.
[Eliminado]  
Александр:
En general, sin Shuffle, el sistema comienza inmediatamente a drenar de forma esperada.

ahora puedes pasar al siguiente artículo

 
O lo hago yo mismo, o utilizo lo que me proporcionas. Hay los siguientes errores.