Discusión sobre el artículo "Gradient boosting (CatBoost) en las tareas de construcción de sistemas comerciales. Un enfoque ingenuo" - página 7
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Este enfoque es totalmente erróneo. No se puede generar un modelo basado en el mismo conjunto de datos de entrenamiento y de prueba, y luego decir que funciona. Se llama ajuste curvo del modelo. Tales modelos parecen buenos sobre el papel pero nunca funcionarán en el mundo real. Por favor, utilice el enfoque correcto para el aprendizaje automático, hay varias maneras de hacerlo, pero la suya es completamente errónea.
Creo que los dos estáis completamente equivocados, chicos. El artículo marcado como "enfoque ingenuo" es una introducción al modelo CatBoost. Nadie te prohíbe probar el modelo con nuevos datos. Además, al final del artículo se puede ver la prueba con nuevos datos y el periodo de aprendizaje.
Sólo tienes que leer un artículo con más cuidado, porque la siguiente parte en el camino.Debo haberme quemado los ojos mientras averiguaba lo que estás haciendo aquí, aunque todo es simple hasta el punto de lo imposible, pero sigue siendo difícil percibir los pensamientos de otra persona....
¿Qué puedo decir?
1) los signos definitivamente no son los mejores, hay un gran alcance.
2) no es necesario mezclar los datos antes de entrenar el clasificador (lo he comprobado).
3) lo realmente valioso es el objetivo, es lo que tira de todo el artículo (lo comparé con ZZ, ZZ es basura).
En general, el enfoque resultó ser el siguiente - al máximo todos "mover sólo para obtener un buen resultado en la validación"
Y seleccionamos el mejor modelo ))))
Y me las arreglé para "mover" de esta manera.
Pero, de hecho, es la misma manera que estaba hablando cuando optimicé los pesos de las neuronas, sólo que inmediatamente en el máximo beneficio "movido".
Bueno, no sé qué más escribir ...
Debo haberme quemado los ojos mientras averiguaba lo que estabas haciendo aquí, aunque todo es simple hasta el punto de la imposibilidad, pero sigue siendo difícil percibir los pensamientos de otra persona....
¿Qué puedo decir?
1) la señalización no es la mejor, hay un espacio enorme.
2) no es necesario barajar los datos antes de entrenar al clasificador (lo he comprobado).
3) lo realmente valioso es el objetivo, es el que tira de todo el artículo (comparado con ZZ, ZZ es basura)
En general, el planteamiento resultó ser el siguiente: "barajamos todo lo posible para obtener un buen resultado en la validación".
Y seleccionamos el mejor modelo ))))
Y me las arreglé para "mover" de esta manera.
Pero, de hecho, es la misma manera que yo estaba hablando cuando optimicé los pesos de neuronkey, sólo que yo estaba moviendo a la máxima ganancia.
Bueno, no se que mas escribir...
No funciona así sin GMM. Además no te has dado cuenta del intervalo tan corto en el que puedes entrenar y el tiempo que vive el modelo con datos nuevos. Ese no es el límite, hay formas de alargar la vida. Todo el enfoque es orgánico, no puedes separar las partes.
Sí, puedes probar otros más significativos. Úsalo, mejóralo
No funciona así sin GMM. Además, no has comprobado en qué intervalo corto puedes entrenar y cuánto tiempo vive el modelo con datos nuevos. Ese no es el límite, hay formas de alargar la vida. Todo el enfoque es orgánico UNO, no puedes separar las partes.
Sí, puedes probar otros más significativos. Úsalo, mejóralo
Lo probaré con gmm mañana.
Lo probaré con gmm mañana.
Oh, ese es el artículo sobre el que escribiste. Sí. Es un artículo introductorio para evitar que el lector se vaya completamente por las ramas.
Sí, pensé en repasarlo en orden
En general, sin Shuffle, el sistema comienza inmediatamente a drenar de forma esperada.
ahora puedes pasar al siguiente artículo