¿Hay algún patrón en el caos? ¡Intentemos encontrarlo! Aprendizaje automático a partir de una muestra concreta. - página 16

 
Maxim Dmitrievsky #:

En una situación normal, la semilla no tiene casi ningún efecto, lo que importa es el algoritmo. Si hay que preocuparse por la semilla, los datos ya son basura.

comprobar con datos nuevos resuelve, si sólo hay 10 signos y no 1000, puedes estar seguro hasta cierto punto.

Creo que la profundidad por defecto es 6, tampoco afecta mucho, excepto para valores críticos.

La profundidad de aprendizaje afecta de forma diferente, dependiendo de la variabilidad histórica.

Sí, puede que en predictores de 4 semillas no afecte mucho. Se trata de un concepto erróneo. Es la semilla la que determina esencialmente cuántos predictores se utilizarán en el modelo.

Todos los parámetros se ven afectados. Sólo quería decir que usted probablemente tiene un orden de magnitud más combinaciones que ejemplos. Con 4 predictores puedo ver el sentido en un modelo de 1-3 árboles CB, con una tasa de aprendizaje de 0,3-0,5, de lo contrario ya está encajando.

 
Aleksey Vyazmikin #:

Puede intentar alimentar diferentes muestras para seguir aprendiendo con nuevos datos. Incluso CatBoost parece ser capaz de hacer esto. También sabe cómo fusionar modelos, pero no lo he investigado.

Es gradient bousting...

...lo que significa que aprende de los errores del anterior...

y sólo tenemos que entrenar en un modelo, y varias veces.

La única diferencia entre los modelos es que las muestras están desplazadas en el tiempo.

 
Renat Akhtyamov #:

es gradiente bousting.....

es decir, aprender de los errores del anterior

y sólo necesitamos entrenarnos en un modelo, y varias veces.

La única diferencia entre los modelos es que las muestras están desplazadas en el tiempo.

Mi cerebro no puede procesar lo que has escrito.

 
Aleksey Vyazmikin #:

Sí, puede que en 4 predictores la semilla no tenga mucho efecto. Es un concepto erróneo. De hecho, la semilla determina cuántos predictores se utilizarán en el modelo.

Todos los parámetros se ven afectados. Sólo quería decir que usted probablemente tiene un orden de magnitud más combinaciones que ejemplos. Con 4 predictores puedo ver el sentido en un modelo de 1-3 árboles CB, con una tasa de aprendizaje de 0,3-0,5, de lo contrario ya está ajustado.

La semilla no afecta en ningún sitio donde haya un óptimo normal

+- cortocircuito, no importa.

se puede retocar un poco, pero ya no es crucial

 
Maxim Dmitrievsky #:

la semilla no tiene efecto en ningún lugar donde haya un óptimo normal

+- cortocircuito, no desempeña ningún papel

Se puede ajustar un poco, pero no es crucial.

¿Dónde está?

 
Aleksey Vyazmikin #:

¿Y dónde está?

donde las variaciones sobre el tema de las semillas no afectan mucho al resultado, supongo )

 
Maxim Dmitrievsky #:

donde las variaciones sobre el tema de las semillas no afectan mucho al resultado, aparentemente )

Claramente no en nuestro caso...

 
Aleksey Vyazmikin #:

Obviamente no en nuestro caso.

Bueno, eso es algo que esperar.
 
Maxim Dmitrievsky #:
Bueno, hay algo que esperar.

Lo hay. Pero esto es hablar del mundo ideal, a veces es mejor adaptarse al existente.

 
Maxim Dmitrievsky #:
Se trata de saber si es mejor hurgar al azar o ceñirse a una información fiable a priori

Aparte de las horas de inicio y fin (sesiones, calendario) no se me ocurre nada. ¿A qué se refiere?

Razón de la queja: