Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3178

 
Aleksey Vyazmikin #:

No lo entiendo.

Una tarea sin sentido conocida puede obtenerse simplemente mezclando etiquetas al azar (o generándolas aleatoriamente con probabilidades iguales a la frecuencia de las clases).

La idea sigue siendo la misma: obtener una muestra amplia de los resultados de un gran número de problemas sin sentido intencionados para compararlos con el resultado del problema real. Si el resultado real no se encuentra en la cola de esta muestra, el método es bastante deficiente.

 
Maxim Dmitrievsky #:

Al menos lo he intentado.

¿Entiendes que en CatBoost existe la posibilidad de utilizar diferentes métodos de cuantificación de indicadores de predictores?

¿Crees, que simplemente los programadores han dejado tal posibilidad para aquellos que no tienen suficiente memoria operativa?

¿O los programadores se dan cuenta de que el resultado de la formación depende directamente de estas tablas?

Y al final - tome usted mismo y reorganice la configuración de las tablas y observe la variabilidad del resultado.

Entonces pensarás por qué ocurre esto y quizás empieces a entenderme mejor.


Y cualquier declaración en el estilo de un predicador / profeta / jurista no son informativos. Las interpreto como un deseo de presumir de mi persona.

 
Aleksey Nikolayev #:

Se puede obtener una tarea sin sentido simplemente barajando las etiquetas al azar (o generándolas aleatoriamente con probabilidades iguales a la frecuencia de las clases).

La idea es la misma: obtener una amplia muestra de los resultados de un gran número de tareas obviamente sin sentido para compararlas con el resultado de la tarea real. Si el resultado real no se encuentra en la cola de esta muestra, el método es bastante deficiente.

Quizá sea mejor "mezclar" para conservar la proporción de ceros y unos.

 
Aleksey Vyazmikin #:

¿Comprende por qué CatBoost tiene la opción de utilizar diferentes métodos para cuantificar las puntuaciones de los predictores?

¿Crees que simplemente los programadores han dejado esta posibilidad para aquellos que no tienen suficiente memoria operativa?

¿O los desarrolladores se dan cuenta de que el resultado del entrenamiento depende directamente de estas tablas?

Y al final - tome usted mismo y reorganizar la configuración de la tabla y ver la variabilidad del resultado.

Entonces usted va a pensar acerca de por qué sucede así, y tal vez usted comenzará a entenderme mejor.


Y cualquier declaración en el estilo de un predicador/profeta/jurídico no es informativa. Son interpretadas por mí como un deseo de presumir de su persona.

Se sugiere preguntar a los desarrolladores en su carro, porque no sé lo que hacen
 
Maxim Dmitrievsky #:
Se sugiere preguntar a los desarrolladores en su carrito

No lo haga. En caso de que respondan incorrectamente)

 
Aleksey Nikolayev #:

No lo hagas. Por si contestan mal)

😁😁
 
Maxim Dmitrievsky #:
Se sugiere preguntar a los desarrolladores en su carro, porque no sé lo que están haciendo

Pregúnteles a ellos, ya que usted no entiende.

Además, algunos impulsores hacen cuantificación de predictor después de cada split, cuantificando el resto.

Bueno, no soy el único que lo usa, los concursantes también mencionan a veces trabajos en este sentido.

En fin, no te voy a forzar más.

 
Aleksey Vyazmikin #:

Pregunte si no entiende.

Además, algunos reforzadores cuantifican el predictor después de cada división, cuantificando el resto.

Pues bien, no sólo yo lo utilizo, los participantes de concursos también mencionan a veces trabajos en este sentido.

En fin, no te voy a forzar más.

y por qué debo preguntar, si la conversión de flotas a ints es necesaria principalmente para la aceleración en datos muy grandes

La bonificación puede ser una pequeña calibración del modelo para bien o para mal, según la suerte.

simplemente te darán la misma respuesta, así que probablemente tengas miedo de preguntar porque devaluará todos tus años de duro trabajo :)

es hurgar en la ropa interior del algoritmo.
 
Maxim Dmitrievsky #:
El camino hilbertiano no te conducirá a tu ansiada meta. Vuestros esfuerzos se convertirán en diabluras, y encontraréis una ignominiosa matanza en lugar de un paraíso.

😁😁

 

Pregunté a los desarrolladores de boost qué hacer con la multicolinealidad y la selección de características (preprocesamiento).

Obtuve una respuesta inequívoca: tío, olvídalo :)

Razón de la queja: