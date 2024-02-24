Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3283
He comparado la velocidad de entrenamiento de CatBoost en python y a través de la línea de comandos:
- 20% más rápido desde el inicio hasta guardar los modelos, incluyendo la lectura de las muestras
- 12% más rápido el proceso de aprendizaje en sí
Probado en el mismo modelo - el resultado del entrenamiento es idéntico.
Por supuesto, la línea de comandos es más rápida.
¿Sigues utilizando la línea de comandos para ejecutar EXEs?
Puedes ejecutarlos a través de WinExec e incluso optimizarlos en el probador.
No he probado Catboost, pero creo que se puede hacer algo.Otro posible problema, si el fichero modelo es enorme, puede tardar mucho en escribirse, es decir, el fichero ya existe, pero no se ha escrito hasta el final. Puede ser necesario hacer una pausa en el archivo o comprobar que el archivo no está cerrado de la lectura por el proceso de escritura....
Lo más difícil es determinar el momento en que termina el entrenamiento. Yo lo hago comprobando la aparición del fichero modelo en la carpeta agent_dir+"\model.bin" 1 vez por segundo. Dónde pone Catboost el fichero modelo - no lo sé, puede que tenga que buscarlo en otro sitio.
Yo ejecuto archivos bat - hasta ahora es la opción más conveniente para las tareas actuales.
Hasta ahora sólo hay una tarea para el lanzamiento automático de la formación después de obtener una muestra - búsqueda de reconocimiento. Planeo hacer un archivo bat automático para ello más adelante.
No he probado Catboost, pero creo que se nos puede ocurrir algo.
Lo más difícil es determinar el momento del fin del entrenamiento. Yo lo hago comprobando la aparición del fichero modelo en la carpeta agent_dir+"\model.bin" 1 vez por segundo. Dónde pone Catboost el fichero modelo - no lo sé, puede que tenga que buscarlo en otro sitio.Otro posible problema, si el fichero modelo es enorme, puede tardar mucho en escribirse, es decir, el fichero ya existe, pero no se ha escrito hasta el final. Puede que tenga que pausar el archivo o comprobar que no está cerrado a la lectura por el proceso de escritura....
Su solución es interesante - Voy a mirar, tal vez voy a tomar para su aplicación.
Pero creo que hay una posibilidad de obtener una respuesta final del programa ejecutable - Yo quería utilizar este enfoque.
Opción con archivos - si se ejecuta un bootnik, a continuación, de nuevo - sólo puede crear un nuevo archivo al final de la tarea.
¿Quizá la tasa de éxito relativa de las variantes -1 y 0 en el tamaño de la muestra del tren, y debería reducirse? En general, parece que Recall reacciona a esto.
En su opinión, ¿los resultados de estas combinaciones deberían ser comparables entre sí en nuestro caso? ¿O los datos están irremediablemente obsoletos?
He dividido la muestra del tren en 3 partes, he entrenado 3 conjuntos para la variante -1 y la variante 0, y también he entrenado sólo el tren original como tres muestras.
Esto es lo que obtuve.
Hice esta generalización PR=(Precisión-0,5)*Recuperación
Parece que el entrenamiento se produce a expensas de la 2ª y 3ª parte de la muestra del tren - ahora las he combinado y ejecutado el entrenamiento - a ver qué pasa.
Aún así, parece que no es un mal método para estimar la aleatoriedad del entrenamiento. Lo ideal sería que el entrenamiento tuviera un éxito relativo en cada segmento, de lo contrario no hay garantía de que el modelo deje de funcionar mañana.
Y aquí están los resultados - las dos últimas columnas
Efectivamente, los resultados han mejorado. Podemos suponer que cuanto mayor sea la muestra, mejor será el resultado del entrenamiento.
Deberíamos probar a entrenar con la 1ª y la 2ª parte de la muestra de entrenamiento - y si los resultados no son mucho peores que con la 2ª y la 3ª parte, entonces el factor de la frescura de la muestra puede considerarse menos significativo que el volumen.
He escrito muchas veces sobre el "poder predictivo de los predictores". que se calcula como la distancia entre dos vectores.
He encontrado una lista de herramientas para calcular la distancia:
Esta es además de la estándar, que tiene su propio conjunto de distancias
¿Puedes mostrarme un ejemplo de cómo usarlo?
Cuto, volvemos a no conocer el matstat
.
Esta es tu hora - haz brillar tus conocimientos - ¡desenmascara al ignorante!
Y en serio, mejor piensa en los resultados - publico gratis, aunque no me cuesta mucho.
