Discusión sobre el artículo "Aprendizaje automático y Data Science (Parte 31): Uso de los modelos de inteligencia artificial CatBoost"
Echa un vistazo al nuevo artículo: Ciencia de Datos y ML (Parte 31): Uso de modelos de IA CatBoost para el trading.
Autor: Omega J Msigwa
y también existe el problema de exportar el modelo clasificador a ONNX
Nota
La etiqueta se infiere incorrectamente para la clasificación binaria. Se trata de un error conocido en la implementación de onnxruntime. Ignore el valor de este parámetro en caso de clasificación binaria.
Tengo una pequeña pregunta o preocupación que espero compartir.
Creo que el problema subyacente puede estar relacionado con lo que se describe aquí:
https://catboost.ai/docs/en/concepts/apply-onnx-ml
Particularidades:
Actualmente sólo se soportan modelos entrenados en conjuntos de datos sin características categóricas.
En el Jupyter Notebook catboost-4-trading.ipynb que he descargado, el código de ajuste del pipeline está escrito como:
pipe.fit(X_train, y_train, catboost__eval_set=(X_test, y_test))
Parece que se ha omitido el parámetro"catboost__cat_features=categorical_features", por lo que es posible que el modelo se haya entrenado sin especificar características categóricas.
Esto podría explicar por qué el modelo pudo guardarse como ONNX sin ningún problema.
Si este es el caso, entonces tal vez el método nativo de CatBoost"save_model" podría ser utilizado directamente, así:
model = pipe.named_steps['catboost']
model_filename = "CatBoost.EURUSD.OHLC.D1.onnx"
model.save_model(model_filename, format='onnx')
Espero que esta observación pueda ser útil.
- catboost.ai
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Usted acepta la política del sitio web y las condiciones de uso
Artículo publicado Aprendizaje automático y Data Science (Parte 31): Uso de los modelos de inteligencia artificial CatBoost:
CatBoost es una biblioteca de software de código abierto con algoritmos de "potenciador de gradientes" sobre árboles de decisión, diseñada específicamente para abordar los desafíos del manejo de características categóricas y datos en el aprendizaje automático.
Fue desarrollado por Yandex y se convirtió en código abierto en 2017. Lee más.
A pesar de haberse introducido recientemente en comparación con técnicas de aprendizaje automático como la regresión lineal o SVM, CatBoost ganó una popularidad masiva entre las comunidades de IA y llegó a la cima de los modelos de aprendizaje automático más utilizados en plataformas como Kaggle.
Lo que hizo que CatBoost ganara tanta atención es su capacidad de manejar automáticamente características categóricas en el conjunto de datos, lo que puede ser un desafío para muchos algoritmos de aprendizaje automático.
Autor: Omega J Msigwa