Discusión sobre el artículo "Codificación ordinal para variables nominales"

 

Artículo publicado Codificación ordinal para variables nominales:

En este artículo, analizamos y demostramos cómo convertir predictores nominales en formatos numéricos adecuados para algoritmos de aprendizaje automático, utilizando tanto Python como MQL5.

Las variables nominales representan datos categóricos donde no existe ningún orden o clasificación inherente entre las categorías. Algunos ejemplos específicos de conjuntos de datos de series temporales financieras podrían incluir:

  • Tipos de barras de precios (por ejemplo, pin bar, spinning top, hammer)
  • Días de la semana (por ejemplo, lunes, martes, miércoles)

Estas variables son puramente cualitativas, lo que significa que no existe ninguna jerarquía o secuencia implícita entre las categorías. Por ejemplo, una formación de pin bar no es inherentemente superior a una estrella giratoria (spinning top), ni una barra alcista es mejor que una barra bajista.

En computación numérica, es una práctica común asignar números enteros arbitrarios a categorías distintas. Sin embargo, si estos números enteros se utilizan como entradas para un algoritmo de aprendizaje automático, existe el riesgo de que los valores asignados distorsionen la información transmitida por los datos originales. El algoritmo podría inferir incorrectamente que valores mayores implican una cierta relación o clasificación, aun cuando no fuera esa la intención.


Autor: Francis Dube