Обсуждение статьи "Ординальное кодирование номинальных переменных"

 

Опубликована статья Ординальное кодирование номинальных переменных:

В настоящей статье мы обсудим и продемонстрируем, как преобразовать номинальные предикторы в числовые форматы, подходящие для алгоритмов машинного обучения, используя как Python, так и MQL5.

Номинальные переменные представляют собой категориальные данные, в которых между категориями не существует присущего им порядка или ранга. Примеры, относящиеся к наборам данных финансовых временных рядов, могут включать:

  • Типы ценовых баров (например, пин-бар, волчок, молот)
  • Дни недели (например, понедельник, вторник, среда)

Эти переменные являются чисто качественными, что означает отсутствие подразумеваемой иерархии или последовательности между категориями. Например, формирование пин-бара по своей сути не превосходит волчок, а бычий бар не лучше медвежьего бара.

В числовых вычислениях обычной практикой является отнесение произвольных целых чисел к различным категориям. Однако, если эти целые числа используются в качестве входных данных для алгоритма машинного обучения, существует риск того, что присвоенные значения могут исказить информацию, передаваемую исходными данными. Алгоритм может ошибочно предположить, что большие значения подразумевают определенную взаимосвязь или ранжирование, даже если это не было задумано.


Автор: Francis Dube