Обсуждение статьи "Поэтапный отбор признаков на MQL5"

 

Опубликована статья Поэтапный отбор признаков на MQL5:

В этой статье мы представляем модифицированную версию поэтапного отбора признаков, реализованную в MQL5. Настоящий подход основан на методах, описанных Тимоти Мастерсом (Timothy Masters) в работе "Современных алгоритмах интеллектуального анализа данных на C++" и "CUDA C".

Традиционный поэтапный отбор признаков - это метод, используемый для определения оптимального подмножества переменных из большего числа потенциальных признаков для задачи машинного обучения. Этот процесс начинается с индивидуальной оценки каждого потенциального признака, чтобы выбрать наиболее перспективную переменную для включения в окончательную модель. Впоследствии дополнительные кандидаты проходят проверку на предмет их вклада в сочетании с уже отобранными, и это продолжается до тех пор, пока не будет достигнут целевой уровень прогнозирования или классификации результатов. 

В настоящей статье мы рассмотрим ограничения традиционного поэтапного отбора признаков, такие как его потенциальная возможность переобучения и проблемы с фиксацией взаимодействий между признаками. Затем мы представляем усовершенствованный алгоритм, предназначенный для решения этих проблем, реализованный на MQL5, который обеспечивает гибкую интеграцию с различными контролируемыми методами обучения. 

Этот усовершенствованный подход разработан Тимоти Мастерсом и описан в его книге "Современные алгоритмы интеллектуального анализа данных на C++ и CUDA C». Наконец, мы демонстрируем практическое применение алгоритма, используя его для выбора оптимальных переменных для задачи выборочной регрессии, иллюстрируя его эффективность.


Автор: Francis Dube