Обсуждение статьи "Преодоление ограничений машинного обучения (Часть 8): Непараметрический выбор стратегии"

 

Опубликована статья Преодоление ограничений машинного обучения (Часть 8): Непараметрический выбор стратегии:

В этой статье показано, как настроить модель "черного ящика" для автоматического выявления сильных торговых стратегий, используя подход, основанный на данных. Используя взаимную информацию для определения приоритетов наиболее удобных для изучения сигналов, мы можем создавать более интеллектуальные и адаптивные модели, превосходящие традиционные методы. Читатели также научатся избегать распространенные подводные камни, такие как чрезмерное доверие к показателям поверхностного уровня, а вместо этого разрабатывать стратегии, основанные на значимой статистической информации.

В своем предыдущем обсуждении, посвященном автоматическому выбору стратегии мы рассмотрели два подхода к определению торговых стратегий из списка стратегий-кандидатов. Первым был метод "белого ящика", использующий матричную факторизацию - простой, прозрачный и интуитивно понятный. Сегодня мы сосредоточимся на повышении эффективности второго подхода: более сложного решения "черного ящика".

Проблема определения прибыльных стратегий остается значимой. Данная статья посвящена улучшению конфигурации и настройки моделей "черного ящика". Ранее мы разработали статистическую модель, которая научилась предсказывать ожидаемую прибыль от каждой стратегии, направляя нас к потенциально прибыльным стратегиям. Хотя это вполне действительная цель, более простой альтернативой было бы определить стратегию, которой наша модель "черного ящика" может научиться наиболее эффективно, - выбрать цель, на которой она работает “наилучшим образом”. Но это создает серьезный вызов.

Сравнение эффективности работы модели по различным целям регрессии является непростой задачей. В отличие от задач классификации, где такие показатели, как точность или прецизионность, упрощают сравнение, регрессия имеет дело с реальными целями, такими как будущая доходность, а общие показатели, такие как квадратный корень из среднего квадратичной ошибки (RMSE), могут вводить в заблуждение. Проблема заключается в том, что общепринятая Евклидова метрика дисперсии чувствительна к масштабу. А это означает, что такие индикаторы, как стохастик и значения скользящих средних, напрямую не сопоставимы. В дополнение к этой проблеме классическое обучение под наблюдением дает здесь мало помогает.


Автор: Gamuchirai Zororo Ndawana