
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Опубликована статья Интерпретация моделей: Более глубокое понимание моделей машинного обучения:
Машинное обучение — сложная и полезная область для любого человека независимо от опыта. В этой статье мы погрузимся во внутренние механизмы, лежащие в основе создаваемых моделей, исследуем сложный мир функций, прогнозов и эффективных решений и получим четкое понимание интерпретации моделей. Научитесь искусству поиска компромиссов, улучшения прогнозов, ранжирования важности параметров и принятия надежных решений. Статья поможет вам повысить производительность моделей машинного обучения и извлечь больше пользы от применения методологий машинного обучения.
В этой статье наша цель — использовать древовидную модель с градиентным усилением (gradient boosted tree model), доступную в библиотеке CatBoost Python, для проведения ценового регрессионного анализа. Однако с самого начала возникает примечательная проблема, требующая более тщательного изучения модели. Прежде чем углубляться в применение методов объяснения "черного ящика" для нашей модели, необходимо осознать ограничения, присущие нашей модели "черного ящика", и обоснование блока объяснений (explainers) "черного ящика" в этом контексте.
Деревья с градиентным усилением демонстрируют хорошую производительность в задачах классификации. Тем не менее, они демонстрируют явные ограничения при применении к конкретным задачам регрессии временных рядов. Эти деревья, принадлежащие к семейству моделей машинного обучения, классифицируют входные данные по группам в зависимости от целевого значения. Впоследствии алгоритм вычисляет среднее целевое значение внутри каждой группы и использует эти средние значения группы для прогнозирования. Примечательно, что эти средние значения по группе, установленные во время обучения, остаются неизменными, пока не будет проведено дальнейшее обучение. Из этой фиксированной природы вытекает критический недостаток, поскольку деревьям с усилением градиента обычно сложно эффективно экстраполировать тренды. Когда модель сталкивается с входными значениями за пределами области обучения, она склонна к повторяющимся прогнозам, полагаясь на средние значения, полученные из известных групп, которые могут неточно отражать основную тенденцию за пределами наблюдаемого диапазона обучения.
Более того, модель предполагает, что схожие значения характеристик приведут к схожим целевым значениям, что противоречит нашему коллективному опыту торговли финансовыми инструментами. На финансовых рынках ценовые модели могут проявлять сходство, хотя и завершаются в разных точках. Это расхождение бросает вызов предположению модели о том, что генеративный процесс производит данные, попадающие в однородные группы. Следовательно, нарушение этих предположений вносит предвзятость в нашу модель.
Чтобы обосновать эти наблюдения, мы проведем демонстрацию для читателей, которые, возможно, не наблюдали самостоятельно это явление. Наша цель – обеспечить всестороннее понимание для всех читателей.
Автор: Gamuchirai Zororo Ndawana