Обсуждение статьи "Архитектура машинного обучения для MetaTrader 5 (Часть 12): Калибровка вероятностей для финансового машинного обучения"

 

Опубликована статья Архитектура машинного обучения для MetaTrader 5 (Часть 12): Калибровка вероятностей для финансового машинного обучения:

Классификаторы на основе деревьев обычно чрезмерно уверены: истинные доли выигрышей около 0,55 отображаются как 0,65–0,80 и завышают размеры позиций и доли Келли. В этой статье представлены afml.calibration и CalibratorCV, которые генерируют прогнозы вне обучающего фолда (OOF) через PurgedKFold и подбирают изотоническую регрессию или масштабирование Платта. Мы определяем оценку Брайера, ECE и MCE, а также показываем диагностику, которая прослеживает некалиброванность до размеров позиций, реализованного P&L и распределений Sharpe по путям CPCV для поддержки торговли без утечек и с корректным размером позиции.

Случайный лес, который прогнозирует вероятность 0,68 при фактической доле выигрышей 0,55, не просто неточен. Он систематически чрезмерно уверен, и эта чрезмерная уверенность напрямую попадает во все последующие расчёты размера позиции. Функция get_signal сопоставляет завышенную вероятность с более высоким z-score и, следовательно, с большей позицией. Доля Келли растёт вместе с прогнозной вероятностью. Даже небольшая перепостановка по Келли в каждой сделке в итоге разрушит банкролл, который выдержал бы те же сделки при корректном размере позиции.

Симптомы проявляются только на кривой средств. Стратегия, которая выглядит хорошо сбалансированной в бэктесте с исходными вероятностями, будет систематически открывать позиции крупнее, чем на самом деле подтверждают данные. Это приводит к более глубоким просадкам и более низкому геометрическому росту, чем у корректно откалиброванной версии той же стратегии.

В этой статье мы рассматриваем модуль afml.calibration и его роль в конвейере. Вы узнаете: (1) почему классификаторы на основе деревьев склонны к чрезмерной уверенности и как это видно на диаграмме надёжности; (2) что измеряют оценка Брайера, ECE и MCE; (3) когда использовать изотоническую регрессию вместо масштабирования Платта; (4) как калибровать без временной утечки, используя внефолдовые прогнозы из PurgedKFold; и (5) как некалиброванность распространяется от вероятностей к размерам позиций, P&L и распределениям Sharpe по путям CPCV.


Автор: Patrick Murimi Njoroge