Обсуждение статьи "Архитектура машинного обучения для MetaTrader 5 (Часть 11): Критерий Келли, интеграция правил проп-фирмы и динамический бэктест по CPCV"

MetaQuotes 2026.05.23 15:41

Опубликована статья Архитектура машинного обучения для MetaTrader 5 (Часть 11): Критерий Келли, интеграция правил проп-фирмы и динамический бэктест по CPCV:

Сигнал определения размера позиции из Части 10 скорректирован с учётом одновременности сигналов, но не учитывает соотношение выигрыша и проигрыша, не реагирует на жёсткий бюджет просадки и не валидируется по комбинаторным путям. В этой статье рассматриваются три дополнения: двухэтапная архитектура, в которой множитель выплат Келли применяется поверх get_signal, сохраняя коррекцию перекрытия активных меток и добавляя асимметрию выигрыша/проигрыша; слой интеграции с проп-фирмой, который непрерывно калибрует параметр сигмоиды w по оставшемуся бюджету просадки в правилах FundedNext Stellar 2-Step; и CPCV-фреймворк бэктеста, который моделирует заново инициализированное состояние счёта по всем путям φ[N, k], формируя распределение коэффициента Шарпа и выполняя аудит PBO.

У вас есть сигнал определения размера позиции из инструментария, представленного в Части 10. Сигнал учитывает уверенность, скорректирован с учётом одновременности сигналов и дискретизирован. Но он ещё не учитывает выплаты, не ограничен бюджетом и не проверен на комбинаторных путях. Остаются три конкретных пробела.

Во-первых, методы определения размера позиции из Части 10 рассматривают выигрыши и проигрыши симметрично. Стратегия, которая выигрывает три доллара на каждый проигранный доллар, требует принципиально иного распределения капитала, чем симметричная ставка с той же вероятностью, а get_signal не имеет механизма, чтобы выразить это. Во-вторых, ни один из методов AFML не включает жёсткий лимит просадки. Когда счёт проп-фирмы уже израсходовал 70% дневной допустимой потери, тот же модельный сигнал должен давать гораздо меньшую позицию, чем в начале дня, а статическая функция размера на это реагировать не может. В-третьих, одиночный бэктест стратегии с динамическим сайзингом даёт искажённое представление о результативности. Размер позиции на каждом баре зависит от истории P&L до этого бара, а она зависит от каждого предыдущего решения о размере; поэтому результат является функцией конкретного исторического пути не меньше, чем реального статистического преимущества стратегии.

Все три пробела устраняются здесь. После прочтения у вас будет: точное понимание того, когда критерий Келли должен заменять или дополнять get_signal, включая численную точку пересечения, где два метода расходятся, и пять структурных условий, которые Келли не может удовлетворить на реальных финансовых рынках; двухэтапная гибридная архитектура, в которой get_signal отвечает за определение размера сигнала с учётом уверенности и коррекцией по перекрытию, а множитель выплат Келли применяет асимметричную поправку выигрыша/проигрыша на втором этапе, сохраняя коррекцию перекрытия активных меток и добавляя то, что может выразить только Келли; слой риска проп-фирмы (PropFirmAwareSizer), в котором параметр сигмоиды w непрерывно калибруется по оставшемуся бюджету просадки согласно правилам FundedNext Stellar 2-Step, так что по мере расходования дневной или общей допустимой потери функция автоматически становится более пологой без пороговой логики или ручного вмешательства; и фреймворк динамического CPCV-бэктеста, моделирующий новое состояние счёта бар за баром через каждый из комбинаторных путей φ[N, k] и создающий распределение кривых капитала и аудит PBO вместо одного результата стандартного бэктеста, зависящего от пути. Для каждого компонента соответствующие разделы явно описывают практические ограничения.

Автор: Patrick Murimi Njoroge

Kittamet Sirinyamas 2026.04.10 08:59 #1

Отличная статья, очень понравилась.
Любопытно, почему вы выбрали CSCV/PBO, а не DSR для работы с ошибками отбора?
Было бы интересно узнать, что вы думаете по этому поводу.

Patrick Murimi Njoroge 2026.04.12 14:43 #2

Kittamet Sirinyamas #:
Отличная статья, очень понравилась.
Любопытно, почему вы выбрали CSCV/PBO, а не DSR для работы с ошибками отбора?
Было бы интересно узнать, что вы думаете по этому поводу.

Это отличный вопрос, и я рад, что вы копаетесь в слое валидации - это то место, где большинство производственных систем тихо проваливаются.

Короткий ответ: Для оценкиодной динамически изменяемой стратегии, зависящей от пути, в различных исторических контекстах, CPCV + PBO были более прямым и подходящим диагностическим инструментом в этой статье (а не DSR).

Основная сила DSR: Коррекция множественного тестирования
Дефлированный коэффициент Шарпа (DSR) разработан для устранения ошибки отбора, когда вы проводите множество испытаний - например, тысячи комбинаций гиперпараметров или вариантов моделей - и затем выбираете наиболее эффективную. Он снижает наблюдаемый коэффициент Шарпа за счет учета количества независимых испытаний, дисперсии оценки Шарпа, ненормальности и длины выборки, что дает более реалистичную вероятность того, что заявленные результаты являются статистически значимыми, а не результатом везения.

Основное внимание в статье было уделеноне оптимизации гиперпараметров логики определения размеров. Вместо этого конвейер был представлен как фиксированная, интегрированная система:

Этап-1: get_signal() ( доверительный контроль с коррекцией параллелизма)
Этап-2: множитель Келли (с учетом вознаграждения)
Динамическая калибровка проп-фирмы (с учетом бюджета).

Главный вопрос заключался в следующем: " Устойчив лиданный конкретный анализатор в различных исторических контекстах и при различных реализациях пути?". - а не "Какой из 5 000 сизеров работает лучше?".

Почему CPCV/PBO подходит для государственной, зависящей от пути стратегии
Динамически изменяемая стратегия по своей сути являетсягосударственной. Размер позиции вторника зависит от прибыли и убытков понедельника, которые, в свою очередь, зависят от всех предыдущих решений о размерах позиций и изменяющегося состояния счета (PropFirmAccountState). Таким образом, один исторический бэктест - это всего лишь одна случайная выборка из всего распределения возможных путей движения капитала.

CPCV ( Combinatorial Purged Cross-Validation) генерирует это распределение, выполняя точно такую же логику над φ[N, k] комбинаторно очищенными путями, каждый из которых имеет свежеинициализированное состояние счета бар за баром. В результате получается "веер" кривой капитала, показанный на рисунке 5.
ЗатемPBO ( Probability of Backtest Overfitting) количественно оценивает риск перебора этого распределения: "Если я выберу эту стратегию, основываясь на ее результатах в одном конкретном сплите/пути, какова вероятность того, что вне выборки она будет работать хуже, чем медиана по всем путям?".

PBO - естественный компаньон CPCV, поскольку он напрямую использует ту же комбинаторную структуру путей для аудитаодной модели/сайзера , а не корректирует смещение отбора по многим конкурирующим моделям.

Они дополняют друг друга, а не конкурируют
Я намеренно выбрал CPCV/PBO для этой статьи, потому что они соответствуют непосредственной задаче валидации. В полноценном производственном конвейере, включающем масштабную оптимизацию гиперпараметров (о чем говорилось в предыдущих частях серии), DSR остается важным финальным фильтром после выбора модели.

Надежный рабочий процесс, как правило, сочетает оба инструмента:

ИспользуйтеCPCV/PBO на ранних этапах для стресс-тестирования интегрированноймодели + системы определения размеров на предмет зависимости от пути и стабильности.
ПрименяйтеDSR в конце, после любых HPO по сигналам или параметрам, для защиты от предвзятости выбора в итоговых показателях.

Вы точно уловили нужный нюанс. Если бы рабочий процесс включал в себя поиск по сетке kelly_fraction, safety_factor или max_amplification по сотням точек, DSR стал бы критически важным, чтобы не быть обманутым самой удачной конфигурацией. Но чтобы ответить на конкретный вопрос - "Взорвет ли этот конкретный сайзер счет FundedNext в 20% параллельных вселенных?" - PBO, вычисленный по траекториям CPCV, является более острым, более целевым инструментом.

MetaTrader 5 Machine Learning Blueprint (Part 11): Kelly Criterion, Prop Firm Integration, and CPCV Dynamic Backtesting

2026.04.06
www.mql5.com

The bet-sizing signal from Part 10 is concurrency-corrected but carries no payoff-ratio adjustment, no response to a hard drawdown budget, and no validation across combinatorial paths. This article covers three additions: a two-stage architecture in which a Kelly payoff multiplier is applied on top of get_signal, preserving the concurrency correction while incorporating win/loss asymmetry; a prop firm integration layer that calibrates the sigmoid w parameter continuously from the remaining drawdown budget under FundedNext Stellar 2-Step rules; and a CPCV backtest framework that simulates a fresh account state across all φ[N, k] paths, producing a Sharpe distribution and a PBO audit.

Машинное обучение и нейронные Статистика антисетевой системы Разговор с искусственным интеллектом

Kittamet Sirinyamas 2026.04.15 13:10 #3

Patrick Murimi Njoroge #:

Это отличный вопрос, и я рад, что вы копаетесь в слое валидации - именно здесь большинство производственных систем терпят неудачу.

Короткий ответ: Для оценкиодной динамически изменяемой стратегии, зависящей от пути в различных исторических контекстах, CPCV + PBO был более прямым и подходящим диагностическим инструментом в этой статье (а не DSR).

Основная сила DSR: Коррекция множественного тестирования
Дефлированный коэффициент Шарпа (DSR) разработан для устранения ошибки отбора, когда вы проводите множество испытаний - например, тысячи комбинаций гиперпараметров или вариантов моделей - и затем выбираете наиболее эффективную. Он сглаживает наблюдаемое отношение Шарпа, учитывая количество независимых испытаний, дисперсию оценки Шарпа, ненормальность и длину выборки, что дает более реалистичную вероятность того, что заявленные результаты являются статистически значимыми, а не результатом везения.

Основное внимание в статье было уделеноне оптимизации гиперпараметров логики определения размеров. Вместо этого трубопровод был представлен как фиксированная, интегрированная система:

Этап-1: get_signal() ( доверительный контроль с коррекцией параллелизма)
Этап-2: множитель Келли (с учетом вознаграждения)
Динамическая калибровка фирмы-производителя (с учетом бюджета)

Главный вопрос заключался в следующем: " Устойчив лиданный конкретный анализатор в различных исторических контекстах и при различных реализациях пути?". - а не "Какая из 5000 моделей лучше всего работает?".

Почему CPCV/PBO подходит для государственной, зависящей от пути стратегии
Динамически изменяемая стратегия по своей сути являетсягосударственной. Размер позиции вторника зависит от прибыли и убытков понедельника, которые, в свою очередь, зависят от всех предыдущих решений о размерах позиций и изменяющегося состояния счета (PropFirmAccountState). Поэтому один исторический бэктест - это всего лишь одна случайная выборка из всего распределения возможных путей движения капитала.

CPCV ( Combinatorial Purged Cross-Validation) генерирует это распределение, выполняя точно такую же логику над φ[N, k] комбинаторно очищенными путями, каждый из которых имеет свежеинициализированное состояние счета бар за баром. В результате получается "веер" кривой капитала, показанный на рисунке 5.
ЗатемPBO ( Probability of Backtest Overfitting) количественно оценивает риск перебора этого распределения: "Если я выберу эту стратегию, основываясь на ее результатах в одном конкретном сплите/пути, какова вероятность того, что вне выборки она будет работать хуже, чем медиана по всем путям?"

PBO - естественный спутник CPCV, поскольку он напрямую использует ту же комбинаторную структуру путей для аудитаодной модели/сайзера , а не корректирует смещение отбора по многим конкурирующим моделям.

Надежный рабочий процесс, как правило, сочетает оба инструмента:

ИспользуйтеCPCV/PBO на ранних этапах для стресс-тестирования интегрированноймодели + системы определения размеров на предмет зависимости от пути и стабильности.
ПрименяйтеDSR в конце, после любых HPO сигналов или параметров, чтобы избежать предвзятости отбора в итоговых показателях.

Спасибо, что нашли время поделиться своими мыслями - я ценю это. Я вернулся и перечитал AFML, чтобы просмотреть все более внимательно, и с вашим объяснением, и это помогло мне понять эту часть гораздо лучше.

Patrick Murimi Njoroge 2026.04.21 22:28 #4

Kittamet Sirinyamas #:
Спасибо, что нашли время поделиться своими мыслями - я ценю это. Я вернулся и перечитал AFML, чтобы просмотреть все более внимательно, а также с вашим объяснением, и это помогло мне понять эту часть гораздо лучше.

Я рад, что помог. Я начал писать эту серию из-за того, как много нюансов в AFML и как легко совершить концептуальные ошибки. Только после долгих экспериментов приходит осознание того, что не до конца понял, что имел в виду автор.

Закрытие половинных участков. Как Вам новое оформление Не могу понять зигзаг

Новый комментарий