Обсуждение статьи "Архитектура машинного обучения для MetaTrader 5 (Часть 11): Критерий Келли, интеграция правил проп-фирмы и динамический бэктест по CPCV"
Любопытно, почему вы выбрали CSCV/PBO, а не DSR для работы с ошибками отбора?
Было бы интересно узнать, что вы думаете по этому поводу.
Отличная статья, очень понравилась.
Любопытно, почему вы выбрали CSCV/PBO, а не DSR для работы с ошибками отбора?
Было бы интересно узнать, что вы думаете по этому поводу.
Это отличный вопрос, и я рад, что вы копаетесь в слое валидации - это то место, где большинство производственных систем тихо проваливаются.
Короткий ответ: Для оценкиодной динамически изменяемой стратегии, зависящей от пути, в различных исторических контекстах, CPCV + PBO были более прямым и подходящим диагностическим инструментом в этой статье (а не DSR).
Основная сила DSR: Коррекция множественного тестирования
Дефлированный коэффициент Шарпа (DSR) разработан для устранения ошибки отбора, когда вы проводите множество испытаний - например, тысячи комбинаций гиперпараметров или вариантов моделей - и затем выбираете наиболее эффективную. Он снижает наблюдаемый коэффициент Шарпа за счет учета количества независимых испытаний, дисперсии оценки Шарпа, ненормальности и длины выборки, что дает более реалистичную вероятность того, что заявленные результаты являются статистически значимыми, а не результатом везения.
Основное внимание в статье было уделеноне оптимизации гиперпараметров логики определения размеров. Вместо этого конвейер был представлен как фиксированная, интегрированная система:
- Этап-1: get_signal() ( доверительный контроль с коррекцией параллелизма)
- Этап-2: множитель Келли (с учетом вознаграждения)
- Динамическая калибровка проп-фирмы (с учетом бюджета).
Главный вопрос заключался в следующем: " Устойчив лиданный конкретный анализатор в различных исторических контекстах и при различных реализациях пути?". - а не "Какой из 5 000 сизеров работает лучше?".
Почему CPCV/PBO подходит для государственной, зависящей от пути стратегии
Динамически изменяемая стратегия по своей сути являетсягосударственной. Размер позиции вторника зависит от прибыли и убытков понедельника, которые, в свою очередь, зависят от всех предыдущих решений о размерах позиций и изменяющегося состояния счета (PropFirmAccountState). Таким образом, один исторический бэктест - это всего лишь одна случайная выборка из всего распределения возможных путей движения капитала.
- CPCV ( Combinatorial Purged Cross-Validation) генерирует это распределение, выполняя точно такую же логику над φ[N, k] комбинаторно очищенными путями, каждый из которых имеет свежеинициализированное состояние счета бар за баром. В результате получается "веер" кривой капитала, показанный на рисунке 5.
- ЗатемPBO ( Probability of Backtest Overfitting) количественно оценивает риск перебора этого распределения: "Если я выберу эту стратегию, основываясь на ее результатах в одном конкретном сплите/пути, какова вероятность того, что вне выборки она будет работать хуже, чем медиана по всем путям?".
PBO - естественный компаньон CPCV, поскольку он напрямую использует ту же комбинаторную структуру путей для аудитаодной модели/сайзера , а не корректирует смещение отбора по многим конкурирующим моделям.
Они дополняют друг друга, а не конкурируют
Я намеренно выбрал CPCV/PBO для этой статьи, потому что они соответствуют непосредственной задаче валидации. В полноценном производственном конвейере, включающем масштабную оптимизацию гиперпараметров (о чем говорилось в предыдущих частях серии), DSR остается важным финальным фильтром после выбора модели.
Надежный рабочий процесс, как правило, сочетает оба инструмента:
- ИспользуйтеCPCV/PBO на ранних этапах для стресс-тестирования интегрированноймодели + системы определения размеров на предмет зависимости от пути и стабильности.
- ПрименяйтеDSR в конце, после любых HPO по сигналам или параметрам, для защиты от предвзятости выбора в итоговых показателях.
Вы точно уловили нужный нюанс. Если бы рабочий процесс включал в себя поиск по сетке kelly_fraction, safety_factor или max_amplification по сотням точек, DSR стал бы критически важным, чтобы не быть обманутым самой удачной конфигурацией. Но чтобы ответить на конкретный вопрос - "Взорвет ли этот конкретный сайзер счет FundedNext в 20% параллельных вселенных?" - PBO, вычисленный по траекториям CPCV, является более острым, более целевым инструментом.
- 2026.04.06
- www.mql5.com
Это отличный вопрос, и я рад, что вы копаетесь в слое валидации - именно здесь большинство производственных систем терпят неудачу.
Короткий ответ: Для оценкиодной динамически изменяемой стратегии, зависящей от пути в различных исторических контекстах, CPCV + PBO был более прямым и подходящим диагностическим инструментом в этой статье (а не DSR).
Основная сила DSR: Коррекция множественного тестирования
Дефлированный коэффициент Шарпа (DSR) разработан для устранения ошибки отбора, когда вы проводите множество испытаний - например, тысячи комбинаций гиперпараметров или вариантов моделей - и затем выбираете наиболее эффективную. Он сглаживает наблюдаемое отношение Шарпа, учитывая количество независимых испытаний, дисперсию оценки Шарпа, ненормальность и длину выборки, что дает более реалистичную вероятность того, что заявленные результаты являются статистически значимыми, а не результатом везения.
Основное внимание в статье было уделеноне оптимизации гиперпараметров логики определения размеров. Вместо этого трубопровод был представлен как фиксированная, интегрированная система:
- Этап-1: get_signal() ( доверительный контроль с коррекцией параллелизма)
- Этап-2: множитель Келли (с учетом вознаграждения)
- Динамическая калибровка фирмы-производителя (с учетом бюджета)
Главный вопрос заключался в следующем: " Устойчив лиданный конкретный анализатор в различных исторических контекстах и при различных реализациях пути?". - а не "Какая из 5000 моделей лучше всего работает?".
Почему CPCV/PBO подходит для государственной, зависящей от пути стратегии
Динамически изменяемая стратегия по своей сути являетсягосударственной. Размер позиции вторника зависит от прибыли и убытков понедельника, которые, в свою очередь, зависят от всех предыдущих решений о размерах позиций и изменяющегося состояния счета (PropFirmAccountState). Поэтому один исторический бэктест - это всего лишь одна случайная выборка из всего распределения возможных путей движения капитала.
- CPCV ( Combinatorial Purged Cross-Validation) генерирует это распределение, выполняя точно такую же логику над φ[N, k] комбинаторно очищенными путями, каждый из которых имеет свежеинициализированное состояние счета бар за баром. В результате получается "веер" кривой капитала, показанный на рисунке 5.
- ЗатемPBO ( Probability of Backtest Overfitting) количественно оценивает риск перебора этого распределения: "Если я выберу эту стратегию, основываясь на ее результатах в одном конкретном сплите/пути, какова вероятность того, что вне выборки она будет работать хуже, чем медиана по всем путям?"
PBO - естественный спутник CPCV, поскольку он напрямую использует ту же комбинаторную структуру путей для аудитаодной модели/сайзера , а не корректирует смещение отбора по многим конкурирующим моделям.
Они дополняют друг друга, а не конкурируют
Я намеренно выбрал CPCV/PBO для этой статьи, потому что они соответствуют непосредственной задаче валидации. В полноценном производственном конвейере, включающем масштабную оптимизацию гиперпараметров (о чем говорилось в предыдущих частях серии), DSR остается важным финальным фильтром после отбора моделей.
Надежный рабочий процесс, как правило, сочетает оба инструмента:
- ИспользуйтеCPCV/PBO на ранних этапах для стресс-тестирования интегрированноймодели + системы определения размеров на предмет зависимости от пути и стабильности.
- ПрименяйтеDSR в конце, после любых HPO сигналов или параметров, чтобы избежать предвзятости отбора в итоговых показателях.
Вы точно уловили нужный нюанс. Если бы рабочий процесс включал в себя поиск по сетке kelly_fraction, safety_factor или max_amplification по сотням точек, DSR стал бы критически важным, чтобы не быть обманутым самой удачной конфигурацией. Но чтобы ответить на конкретный вопрос - "Взорвет ли этот конкретный сайзер счет FundedNext в 20% параллельных вселенных?" - PBO, вычисленный по траекториям CPCV, является более острым, более целевым инструментом.
Спасибо, что нашли время поделиться своими мыслями - я ценю это. Я вернулся и перечитал AFML, чтобы просмотреть все более внимательно, а также с вашим объяснением, и это помогло мне понять эту часть гораздо лучше.
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Вы принимаете политику сайта и условия использования
Опубликована статья Архитектура машинного обучения для MetaTrader 5 (Часть 11): Критерий Келли, интеграция правил проп-фирмы и динамический бэктест по CPCV:
У вас есть сигнал определения размера позиции из инструментария, представленного в Части 10. Сигнал учитывает уверенность, скорректирован с учётом одновременности сигналов и дискретизирован. Но он ещё не учитывает выплаты, не ограничен бюджетом и не проверен на комбинаторных путях. Остаются три конкретных пробела.
Во-первых, методы определения размера позиции из Части 10 рассматривают выигрыши и проигрыши симметрично. Стратегия, которая выигрывает три доллара на каждый проигранный доллар, требует принципиально иного распределения капитала, чем симметричная ставка с той же вероятностью, а get_signal не имеет механизма, чтобы выразить это. Во-вторых, ни один из методов AFML не включает жёсткий лимит просадки. Когда счёт проп-фирмы уже израсходовал 70% дневной допустимой потери, тот же модельный сигнал должен давать гораздо меньшую позицию, чем в начале дня, а статическая функция размера на это реагировать не может. В-третьих, одиночный бэктест стратегии с динамическим сайзингом даёт искажённое представление о результативности. Размер позиции на каждом баре зависит от истории P&L до этого бара, а она зависит от каждого предыдущего решения о размере; поэтому результат является функцией конкретного исторического пути не меньше, чем реального статистического преимущества стратегии.
Все три пробела устраняются здесь. После прочтения у вас будет: точное понимание того, когда критерий Келли должен заменять или дополнять get_signal, включая численную точку пересечения, где два метода расходятся, и пять структурных условий, которые Келли не может удовлетворить на реальных финансовых рынках; двухэтапная гибридная архитектура, в которой get_signal отвечает за определение размера сигнала с учётом уверенности и коррекцией по перекрытию, а множитель выплат Келли применяет асимметричную поправку выигрыша/проигрыша на втором этапе, сохраняя коррекцию перекрытия активных меток и добавляя то, что может выразить только Келли; слой риска проп-фирмы (PropFirmAwareSizer), в котором параметр сигмоиды w непрерывно калибруется по оставшемуся бюджету просадки согласно правилам FundedNext Stellar 2-Step, так что по мере расходования дневной или общей допустимой потери функция автоматически становится более пологой без пороговой логики или ручного вмешательства; и фреймворк динамического CPCV-бэктеста, моделирующий новое состояние счёта бар за баром через каждый из комбинаторных путей φ[N, k] и создающий распределение кривых капитала и аудит PBO вместо одного результата стандартного бэктеста, зависящего от пути. Для каждого компонента соответствующие разделы явно описывают практические ограничения.
Автор: Patrick Murimi Njoroge