Обсуждение статьи "Статистический арбитраж на основе коинтегрированных акций (Часть 7): Система оценки 2"

 

Опубликована статья Статистический арбитраж на основе коинтегрированных акций (Часть 7): Система оценки 2:

В данной статье описываются два дополнительных критерия оценки, используемых при отборе корзин акций для торговли в стратегиях возврата к среднему, а точнее — в статистическом арбитраже на основе коинтеграции. Данная статья дополняет предыдущую публикацию, в которой были представлены показатели ликвидности и силы векторов коинтеграции, а также стратегические критерии — временной интервал и период ретроспективы, — за счет включения показателей стабильности векторов коинтеграции и времени возврата к среднему значению (полупериод). В статье приведены результаты бэктеста с применением новых фильтров с комментариями, а также предоставлены файлы, необходимые для его воспроизведения.

Для тех читателей, кто, возможно, не следит за этой серией статей: мы разрабатываем систему статистического арбитража для обычного розничного трейдера, располагающего обычным ноутбуком, ограниченными средствами и стандартной скоростью интернет-соединения. Проект начался с неформальной беседы с друзьями и превратился в вызов, который мы с партнером приняли как данность: как возможность поучиться и отточить свои навыки трейдеров. Поводом для разговора стала кончина математика и управляющего хедж-фондом Джима Симмонса, который с помощью своего легендарного фонда Medallion Fund добился рекордной серии из 30 лет непрерывной прибыльности, продемонстрировав «среднюю годовую валовую доходность в 66,1% или среднюю годовую чистую доходность в 39,1% в период с 1988 по 2018 год» благодаря использованию статистического арбитража и, по его собственным словам, «некой формы машинного обучения».

До сих пор мы рассмотрели, как применять и интерпретировать наиболее распространённые тесты на корреляцию, коинтеграцию и стационарность при торговле парами и группами портфелей (корзинами). Мы реализовали несколько скриптов на Python для анализа, два примера советников — один для торговли парами, а другой для торговли корзинами — и провели с их помощью ряд бэктестов. Кроме того, мы создали и продолжаем совершенствовать необходимую схему базы данных для обеспечения проведения наших экспериментов.

Если вас интересует метод статистического арбитража, ознакомьтесь с предыдущими статьями этой серии и попробуйте самостоятельно попрактиковаться с ними. Вы увидите, что этот разговор будет очень полезен для трейдеров, ведь мы стоим «на плечах гигантов». Профессиональные математики и статистики уже проделали за нас всю сложную работу, и мы извлекаем из этого пользу, сосредоточиваясь на торговой стороне дела — а не на сложных математических вычислениях — и широко используя готовые библиотеки с открытым исходным кодом. Поскольку мы приближаемся к завершению основной части этой серии, сейчас самое время повторить основные понятия.

Итак, давайте завершим разработку нашей системы оценки. Для начала мы изменим таблицу coint_rank, чтобы учесть отсутствующие данные — два отсутствующих фактора ранжирования.

Рис. 1 — Схема, иллюстрирующая обновленные поля и типы данных таблицы coint_rank


Автор: Jocimar Lopes

 

Во-первых, я ценю вашу попытку просто объяснить эту тему.

Но я думаю, что ваши бэктесты далеки от реальности.

Задержка 0 и моделирование"каждый тик" - оба нереальны, потому что ни того, ни другого не существует. Задержки 0 на самом деле не существует. Установите ее хотя бы на 100 мс.
А моделирование "каждого тика" - это искусственный тик, созданный MT5. Вам нужен "настоящий тик".
На вашем месте я бы ясно дал понять, что это заведомо проигрышная стратегия для розничных пользователей MT5.
 
Cyberdude "каждый тик" - оба нереальны, потому что ни того, ни другого не существует. Задержки 0 на самом деле не существует. Установите ее хотя бы на 100 мс.
А моделирование "каждого тика" - это искусственный тик, созданный MT5. Вам нужен "настоящий тик".
На вашем месте я бы ясно дал понять, что это заведомо проигрышная стратегия для розничных пользователей MT5.
Да, вы правы в этих пунктах: задержка в 0 нереальна, как и выбор "каждый тик". Но у этих вариантов есть причина.

"Каждый тик" - это потому, что нам приходится иметь дело с очень низким качеством исторических данных для символов акций на демо-счете по умолчанию без подписки на биржу. 'Каждый тик' предоставляет хоть и низкокачественные, но все же немного лучшие исторические данные.

Если говорить о задержке 0, то это связано с тем, что в данной статье я сосредоточился на описании скелета предлагаемой скоринговой системы, а не на результатах работы стратегии в реальной торговле. Поэтому я даже не задумывался об этом.

Не поймите меня неправильно. Вы правы, и **ваше предупреждение читателям справедливо**. Эту "стратегию" следует читать между кавычками. Она никогда не задумывалась как реальная стратегия.

Спасибо.