Обсуждение статьи "Cоздание стратегии возврата к среднему на основе машинного обучения"

MetaQuotes 2025.03.07 14:43

Опубликована статья Cоздание стратегии возврата к среднему на основе машинного обучения:

В данной статье предлагается очередной оригинальный подход к созданию торговых систем на основе машинного обучения, с использованием кластеризации и разметки сделок для стратегий возврата к среднему.

Прежде чем что-то кластеризовать, необходимо определиться, зачем это вообще нужно. Представим себе график котировок, на котором есть тренд, флэт, периоды высокой и низкой волатильности, различные паттерны и другие особенности. То есть график котировок не является чем-то однородным, где присутствуют одни и те же закономерности. Можно даже сказать, что в разные периоды времени существуют или могут существовать разные закономерности, которые пропадают на других временных промежутках.

Кластеризация позволяет разделить исходный временной ряд на несколько состояний по определенным признакам, чтобы каждое из этих состояний описывало похожие наблюдения. Это может облегчить задачу построения торговой системы, ведь обучение будет происходить на более однородных, похожих данных. По крайней мере, так это можно себе представлять. Естественно, что торговая система будет работать уже не на всем историческом периоде, а на какой-то выбранной его части, составленной из разных моментов времени, значения признаков которых попадают в данный конкретный кластер.

После кластеризации, можно сделать разметку только выбранных примеров, то есть, присвоить им уникальные метки классов, для построения финальной модели. Если кластер содержит однородные данные с похожими наблюдениями, то и их разметка должна стать более однородной и, впоследствии, более предсказуемой. Можно взять несколько кластеров данных, разметить каждый из них отдельно, затем обучить модели машинного обучения на данных каждого кластера и проверить их на обучающих и тестовых данных. Если будет найден кластер, который позволяет модели хорошо обучаться, то есть, обобщать и предсказывать на новых данных, задачу построения торговой системы можно считать практически выполненной.

Автор: Maxim Dmitrievsky

fxsaber 2025.03.07 14:55 #1

Ни разу не критично, но все же хотелось бы без варнингов из коробки.

fxsaber 2025.03.07 15:23 #2

Основным отличием фильтра Савицкого-Голея от обычной скользящей средней является то, что он не запаздывает относительно цен.

ошибочным является применение этого фильтра в режиме онлайн на нестационарных временных рядах, поскольку последние значения могут перерисовываться, но для разметки сделок на уже существующих данных он вполне подходит.

Почему тогда не ЗЗ?

Правда, нашел небольшое объяснение.

У такой разметки есть свои особенности:

не все размеченные сделки приносят прибыль, поскольку дальнейшее изменение цен, после пересечения с лентами, не всегда идут в противоположном напрвлении. Поэтом могут возникнуть примеры, ложно помеченные как покупка или продажа.
этот недостаток, в теории, компенсируется тем, что разметка является однородной и неслучайной, а поэтому ложно помеченные примеры можно рассматривать как ошибки обучения или торговой системы в целом, что может давать меньшее переобучение на выходе.

Наверное, выкидывание из ЗЗ-ряда некоторых вершин, дало бы тот же эффект.

[Удален] 2025.03.07 15:55 #3

fxsaber #:

Почему тогда не ЗЗ?

Правда, нашел небольшое объяснение.

Наверное, выкидывание из ЗЗ-ряда некоторых вершин, дало бы тот же эффект.

Никогда не использовал зз, спасибо, что натолкнули на мысль. Напишу и такой сэмплер.

[Удален] 2025.03.07 15:56 #4

fxsaber #:

Ни разу не критично, но все же хотелось бы без варнингов из коробки.

Забыл про это, уберу.

fxsaber 2025.03.07 15:56 #5

Скос (или асимметрия) в распределениях — это характеристика, которая описывает степень несимметричности распределения данных относительно его среднего значения. Скос показывает, насколько распределение отклоняется от симметричного (например, от нормального распределения). Скос измеряется с помощью коэффициента асимметрии (skewness). Кластеризация по скосу позволяет выделить группы данных с похожими характеристиками распределения, что помогает идентифицировать эти режимы. Например, положительный скос может указывать на периоды с редкими, но сильными скачками цен (например, во время кризисов), а отрицательный — на периоды с более плавными изменениями.

Возможно, поверхностно вижу, но разве кластеризация по скосу - это не заглядывание в будущее?

Думал, что кластеризацию рынка надо делать по признакам реал-тайм: время, скользящая и т.д.

[Удален] 2025.03.07 16:00 #6

fxsaber #:

Возможно, поверхностно вижу, но разве кластеризация по скосу - это не заглядывание в будущее?

Думал, что кластеризацию рынка надо делать по признакам реал-тайм: время, скользящая и т.д.

Скосы для последних n баров (в статье 10), т.е в скользящем окне.

fxsaber 2025.03.07 16:04 #7

Maxim Dmitrievsky #:
Скосы для последних n баров (в статье 10), т.е в скользящем окне.

В соответствующий кластер попадает то, что правее этих 10 баров или эти самые бары?

[Удален] 2025.03.07 16:07 #8

fxsaber #:

В соответствующий кластер попадает то, что правее этих 10 баров или эти самые бары?

10 баров назад, от текущего. Иначе бы даже в тестере МТ5 не сошлось, ведь он не видит будущее :)

Логика та же, что и в цикле в инклуднике. Иначе бы показания тестеров расходились (моего и МТ5)

fxsaber 2025.03.07 16:15 #9

Maxim Dmitrievsky #:
10 баров назад, от текущего. Иначе бы даже в тестере МТ5 не сошлось, ведь он не видит будущее :)

Звучит логично. Видимо, неправильно поняли друг друга.

fxsaber 2025.03.07 16:16 #10

catmodel EURGBP_H1 0.onnx — основная модель, которая дает сигналы на покупку и продажу
catmodel_m EURGBP_H1 0.onnx — дополнительная модель, которая разрешает или запрещает торговлю

Дочитал до этого места и не понял, откуда возникла.

1 2 3 4 5 6 7 8 ...10

Новый комментарий