Обсуждение статьи "Нейросети в трейдинге: Многодоменная архитектура анализа финансовых данных (MDL)"

 

Опубликована статья Нейросети в трейдинге: Многодоменная архитектура анализа финансовых данных (MDL):

Статья знакомит с фреймворком MDL, который предлагает токенизацию признаков, сценариев и задач для системной организации модели и эффективного формирования контекста. В практической части реализованы CNeuronPerTokenFFN для локальной обработки токенов и CNeuronScenariosToken, генерирующий сценарные токены через 2D‑SSM и FieldPatternEmbedding. Такой подход ускоряет анализ длинных временных рядов и повышает точность интерпретации рыночных данных.

Современные финансовые рынки давно перестали быть средой, в которой достаточно одной универсальной модели или одного набора правил на все случаи жизни. Один и тот же инструмент ведет себя по-разному в тренде и во флэте, в фазе высокой волатильности и в период затишья, на старших и младших таймфреймах, при смене ликвидности и рыночного контекста. В результате практическая разработка торговых систем все чаще упирается в избыточную фрагментацию подходов. Под каждый сценарий строится отдельная логика, которую затем необходимо согласовывать с остальными. Такая архитектура работает лишь локально и теряет устойчивость при смене рыночного режима.

Попытки решить эту проблему за счет усложнения признаков, увеличения глубины моделей или агрессивной оптимизации гиперпараметров дают ограниченный эффект. Причина остается фундаментальной: модель изначально проектируется как однодоменная, тогда как рынок по своей природе многодоменный. В прикладных задачах машинного обучения для работы с такой сложностью применяют многосценарное (MSL) и многозадачное (MTL) обучение. Они позволяют учитывать разнообразие контекстов. Однако у этих подходов есть два ограничения:

  • параметры модели используются неэффективно при сложных признаковых представлениях;
  • сложно совместно учитывать сценарий и задачу в одной архитектуре.
В работе "MDL: A Unified Multi-Distribution Learner in Large-scale Industrial Recommendation through Tokenization" для преодоления этих ограничений предложен фреймворк Multi-Distribution Learning (MDL). Авторы фреймворка предложили сценарии и задачи вводить в модель в виде специализированных токенов, которые участвуют в вычислениях наравне с признаками.

Перенос данной идеи в область финансовых рынков позволяет сформулировать задачу более строго. Если считать инструмент, таймфрейм, режим рынка и горизонт прогнозирования разными доменами, задача сводится к единой архитектуре, которая учитывает контекст при обработке данных. Такой подход устраняет необходимость жесткого переключения между стратегиями и заменяет его адаптивным механизмом, при котором модель сама регулирует вклад факторов в зависимости от текущего состояния рынка.

Автор: Dmitriy Gizlyk