Обсуждение статьи "Нейросети в трейдинге: Иерархия навыков для адаптивного поведения агентов (HiSSD)"
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Опубликована статья Нейросети в трейдинге: Иерархия навыков для адаптивного поведения агентов (HiSSD):
Предлагаем познакомиться с фреймворком HiSSD, который объединяет иерархическое обучение и мультиагентные подходы для создания адаптивных систем. В этой работе мы подробно рассмотрим, как этот инновационный подход помогает выявлять скрытые закономерности на финансовых рынках и оптимизировать стратегии торговли в условиях децентрализации.
Классический подход — обучить агентов на одной задаче, а затем дообучить на другой. Но он не лишён недостатков. Во-первых, требуется дорогостоящее повторное взаимодействие с новой средой. Во-вторых, модель, обученная под фиксированное число агентов, не справляется с масштабированием. Она теряется при изменении состава участников или целевых параметров.
Чтобы справиться с этими проблемами, исследователи начали использовать архитектуру на базе Transformer. Она даёт гибкость — модель не зависит от количества агентов и может адаптироваться к новым условиям. Это стало основой для разработки универсальных кооперативных паттернов поведения — навыков, которые можно переносить между задачами и использовать повторно.
Методов реализации таких навыков предложено множество. Одни основываются на двухэтапном обучении, где сначала извлекаются общие поведенческие шаблоны, а потом уже формируется политика. Другие совмещают офлайн- и онлайн-обучение, ускоряя адаптацию к новым условиям.
Такие подходы дали заметный эффект, особенно в снижении затрат на перенос моделей для решения смежных задач. Однако есть и слабые стороны. Универсальные навыки полезны, но игнорируют особенности, необходимые для достижения конкретных целей. А ведь именно в деталях часто кроется ключ к успеху. Более того, во многих случаях из внимания выпадает временная структура взаимодействий. Однако кооперация, как известно, развивается не мгновенно, а во времени. Последовательность шагов, согласованность действий — всё это имеет значение.
Для решения этих проблем в работе "Learning Generalizable Skills from Offline Multi-Task Data for Multi-Agent Cooperation" был предложен фреймворк HiSSD — Hierarchical and Separate Skill Discovery. Это новая архитектура, которая позволяет одновременно изучать как общие, так и специфические навыки. Без искусственного разделения. Без жёстких ограничений. В иерархической структуре обе категории знаний развиваются параллельно.
Автор: Dmitriy Gizlyk