Specification
Я разрабатываю собственную нейросеть для торговли на финансовых рынках с использованием обучения с подкреплением (RL, Actor-Critic).
Мне не требуется обучение основам RL или помощь с написанием кода. Основной интерес заключается в анализе самого процесса обучения и интерпретации его результатов.
Нужен человек, который хорошо понимает поведение RL-моделей и сможет помочь разобраться в таких вопросах, как:
• Почему качество торговли может ухудшаться по мере дальнейшего обучения.
• Как отличить нормальные колебания результатов от реальной деградации модели.
• Какие графики и метрики стоит отслеживать во время обучения.
• Как выявлять переобучение, нестабильность обучения или ошибки в постановке задачи.
• Как определить, на каком этапе модель показывала лучшие результаты и почему.
• Какие выводы можно сделать по логам, метрикам и графикам обучения.
Проект находится в активной разработке. При необходимости я могу арендовать виртуальную машину для запуска новых экспериментов и обучения модели. Мы можем совместно подбирать и изменять параметры обучения, запускать дополнительные тесты, анализировать новые результаты и проверять различные гипотезы на практике, а не ограничиваться только просмотром уже готовых графиков и логов.
Цель — получить профессиональный взгляд на процесс обучения модели и понять причины её поведения, а не просто проверить код или исправить технические ошибки.
Опыт работы с Reinforcement Learning обязателен. Опыт применения RL в алгоритмической торговле будет большим плюсом.
Если вам интересны сложные задачи, связанные с поведением RL-моделей в реальных рыночных условиях, буду рад обсудить проект подробнее.