Обсуждение статьи "Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (II) - Настройка LoRA"

 

Опубликована статья Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (II) - Настройка LoRA:

Языковые модели (LLM) являются важной частью быстро развивающегося искусственного интеллекта, поэтому нам следует подумать о том, как интегрировать мощные LLM в нашу алгоритмическую торговлю. Большинству людей сложно настроить эти модели в соответствии со своими потребностями, развернуть их локально, а затем применить к алгоритмической торговле. В этой серии статей будет рассмотрен пошаговый подход к достижению этой цели.

В предыдущей статье мы рассказали, как выполнить тонкую настройку предварительно обученной модели GPT-2 с использованием наших собственных финансовых данных с помощью метода полной тонкой настройки параметров, а также оценили выходные результаты модели. В этой и следующих статьях мы более подробно рассмотрим, как реализовать другие методы тонкой настройки с примерами кода (мы обсудим только методы тонкой настройки, представленные в предыдущей статье, реализовать все методы невозможно. Я выберу лишь несколько наиболее часто используемых методов для реализации). В данной статье в качестве примера будет рассмотрен метод настройки LoRA.

Кроме того, перед нами стоит задача попытаться сравнить модели, обученные с использованием этих различных методов тонкой настройки, по горизонтали, а затем найти наиболее эффективную модель для текущей валютной пары (конечно, эффективность модели может также меняться в различных рыночных условиях, таких как восходящие тренды, нисходящие тренды или колебательные тренды). Это может более четко подсказать нам, какой метод обучения модели использовать на практике для достижения лучших результатов. Конечно, при более строгом подходе нам следует не только сравнить эти различные методы обработки по горизонтали, но и сравнить производительность тонко настроенных моделей различных валютных пар при различных методах обработки данных и методах тонкой настройки. Это кажется простой, но крайне утомительной задачей. Я лично считаю, что если мы действительно хотим применять эту серию методов в торговле, этот шаг имеет решающее значение. Однако я не собираюсь подробно останавливаться на нем в этой серии статей, поскольку считаю, что каждый может легко расширить функционал на основе наших примеров. Просто замените обучающие данные другими валютными парами, а затем сравните эффективность модели по горизонтали. Работа кропотливая, но не сложная.

Автор: Yuqiang Pan