Обсуждение статьи "Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (I) - Тонкая настройка"

 

Опубликована статья Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (I) - Тонкая настройка:

Языковые модели (LLM) являются важной частью быстро развивающегося искусственного интеллекта, поэтому нам следует подумать о том, как интегрировать мощные LLM в нашу алгоритмическую торговлю. Большинству людей сложно настроить эти модели в соответствии со своими потребностями, развернуть их локально, а затем применить к алгоритмической торговле. В этой серии статей будет рассмотрен пошаговый подход к достижению этой цели.

В предыдущей статье мы рассказали, как использовать ускорение GPU для обучения больших языковых моделей, но мы не использовали его для формулирования торговых стратегий или проведения тестирования на истории. Начиная с этой статьи, мы шаг за шагом будем использовать обученную языковую модель для формулирования торговых стратегий и их тестирования на валютных парах. Конечно, это не простой процесс.

Вся работа может занять несколько статей.

  • Первый шаг — сформулировать торговую стратегию; 
  • Вторым шагом является создание набора данных в соответствии со стратегией и тонкая настройка модели (или обучение модели) таким образом, чтобы входные и выходные данные большой языковой модели соответствовали нашей сформулированной торговой стратегии. Существует множество различных подходов для решения этой задачи. Я приведу как можно больше примеров;
  • Третий шаг — вывод модели и объединение результатов с торговой стратегией, а также создание советника в соответствии с нашей торговой стратегией. Конечно, нам еще предстоит проделать определенную работу на этапе вывода модели (выбор подходящей структуры вывода и методов оптимизации: например, мгновенное внимание, квантование модели, ускорение и т. д.); 
  • Четвертый шаг — использование тестирование на истории для проверки нашего советника на стороне клиента.


Автор: Yuqiang Pan

 
Здравствуйте
В чем основная разница между процессом обучения и процессом тонкой настройки при работе с языковыми моделями?
 
Christian Benjamin #:
Здравствуйте
В чем основная разница между процессом обучения и процессом тонкой настройки при работе с языковыми моделями?

Здравствуйте, из примеров в этой статье:

1. Веса предварительно обученной модели GPT2, которую мы используем в этом примере, не имеют никакого содержания, связанного с нашими данными, и входной временной ряд не будет распознан без тонкой настройки, но правильное содержание может быть выведено в соответствии с нашими потребностями после тонкой настройки.

2. Как мы уже говорили в нашей статье, очень трудоемко обучать языковую модель с нуля, чтобы она сходилась, но тонкая настройка позволяет быстро сходиться предварительно обученной модели, что экономит много времени и вычислительных мощностей. Поскольку модель, используемая в нашем примере, относительно небольшая, этот процесс не очень очевиден.

3. Процесс тонкой настройки требует гораздо меньше данных, чем процесс предварительного обучения. Если количество данных недостаточно, то тонкая настройка модели с тем же количеством данных гораздо лучше, чем прямое обучение модели.

 

Здравствуйте, спасибо за замечательные статьи.


С нетерпением ждем, как мы интегрируем доработанную модель в MT5