Обсуждение статьи "Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (I) - Тонкая настройка"

MetaQuotes 2025.01.31 17:22

Опубликована статья Добавляем пользовательскую LLM в торгового робота (Часть 5): Разработка и тестирование торговой стратегии с помощью LLM (I) - Тонкая настройка:

Языковые модели (LLM) являются важной частью быстро развивающегося искусственного интеллекта, поэтому нам следует подумать о том, как интегрировать мощные LLM в нашу алгоритмическую торговлю. Большинству людей сложно настроить эти модели в соответствии со своими потребностями, развернуть их локально, а затем применить к алгоритмической торговле. В этой серии статей будет рассмотрен пошаговый подход к достижению этой цели.

В предыдущей статье мы рассказали, как использовать ускорение GPU для обучения больших языковых моделей, но мы не использовали его для формулирования торговых стратегий или проведения тестирования на истории. Начиная с этой статьи, мы шаг за шагом будем использовать обученную языковую модель для формулирования торговых стратегий и их тестирования на валютных парах. Конечно, это не простой процесс.

Вся работа может занять несколько статей.

Первый шаг — сформулировать торговую стратегию;
Вторым шагом является создание набора данных в соответствии со стратегией и тонкая настройка модели (или обучение модели) таким образом, чтобы входные и выходные данные большой языковой модели соответствовали нашей сформулированной торговой стратегии. Существует множество различных подходов для решения этой задачи. Я приведу как можно больше примеров;
Третий шаг — вывод модели и объединение результатов с торговой стратегией, а также создание советника в соответствии с нашей торговой стратегией. Конечно, нам еще предстоит проделать определенную работу на этапе вывода модели (выбор подходящей структуры вывода и методов оптимизации: например, мгновенное внимание, квантование модели, ускорение и т. д.);
Четвертый шаг — использование тестирование на истории для проверки нашего советника на стороне клиента.

Автор: Yuqiang Pan

Christian Benjamin 2024.08.12 23:14 #1

Здравствуйте

В чем основная разница между процессом обучения и процессом тонкой настройки при работе с языковыми моделями?

Yuqiang Pan 2024.08.17 03:29 #2

Christian Benjamin #:
Здравствуйте

Здравствуйте, из примеров в этой статье:

1. Веса предварительно обученной модели GPT2, которую мы используем в этом примере, не имеют никакого содержания, связанного с нашими данными, и входной временной ряд не будет распознан без тонкой настройки, но правильное содержание может быть выведено в соответствии с нашими потребностями после тонкой настройки.

2. Как мы уже говорили в нашей статье, очень трудоемко обучать языковую модель с нуля, чтобы она сходилась, но тонкая настройка позволяет быстро сходиться предварительно обученной модели, что экономит много времени и вычислительных мощностей. Поскольку модель, используемая в нашем примере, относительно небольшая, этот процесс не очень очевиден.

3. Процесс тонкой настройки требует гораздо меньше данных, чем процесс предварительного обучения. Если количество данных недостаточно, то тонкая настройка модели с тем же количеством данных гораздо лучше, чем прямое обучение модели.

Архитектура GPT Группа пользователей MetaTrader 5 Машинное обучение в трейдинге:

Timothy Walshak 2024.09.10 10:39 #3

Здравствуйте, спасибо за замечательные статьи.

С нетерпением ждем, как мы интегрируем доработанную модель в MT5

Новый комментарий