Обсуждение статьи "Добавляем пользовательскую LLM в торгового робота (Часть 3): Обучение собственной LLM с помощью CPU"
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Опубликована статья Добавляем пользовательскую LLM в торгового робота (Часть 3): Обучение собственной LLM с помощью CPU:
Языковые модели (LLM) являются важной частью быстро развивающегося искусственного интеллекта, поэтому нам следует подумать о том, как интегрировать мощные LLM в нашу алгоритмическую торговлю. Большинству людей сложно настроить эти модели в соответствии со своими потребностями, развернуть их локально, а затем применить к алгоритмической торговле. В этой серии статей будет рассмотрен пошаговый подход к достижению этой цели.
В предыдущей статье серии мы рассмотрели базовую настройку среды для запуска больших языковых моделей и запустили простой экземпляр LLM с использованием llama.cpp в WSL. Самое интересное то, что мы можем запустить пример даже без мощного графического процессора (GPU), используя только центральный процессор (CPU)! Я постараюсь максимально снизить системные требования, чтобы читатели могли попробовать и проверить примеры, не сталкиваясь с нехваткой вычислительной мощности. Конечно, в части обучения модели я представлю версии для различных платформ, включая версию для чистого CPU и версию, поддерживающую ускоренные вычисления на базе видеокарт AMD.
Конечно, вы можете задаться вопросом: могут ли быть полезны модели, обученные с помощью CPU? Каково значение таких моделей? Действительно, если вы хотите обучить модель со сложными функциями или решить сложные задачи с использованием CPU, это довольно сложно, но все же центральный процессор можно использовать для реализации некоторых конкретных и относительно простых функций.
В этой статье мы рассмотрим, как обучить большую языковую модель (large language model, LLM) с помощью CPU и создать набор финансовых данных, необходимый для ее обучения. Это потребует информации из моих предыдущих статей. Если вы хотите углубиться в тему, пожалуйста, прочтите мои статьи, где предоставлены необходимые ссылки.
Автор: Yuqiang Pan