Обсуждение статьи "Быстрая интеграция большой языковой модели и MetaTrader 5 (Часть II): Файнтьюн на реальных данных, бэктест и онлайн-торговля модели"

 

Опубликована статья Быстрая интеграция большой языковой модели и MetaTrader 5 (Часть II): Файнтьюн на реальных данных, бэктест и онлайн-торговля модели:

Статья описывает процесс файнтьюна языковой модели для трейдинга на основе реальных исторических данных из MetaTrader 5. Базовая модель, знающая лишь теоретический технический анализ, обучается на тысяче примеров реального поведения валютных пар (EURUSD, GBPUSD, USDCHF, USDCAD) за 180 дней. После обучения через Ollama модель начинает понимать специфику каждого инструмента.

После развертывания языковой модели из первой части статьи, система работала с техническими индикаторами: RSI, MACD, анализ объемов функционировали корректно, модель генерировала торговые сигналы BUY или SELL. Однако, при тестировании на демо-счете в течение недели, проявилась существенная проблема.

Рассмотрим конкретный пример. Модель зафиксировала сигнал BUY на паре EURUSD при значении RSI 32, что формально соответствует зоне перепроданности. После входа в позицию, цена продолжила падение еще на 200 пунктов, и только через три дня развернулась вверх. Стоп-лосс был выбит, депозит просел на 3%. На следующий день аналогичная ситуация повторилась на GBPUSD: при RSI 28 модель сгенерировала сигнал BUY, но цена провалилась еще на 300 пунктов, что привело к дополнительным убыткам в 3%.

Проблема заключается не в корректности расчета индикаторов, а в отсутствии практического опыта. Базовая языковая модель функционирует, как начинающий трейдер, который изучил теоретическое правило "RSI ниже 30 — сигнал к покупке", но не обладает знаниями о том, как конкретная валютная пара реагирует на перепроданность в различных рыночных условиях. Например, модель не учитывает, что EURUSD в азиатскую сессию при сильном дневном нисходящем тренде может продолжать падение, несмотря на низкие значения RSI.

Базовая LLM владеет теоретическими основами технического анализа, но не имеет эмпирических данных о поведении конкретных инструментов. В частности, модель не знает, что EURUSD при RSI 25 статистически падает еще в среднем на 40 пунктов перед разворотом, GBPUSD в аналогичной ситуации может снизиться на 150 пунктов, а дивергенция MACD на H4 у пары USDCHF дает успешный разворот в 70% случаев, тогда как у USDCAD этот показатель составляет только 40%.

Для решения этой проблемы требуется модель, обученная на реальной исторической статистике конкретных валютных пар, которая понимает их поведение не из учебников, а из анализа тысяч реальных рыночных ситуаций.

Автор: Yevgeniy Koshtenko

 

Странноватый абзац:

Проблема в том, что при расчете RSI для свечи, закрывшейся 10 ноября в 10:00, формула RSI использует все доступные данные, включая бары за 10 ноября 11:00, 12:00 и далее. Это происходит потому, что индикаторы рассчитываются для всего датафрейма pandas сразу, используя векторизованные операции. В результате модель на момент 10 ноября 10:00 "знает", что произойдет в 11:00 и позже.

rolling считается слева до текущего индекса, а не справа.

Кроме того, по поводу подглядывания в будущее только что Maxim Dmitrievsky написал статью. Ваша реализация как раз подглядывает, потому что ставит метки, в зависимости от будущего.

    actual_price_24h = future_row['close']
    price_change = actual_price_24h - row['close']
    price_change_pips = int(price_change / 0.0001)
    direction = "UP" if price_change > 0 else "DOWN"
Хотя это делается и не для фиттинга, а для файнтьюнинга.
Обучаем нейросети на осцилляторах без подглядывания в будущее
Обучаем нейросети на осцилляторах без подглядывания в будущее
  • 2025.11.24
  • www.mql5.com
В статье описывается подход к разметке сделок с помощью осцилляторов для моделей машинного обучения. Это позволяет избавиться от look ahead bias. Показано, что такая разметка не приводит к переобучению моделей, а стратегии продолжают работать продолжительное время.
[Удален]  
Сделать рабочую стратегию на МО - это та ещё засада и ребус. Очень много подводных камней, начиная с разметки и заканчивая даже шагом градиента, когда модель то обращает внимание на тонкие моменты, то нет. Если есть выбор между МО и не МО, то лучше выбирать второе :) И усложнение моделей это всегда чаще минус, чем плюс. Как упражнение для мозгов - прекрасно :)