Midjourney и другие нейросети обработки изображений - страница 1203

 
Ivan Butko #:
Мой первый опыт с Claude Fable 5 (купил параллельно чатгпт подписку, уж очень хотелось "пощупать монстра").

Прошу его сделать интерфейс к моему советнику, у которогоо интерфейс кошмарненький.

В итоге, он делает интерфейс на языке HTML и симулирует поведение моего советника в некой абстрактной среде, потратив все сессионные токены. 

Может он разволновался, я же не просил так. 

По общему впечателнию сложно сказать ощущается ли в нём могучая сила кодера, но думал он долго, а значит не просто так. 

Но прошлый опыт с Опусом показал: интерфейсы клод делает превосходно. 

Конченность сервиса впечатляет. 









Он три раза сбился. И все три раза потратил сессионный лимит токенов. 

Параллельно ЧАТГПТ мне редактироует 15 000 строк кода и я за ним не успеваю. 

Fable - хорошая игра на компе, она не заслужила образности такого позорища

 

MiMo Code — это опенсорсный терминальный ИИ-агент (AI Coding Agent) для автоматизации программирования, разработанный командой MiMo компании Xiaomi. Инструмент позиционируется как прямой и более доступный конкурент Claude Code от Anthropic.


//текст и обложка Gemini 3.5. Новость https://mimo.xiaomi.com/blog/mimo-code-long-horizon

В основе архитектуры лежит идея Long-Horizon Tasks — решения сложных, масштабных задач программирования, которые требуют десятков или сотен последовательных шагов (документирование, рефакторинг огромных репозиториев, обновление версий библиотек), где обычные ИИ-помощники «теряются», забывают контекст или слишком рано заявляют, что «всё готово».

Ниже разберем технические особенности, результаты бенчмарков, стоимость и первые отзывы разработчиков.

Архитектура: За счет чего удерживается контекст?

MiMo Code разработан на базе проекта с открытым исходным кодом OpenCode (распространяется по лицензии MIT). Авторы выделили три уровня удержания качества на длинных дистанциях:

  1. Вычисления (Max Mode): На каждом шаге агент параллельно генерирует до 5 вариантов планов действий. Затем специальная модель-судья выбирает наиболее жизнеспособный, а остальные отбрасываются. Дополнительно на выходе работает независимый валидатор (Goal verifier), который не дает агенту завершить сессию, пока код не пройдет тесты.

  2. Память (Structured Memory): Вместо банального сжатия истории (которое стирает детали) MiMo Code использует контрольные точки (checkpoint writers). Когда контекстное окно заполняется, агент сбрасывает структурированное состояние в сессионную, проектную и глобальную память, после чего открывает «чистое» окно и собирает контекст заново.

  3. Эволюция (Dream & Distill): Раз в неделю запускается фоновый процесс Dream, сжимающий проектную память. Раз в месяц срабатывает Distill — система анализирует повторяющиеся паттерны работы разработчика и превращает их в готовые переиспользуемые скрипты, команды или SOP (стандартные операционные процедуры).

Вместо ненадежных текстовых промптов для координации под-агентов MiMo Code использует динамические воркфлоу, написанные на чистом JavaScript.

Бенчмарки: Борьба с Claude Code

В тестах MiMo Code демонстрирует превосходство над связкой Claude Code + Sonnet именно на "длинных" задачах.

  • SWE-bench Pro: MiMo Code достигает показателя 62% (прирост эффективности в режиме Max Mode составляет от 10% до 20% по сравнению со стандартным запуском без агента).

  • TerminalBench 2: Результат составил 73%, что примерно на 5 процентных пунктов выше, чем у Claude Code на той же базовой модели.

  • Слепое тестирование: В ходе двойного слепого теста (576 разработчиков, 474 приватных репозитория) винрейт (доля успешных решений) MiMo Code превысил 65%, когда цепочка действий превышала 200 шагов.

Важный нюанс: За высокий винрейт в режиме Max Mode приходится платить токенами. Параллельная генерация планов увеличивает расход токенов в 4–5 раз.

Стоимость и доступность

Поскольку проект полностью опенсорсный, сам движок бесплатный. Его можно развернуть локально (через npm на Windows или одной командой в терминале на macOS/Linux, запуск по команде mimo ). Для работы можно подключить собственную модель или использовать официальное API от Xiaomi (platform.xiaomimimo.com), которое полностью совместимо со спецификацией OpenAI SDK.

Цены на базовую модель MiMo-V2.5-Pro (контекстное окно 1 млн токенов) выглядят следующим образом:

Объем контекста в запросе Входные токены (за 1 млн) Выходные токены (за 1 млн)
До 256K токенов $1.00 $3.00
От 256K до 1M токенов $2.00 $6.00

Для сравнения: стоимость генерации кода в пределах стандартного контекста получается значительно дешевле, чем у топовых западных проприетарных моделей (например, цена вывода почти в 8 раз ниже, чем у Claude Opus).

Отзывы в сети: Что говорят разработчики

Релиз вызвал бурное обсуждение на Reddit, Хабре и Hacker News. Мнения разделились на два лагеря:

  • Плюсы, которые отмечают: Полная прозрачность за счет Open Source (MIT лицензия), легкая интеграция в привычные терминалы, высокая автономность. Инженерам нравится, что агент действительно может выполнить затяжной рефакторинг или сделать тяжелый апгрейд версий зависимостей в проекте без постоянных пинков со стороны человека. Радует и наличие бесплатного демо-канала для тестов без регистрации.

  • Критика и скепсис: Главная претензия — скрытая «прожорливость». На Github и Reddit уже появились отзывы о том, что автономное выполнение крупной задачи (например, создание 60+ страниц кода с тремя сотнями коммитов) может вылиться в $70 API-расходов за один присест из-за архитектуры Max Mode. Пользователи называют ранний маркетинг Xiaomi слегка агрессивным, напоминая, что заоблачный винрейт достигается брутфорсом (множественными параллельными попытками).

Резюме

MiMo Code — сильный и доступный инструмент в сегменте автономных ИИ-агентов. Xiaomi создали качественную альтернативу Claude Code, которая выигрывает по цене API и открытости кода, но требует от разработчика жесткого контроля за расходом токенов. Это отличное решение для крупных компаний и команд разработки, готовых развернуть опенсорсную систему на своих серверах для автоматизации рутинных "длинных" задач.