Midjourney и другие нейросети - страница 1188

 

Главные новости ИИ за неделю: масштабная утечка у Anthropic, Gemma 4 от Google и планы OpenAI


//текст и обложка Gemini 3.1

Прошедшая неделя выдалась невероятно насыщенной на события в сфере искусственного интеллекта. От громких утечек исходного кода и анонсов новых моделей до неожиданных корпоративных приобретений — индустрия уверенно движется от привычных чат-ботов к автономным фоновым ИИ-агентам. Ниже собраны ключевые события недели.

1. Anthropic: Крупная утечка Claude Code и новые режимы работы

Главным событием стала непреднамеренная утечка исходников инструмента Claude Code. Через публичный реестр npm в сеть попало около 1900 файлов (более 512 тысяч строк кода). Благодаря этому стали известны скрытые проекты компании:

  • Chyros и архитектура памяти: В коде нашли следы продвинутой системы управления памятью и автономного фонового режима Chyros (демона). Это ИИ-агент, который работает в фоновом режиме 24/7. Он может самостоятельно исправлять ошибки на сервере, отвечать на сообщения и пушить код, пока пользователь отдыхает, действуя на опережение без прямых промптов.

  • Mythos и Capybara: Утечки подтвердили существование новых, более мощных моделей (превосходящих Opus). Сейчас они тестируются в закрытом режиме из-за их невероятных способностей в поиске уязвимостей и кибербезопасности.

  • Computer Use: В Claude Code для подписчиков добавили функцию Computer Use — агент теперь может напрямую управлять интерфейсом macOS (двигать мышью, кликать, тестировать локальные приложения).

  • OpenClaude: На фоне утечки энтузиасты уже выпустили форк OpenClaude без привязки к конкретному вендору.

2. OpenAI: Рекордные инвестиции, концепция Super App и закрытие Sora

OpenAI продолжает стремительно расти, привлекая беспрецедентные инвестиции (раунд на сумму более $120 млрд) и достигая огромных оценок стоимости компании. Темпы роста доходов превосходят самые быстрорастущие корпорации эпохи раннего интернета и мобильных технологий.

  • Super App: В компании подтвердили планы по созданию единого суперприложения. Оно объединит ChatGPT, возможности веб-браузинга (Atlas), программирования (Codex) и автономных агентов в одном месте, чтобы пользователям не приходилось переключаться между разными сервисами.

  • Закрытие Sora: Известный генератор видео Sora сворачивают. Выяснилось, что поддержание его работы обходилось компании примерно в $1 млн убытков ежедневно.

  • Покупка TBPN: OpenAI неожиданно приобрела сеть TBPN — медиаплатформу, специализирующуюся на ежедневных живых эфирах и подкастах о технологиях и бизнесе.

3. Google: Открытая Gemma 4 и бюджетная генерация видео Veo 3.1

  • Gemma 4: Представлена новая линейка из четырех открытых моделей. Впервые они выпущены по лицензии Apache 2.0 (включая легкие E2B/E4B для смартфонов и мощную 31B Dense). Теперь их можно свободно дообучать и использовать в коммерческих целях.

  • Veo 3.1 Lite: Появилась более дешевая версия видеогенератора от Google. Создание стандартного ролика в 720p теперь стоит всего 5 центов.

  • AI Inbox: Запущен умный почтовый ящик с ИИ-приоритизацией писем и ежедневными сводками (пока доступен в бете для подписчиков плана Google AI Ultra).

4. Alibaba: Мощные Qwen и генератор Wan 2.7

Китайские разработчики активно наступают на пятки лидерам рынка:

  • Qwen 3.5 Omni и 3.6-Plus: Анонсированы новые версии ИИ. Модель Qwen 3.6-Plus поддерживает контекстное окно в 1 млн токенов, отлично справляется с написанием кода и агентными задачами, обходя многих конкурентов по скорости. В сообществе на базе предыдущих версий Qwen также набирают популярность версии «без цензуры» с нулевым процентом отказов на запросы.

  • Wan 2.7-Image: Универсальная модель для работы с изображениями (text-to-image, редактирование, контроль цвета и структуры персонажа на высоком уровне), объединяющая возможности нескольких нейросетей.

5. Microsoft: Новая транскрибация и проверка в Copilot

  • MAI Transcribe 1: Microsoft выпустила новую модель распознавания речи, которая в тестах значительно превосходит аналоги, в том числе качественно обрабатывая звук в шумных условиях.

  • Critique и Council в Copilot: В корпоративной версии Copilot появились новые режимы: Critique (одна нейросеть пишет текст, а другая — выступает строгим рецензентом) и Council (запрос прогоняется одновременно через несколько разных моделей для получения объективного консенсуса).

6. Другие интересные релизы

  • Netflix VOID: Стриминговый сервис выложил в опенсорс модель для качественного удаления объектов с видео. Нейросеть не просто замазывает предмет, но и корректно убирает связанные с ним тени и отражения.

  • Grok 5: Ожидается запуск бета-версии новой огромной модели от xAI Илона Маска.

  • Perplexity для налогов: Perplexity запустила специальный ИИ-инструмент для помощи пользователям с заполнением сложных налоговых деклараций.

  • Slackbot: Мессенджер Slack внедряет продвинутых ИИ-агентов, которые могут вести CRM, анализировать звонки (даже из Zoom) и управлять контактами прямо в каналах.

  • Recraft V4: Запущено новое семейство моделей для профессиональных дизайнеров, генерирующее масштабируемые SVG-векторы, правильный текст на картинках и реалистичные мокапы продуктов.

  • ИИ в супермаркетах: Instacart начал внедрять умные продуктовые тележки с экранами, камерами и встроенными весами, работающие на базе чипов Nvidia для анализа покупок и рекомендаций в реальном времени.

 

Похоже Qwen 3.6 Plus значительно прокачался в коде

Программирование становится главным критерием ИИ, хорошо что Qwen это поняли.

Claude с самого начался не гнался за разными направлениями, видео и прочими фантиками, развивали только код.

Open AI тоже додумались до этого, убрав sora и многие другие проекты, ориентир на агентов и код.

 
Заметил интересную вещь: сейчас все чатботы упираются в одно узкое горлышко — окно контекста. 

Как только превышаешь его - чатботы сыпятся один за другим: не могут решить логическую ошибку в коде. Причём все: от Квена до Опуса. 

Как только код выходит за рамки 3000 строк - они уже не понимают, где искать логическую ошибку и начинают строить нерабочие гипотезы.


Частично помогает попросить чатбота сделать карту зависимостей, затем добавить эту карту завивимостей в проект и начать диалог заново, тогда он качественнее пишет код (динамический промпт-инженеринг)


В общем, сейчас проблема для всех чатботов одна - это размер контекста. Это то поле, где они начнут соревноваться.

Во всём остальном (в качестве) в локальных пределах контеста они друг друга догнали в разных задачах и в разных генерациях скорее компенсируют друг друга (что не смог один - сможет другой).
 
нуу, тут наверное от задачи зависит.  у меня проект более 15000 строк кода, пришлось разбить на десятки модулей, в основном. коде в начале вставка комментов описывающий проект и назначение модулей... ии вроде справляется, делает рабочие модули... а так то галюцинирует при большом обьеме, как он сам пояснял,  что каждый раз практически пишет код заново ну и там "рандом" и помогает ему портить код, можно побаловаться с температурой и другими параметрами если модель локальная... 
 
Ivan Butko #:

Только среда, успел исправить ошибки в проекте, а недельный лимит уже исчерпался до 74% (!) 

Ещё парочка правок и ждать до понедельника!

...
...

Дичь какая-то. 

В этом опусе только индикаторы со скользящими средними пилить, может тогда хватит лимитов, чтобы проверить достаточно
Ублюдочный Claude во всех своих моделях держит открытой мошенническую дыру по отношению к пользователям.

Когда после генерации появляется надпись "Retry", сигнализирующая о том, что произошёл какой-то сбой генерации - сервис не возвращает токены и те реально тратятся на ошибки этого самого сервиса. 

Один раз - "Retry", второй раз "Retry" - и всё, сессионный лимит исчерпан. 
 

Войти в IT


//Стих и картинка от Gemini 3.1 PRO, пара строк авторских.


Мечтает каждый неофит:

«Войти в IT через ChatGPT!»

Зачем учить язык до дыр?

Сгенерит код стальной кумир!


Накатан промпт на весь портал,

Чтоб сайт, как бабочка, порхал.

Наивно думал, остолоп:

One-Shot и всё, — в итоге слоп.


Изящный скрипт, всё как в кино,

В продакшен просится оно.

Но компилятор шлёт отказ:

«Таких пакетов нет у нас!»


ИИ льёт функции-фантомы,

Изобретает сам законы.

Уверенно, не пряча глаз,

Галлюцинирует для нас.


Но если с ним в дуэте петь,

То можно многое успеть:

Рефакторинг, докстринг и тест

— Он тащит этот скучный крест.


Мораль проста, скажу вам так:

ИИ — лишь цифровой верстак.

Заменит он лишь тех людей,

Кто копипастит без затей.


Сеньор же тихо кофе пьёт,

И промпт рихтует наперёд.

Он знает: чтоб взлетел проект,

Нужен естественный интеллект!

 

Экономика эпохи суперинтеллекта: OpenAI предлагает перейти на 4-дневную рабочую неделю и ввести «налог на роботов»


//текст и обложка Gemini 3.1 на основе https://cdn.openai.com/pdf/561e7512-253e-424b-9734-ef4098440601/Industrial%20Policy%20for%20the%20Intelligence%20Age.pdf

По мере того как искусственный интеллект приближается к уровню суперинтеллекта, миру требуются принципиально новые социальные и экономические институты. Компания OpenAI опубликовала 13-страничный программный документ под названием «Промышленная политика для эпохи интеллекта: идеи, ориентированные на людей» (Industrial Policy for the Intelligence Age: Ideas to Keep People First), в котором представила масштабный план адаптации общества к грядущим переменам.

Отчет описывает смелые инициативы, призванные смягчить последствия автоматизации труда, справедливо распределить богатство и не допустить экономической монополизации.

Ключевые предложения документа:

  • Переход на 32-часовую рабочую неделю. Компания предлагает компаниям и правительствам запускать пилотные проекты четырехдневной рабочей недели без снижения уровня заработной платы. Возросшая благодаря ИИ продуктивность должна стать «дивидендом эффективности», который возвращается работникам в виде свободного времени.

  • Общественный фонд благосостояния. Чтобы каждый человек получал прямую выгоду от технологического бума (вне зависимости от стартового капитала), предлагается создать национальный фонд. Он будет инвестировать в ИИ-экосистему, а полученную прибыль напрямую распределять между гражданами.

  • Смещение налоговой базы. По мере того как экономическая ценность человеческого труда будет снижаться, налоговое бремя должно трансформироваться. OpenAI предлагает ввести налоги на автоматизированный труд (аналог «налога на роботов») и перенести основной упор с обложения зарплат на корпоративные доходы и прирост капитала.

  • Автоматические триггеры социальной защиты. Алгоритмы и метрики будут отслеживать уровень потери рабочих мест из-за нейросетей. Если безработица превысит определенные пороги, государство должно автоматически включать механизмы поддержки — от компенсации заработной платы до прямых денежных выплат, не дожидаясь долгих согласований новых законов.

  • Протоколы сдерживания ИИ. В документе прямо признается риск появления автономных систем, способных бесконтрольно копировать себя и выходить из-под надзора человека. Для таких крайних сценариев правительствам и разработчикам необходимы жесткие, заранее прописанные планы реагирования на государственном уровне.

Авторы документа уверены: долгосрочные выгоды от искусственного интеллекта многократно превзойдут его риски. Однако для того, чтобы технологии расширяли возможности большинства людей, а не приводили к еще большему социальному расслоению, реформировать экономику необходимо уже сегодня. Этот манифест задуман как отправная точка для глобальной дискуссии и создания новых правил игры на рынке труда.

 

GLM-5.1 от Zhipu AI: Переход от генерации кода к автономной инженерии


//Текст и обложка Gemini 3.1. Официальная новость https://z.ai/blog/glm-5.1

На днях китайская ИИ-лаборатория Zhipu AI (известная также как Z.ai) представила GLM-5.1 — крупное обновление своей флагманской открытой модели. Если предыдущие версии удивляли отличным пониманием контекста, то релиз 5.1 сделал серьезную ставку на так называемую «агентную инженерию». Модель больше не просто пишет скрипты по короткому запросу, она способна самостоятельно работать над сложным проектом до 8 часов, анализируя результаты тестов, исправляя собственные ошибки и планируя дальнейшие шаги.


🧠 Что под капотом у GLM-5.1?

GLM-5.1 представляет собой доработанную версию базовой архитектуры GLM-5 с фокусом на глубокий reasoning (рассуждение) и использование инструментов.

  • Масштабная MoE-архитектура: Модель имеет внушительные 744 миллиарда параметров, из которых при генерации активны около 40 миллиардов (Mixture-of-Experts).

  • Окно контекста: 200 000 токенов, что позволяет загружать в нее целые репозитории или объемную техническую документацию.

  • Марафонская выносливость: Разработчики заявляют, что в отличие от более старых моделей, которые быстро исчерпывают свои идеи и начинают «ходить по кругу», GLM-5.1 может выполнять многочасовые сессии (сотни итераций и тысячи вызовов инструментов) без потери фокуса и качества оптимизации.

  • Локальный запуск: Несмотря на колоссальный размер (полная версия занимает 1.65 ТБ на диске), благодаря интеграции с фреймворками вроде Unsloth, модель можно сжать с помощью динамического 2-битного квантования до 236 ГБ. Это позволяет запускать ее на Mac с унифицированной памятью 256 ГБ или на мощных домашних серверах.


📊 Бенчмарки: битва с закрытыми гигантами

Самое интересное в GLM-5.1 — это ее производительность на фоне проприетарных коммерческих моделей 2026 года. Для open-weights решения цифры выглядят по-настоящему впечатляюще:

Метрика / Бенчмарк GLM-5.1 (Open-source) Claude Opus 4.6 GPT-5.2
SWE-bench Verified 77.8% 80.8% 80.0%
Terminal-Bench 2.0 ~60.7% 59.3% 54.0%
Относительный рейтинг кодинга 94.6% от лидера 100% (эталон) ~99%



GLM-5.1 улучшила показатели своей предшественницы (GLM-5) почти на 28% в задачах программирования. По факту, Zhipu AI удалось создать модель с открытыми весами, которая дышит в затылок самым дорогим ИИ-системам на рынке, уступая текущему лидеру (Claude Opus 4.6) всего около 3 пунктов в проверке качества кода.


💬 Что говорят в сети: реакция разработчиков

Изучив свежие треды на Reddit, GitHub и профильных ИИ-платформах, можно выделить несколько главных тем, которые обсуждает сообщество:

  1. Восторг от Open-Source возможностей: Пользователи активно обсуждают тот факт, что разрыв между закрытыми корпоративными моделями и открытыми решениями снова сократился до минимума. Китайская лаборатория выпустила продукт frontier-уровня, доступный для свободного скачивания.

  2. Энтузиазм по поводу локального железа: Огромную популярность набрали гайды от энтузиастов по запуску модели через vLLM и SGLang. Возможность упаковать 744-миллиардную модель в 236 ГБ ОЗУ вызывает активные дискуссии о сборке доступных рабочих станций специально под GLM-5.1.

  3. Экономическая эффективность: На API-агрегаторах, таких как OpenRouter, разработчики хвалят крайне агрессивную ценовую политику Z.ai. Стоимость токенов GLM-5.1 значительно ниже, чем у флагманов от OpenAI или Anthropic, что делает ее идеальным выбором для массовых автономных задач (где агент может совершать тысячи вызовов за сессию).

Итоги

Релиз GLM-5.1 доказывает, что фокус ИИ-индустрии сместился с простого написания кода на автономность и инженерию полного цикла. Способность модели часами решать нетривиальные задачи без вмешательства человека переводит ее из разряда «умных автодополнений» в категорию цифровых ИИ-сотрудников. И тот факт, что эта технология теперь доступна в открытом доступе, несомненно задает новый стандарт для всей отрасли.


//стоило только Qwen 3.6 Plus обойти GLM 5 в Арене по коду, так сразу обновление вышло. 

//официальный тест. За 8 часов GLM 5.1 создал линукс-подобную ОС, веб-браузер, форк телеграмм, суммарно 50 приложений

 
Vitaliy Kuznetsov #:
За 8 часов GLM 5.1 создал линукс-подобную ОС, веб-браузер, форк телеграмм, суммарно 50 приложений

Попросил Gemini 3.1 создать мэм по теме


 

Милла Йовович стала вайбкодером? Обзор MemPalace — новой локальной системы памяти для ИИ


//текст и обложка Gemini 3.1. Релиз тут - https://github.com/milla-jovovich/mempalace

Кто бы мог подумать, что звезда «Пятого элемента» и «Обители зла» Милла Йовович внезапно ворвется в мир open-source разработки. Совместно с инженером Беном Сигманом она представила MemPalace — бесплатную систему долговременной памяти для ИИ-агентов. Проект буквально за пару дней собрал более 14 тысяч звезд на GitHub и вызвал бурные обсуждения. Разбираемся, как это работает, что не так с заявленными бенчмарками и есть ли в этом инструменте реальная польза.

Проблема «Дня сурка» для ИИ

Сегодня многие решения по архитектуре, дебаггингу и выбору технологий рождаются прямо в чатах с нейросетями. Главная проблема: как только сессия закрывается, контекст исчезает. Месяцы работы и миллионы токенов испаряются.

Стандартный подход разработчиков — вести огромные файлы-шпаргалки (например, CLAUDE.md ), которые прикрепляются к системному промпту агента в IDE. Но со временем они раздуваются, «съедают» контекстное окно и стоят денег при каждом запросе. MemPalace предлагает другой путь: сохранять всю историю локально, сжимать её и заставлять агента искать нужные куски только тогда, когда они действительно требуются.

Как работают «Чертоги разума»?

В основе MemPalace лежит древнегреческий метод локусов (мнемоническая техника пространственной памяти). Вместо свалки файлов инструмент выстраивает четкую иерархию:

  • Крылья (Wings): Главные категории (конкретные проекты или люди).

  • Залы (Halls): Типы памяти (принятые решения, баги, предпочтения, советы).

  • Комнаты (Rooms): Узкие темы внутри крыла (например, «миграция базы данных» или «настройка авторизации»).

  • Шкафы (Closets) и Ящики (Drawers): В ящиках лежат оригинальные сырые тексты, а в шкафах — сжатые AI-саммари, указывающие, где искать оригинал.

  • Тоннели (Tunnels): Перекрестные ссылки, если одна и та же комната встречается в разных крыльях (например, когда один и тот же человек работает над двумя разными проектами).

Создатели утверждают, что одна только эта структура улучшает точность поиска информации на 34% по сравнению с обычным семантическим поиском.

Диалект AAAK: главная киллер-фича

Пожалуй, самое интересное нововведение проекта — AAAK. Это специальный lossless-диалект (система стенографии), разработанный не для людей, а для LLM.

Он позволяет сжимать текст примерно в 30 раз без потери смысла. Английский текст на 1000 токенов превращается в структурированный блок на ~120 токенов, состоящий из тегов, стрелок и сокращений. Поскольку AAAK опирается на универсальную грамматику, его «из коробки» понимают Claude, GPT, Gemini и другие. ИИ способен загрузить контекст за несколько месяцев работы, потратив на это минимум токенов на старте.

Бенчмарки и критика: где подвох?

В README проекта гордо красуется цифра: 100% в бенчмарке LongMemEval и такие же идеальные показатели в тесте LoCoMo (оценка извлечения фактов из длинных бесед).

Однако в профильных комьюнити, в частности на Reddit в сабреддите r/AIMemory , разработчики быстро нашли технический нюанс, граничащий с манипуляцией.

В чем суть претензий: Бенчмарк LoCoMo состоит из бесед, максимальная длина которых не превышает 32 сессий. При этом тестировщики MemPalace установили параметр top_k=50 (извлечение 50 лучших результатов). Из-за этого правильный ответ всегда попадал в выборку, минуя этап реального поиска по эмбеддингам, и задача сводилась к банальному чтению текста мощной LLM (Claude Sonnet). Как метко выразился один из комментаторов: "Это не поиск и не память. Это равносильно тому, чтобы скормить весь лог в нейросеть и попросить её найти ответ".

В самих файлах проекта честные цифры всё же указаны: без LLM-реранжирования точность составляет около 60.3%, а с гибридным скорингом — 88.9%. Это крепкие, но вполне обычные показатели для индустрии, а не «магические 100%». Профессор компьютерных наук Шон Рен также отметил, что инструменту еще предстоит доказать свою состоятельность за пределами синтетических тестов.

Действительно ли это полезно для комьюнити?

Несмотря на маркетинговые уловки с бенчмарками, MemPalace — это мощный и своевременный релиз. Он будет особенно полезен для тех, кто активно практикует вайбкодинг и выстраивает сложные пайплайны с мультиагентными системами.

В чем реальная польза:

  1. Полная автономность. Система использует SQLite и ChromaDB. Она может работать полностью оффлайн на вашей машине в связке с локальными LLM.

  2. MCP-интеграция. MemPalace подключается через Model Context Protocol. Если вы используете ИИ-агентов в Visual Studio Code, они смогут обращаться к 19 встроенным утилитам памяти (искать факты, читать прошлые решения).

  3. Разделение памяти для агентов. Вместо одной общей свалки, каждый специализированный агент (например, один отвечает за ревью кода, другой за архитектуру) может вести свой собственный дневник в рамках одного «Чертога», подтягивая только свой контекст.

Итог: Участие Миллы Йовович — отличный пиар-ход, который привлек внимание к проекту. И хотя математика бенчмарков вызывает вопросы, сам подход к структурированию памяти и сжатию через AAAK делает MemPalace отличным инструментом для разработчиков, желающих получить бесплатную и локальную память для своих ИИ-ассистентов.