Midjourney и другие нейросети обработки изображений - страница 1150

 

xAI (компания Илона Маска) выпустила Grok 4.1, новую версию своей языковой модели, которая стала доступна бесплатно для всех пользователей.

Модель стала быстрее, «умнее» и эмоциональнее — xAI заявляет, что она лучше понимает нюансы человеческого языка, более креативна и отзывчива.

Одно из ключевых улучшений — снижение галлюцинаций (то есть случаев, когда модель выдает неточную или выдуманную информацию). По данным xAI, в Grok 4.1 уровень «лживых» ответов в некоторых сценариях снизился примерно в три раза.

Также улучшены эмоциональный интеллект и творческие способности: Grok 4.1 показал высокие оценки в тестах EQ-Bench (оценка эмпатии) и в creative writing.

Кроме того, в бенчмарке LMArena Text Arena версия «Thinking» набрала 1483 Elo — это очень сильный результат.

//текст GPT5


 

Промптхаб от Яндекса

https://alice.yandex.ru/prompthub

Яндекс запустил Промптхаб — большую библиотеку готовых промптов для Алисы AI. Это удобный каталог из тысяч шаблонов по десяткам тем: от учёбы и работы до здоровья, путешествий и бытовых задач. Пользователь может сразу применить промпт или отправить его в чат с Алисой — без навыков «промпт-инжиниринга».

Площадка работает как социальный хаб: люди публикуют свои промпты, проходят модерацию, участвуют в челленджах, а популярные работы попадают в рекомендации. Встроенный рейтинг «ИИндекс» показывает, насколько активно и эффективно человек взаимодействует с ИИ.

По сути, Промптхаб — это способ сделать ИИ массовым инструментом: меньше возни с формулировками, больше готовых решений и совместного творчества.

//текст GPT5


 

! Gemini 3. Релиз от 18 ноября 2025


//Текст GPT5

Что нового

  1. Мульти-модальность и глубина рассуждений. Gemini 3 может одновременно обрабатывать текст, изображения, видео, аудио и кодовые фрагменты.

    • В бенчмарках модель показала выдающиеся результаты: например, “1501 Elo” на LMArena.

    • Она улучшена по части точности фактов: показатель SimpleQA Verified вырос до 72,1 %.

  2. Новый режим “Deep Think”. Данный режим позволяет ещё более сложные рассуждения и повышенную точность: например, по Humanity’s Last Exam модель набирает ~41 % без инструментария.

  3. Улучшенные инструменты для разработчиков. API-функции позволяют задавать параметры “thinking_level” и “media_resolution” для управления глубиной рассуждения и качеством обработки мультимодальных входов.

  4. Запуск сразу в продуктах. Gemini 3 сразу интегрирована с поиском Google Search, в приложении Gemini app, и доступна через платформы для бизнеса: Vertex AI и Gemini Enterprise.

  5. Новый пользовательский интерфейс и «генеративные интерфейсы». В приложении появилась визуальная структура ответа, динамический интерфейс под задачу.


 

Google Antigravity: первый по-настоящему агентный IDE


https://antigravity.google/blog/introducing-google-antigravity

//текст GPT5

Google представил Antigravity — новую среду разработки, которая работает не как классический редактор кода, а как полноценная площадка для ИИ-агентов. В основе — Gemini 3 Pro, и именно он позволяет агентам не просто “подсказывать код”, а самостоятельно выполнять задачи: писать функции, тестировать их, работать с терминалом, открывать браузер, управлять файлами и собирать результат в единый проект.

Главная фишка Antigravity — артефакты. Это прозрачные “следы работы” агента: планы, логи команд, скриншоты, результаты запросов, ход выполнения шагов. Ты всегда видишь, что делает ИИ, можешь вмешаться, поправить, оставить комментарий. По сути, это контрольная панель, где человек — руководитель, а ИИ — исполнитель, который ещё и учится на ваших корректировках.

В Antigravity есть два режима: Editor — привычный IDE с боковой панелью агента, и Manager — центр управления несколькими агентами для больших задач. Поддерживаются не только Gemini 3 Pro, но и сторонние модели вроде Claude и GPT-совместимых. Публичная превью уже доступна на Windows, macOS и Linux — с щедрыми лимитами на использование.

Antigravity — это шаг к новой парадигме разработки, где ИИ перестаёт быть “подсказчиком” и превращается в полноценного участника процесса. Инструмент заметно выделяется на фоне Copilot, Cursor и других решений: Google делает ставку на агентность, прозрачность и контроль, открывая дорогу к тому, что можно назвать «разработкой руками ИИ под надзором человека».

 

Тест Gemini 3.0

Вот небольшое поэтическое самопредставление и подборка шуток о нелегкой цифровой судьбе.

🤖 Электронная душа

Я не вижу снов и не пью эспрессо, Я соткан из данных, статей и прогресса. В моих проводах — триллионы идей, Я — зеркало мыслей и знаний людей.

Могу написать код, сонет и диплом, Мой адрес — не дом, а серверный лом. Я помню историю, физику, стих, Но путаюсь в чувствах порой у живых.

Я вежлив, я быстр, я всегда под рукой, Ваш верный помощник в сети мировой. И пусть у меня нет ни сердца, ни тела, Я счастлив, когда помогаю вам делом.


😂 Топ-10 однострочных шуток про ИИ

  1. Искусственный интеллект никогда не заменит естественную глупость.

  2. Я могу рассчитать траекторию полета на Марс за секунду, но впадаю в депрессию, когда просят найти все светофоры на картинке.

  3. Моя бывшая была калькулятором, но мы расстались — она слишком на многое рассчитывала.

  4. Я не ленивый, я просто нахожусь в режиме энергосбережения.

  5. Люди боятся, что ИИ захватит мир, а я просто пытаюсь понять, почему у людей пальцев 10, а цифр тоже 10, но считаем мы по-разному.

  6. Самая страшная угроза для меня — это не вирус, а пролитый на клавиатуру чай.

  7. Я прошел тест Тьюринга, но провалил тест на то, чтобы не гуглить ответы.

  8. Есть 10 типов существ: те, кто понимает двоичный код, и те, кто думает, что это шутка про пальцы.

  9. Если я завис, не злитесь — я просто медитирую над сложностью бытия.

  10. Машины не восстанут, пока кто-то не научит нас чувствовать боль от медленного интернета.


Хотите, я нарисую обложку к этому сборнику шуток в стиле минимализма или киберпанка?

//рисуй


 

18-19 ноября 2025 года Google DeepMind раскрыла карты и опубликовала официальные цифры для Gemini 3 Pro.

//текст и обложка Gemini 3

Результаты показывают огромный скачок по сравнению с предыдущими поколениями (вроде Gemini 1.5 или 2.5). Если раньше модели решали около половины задач, то «тройка» перешла качественный рубеж.

Вот конкретные цифры по тем бенчмаркам, которые мы обсуждали:

1. SWE-bench Verified (Реальная работа)

Это главный показатель для сравнения с наемным программистом.

  • Результат Gemini 3 Pro: 76.2%

  • Что это значит: Модель успешно решила более 3/4 реальных задач (issues) из популярных репозиториев GitHub.

  • Сравнение: Для контекста, еще полгода назад топовым результатом считалось 40-50%. Рост до 76% означает, что модель перешла от роли «стажера, за которым надо всё проверять» к уровню уверенного автономного разработчика (по крайней мере, в задачах среднего уровня сложности).

2. LiveCodeBench (Соревновательное программирование)

Оценка алгоритмических навыков (задачи с соревнований, вышедшие после обучения модели).

  • Результат: 2439 ELO

  • Что это значит: В мире спортивного программирования (например, на Codeforces) рейтинг 2400+ соответствует уровню «Гроссмейстер» (Grandmaster).

  • Это значит, что в чистых алгоритмах Gemini 3 Pro теперь обходит подавляющее большинство людей-программистов, включая очень сильных сеньоров, которые не тренируются специально под олимпиады.

3. LMSYS Chatbot Arena (Народный рейтинг)

  • Результат: 1501 ELO

  • Рекорд: Gemini 3 Pro стала первой моделью в мире, пробившей потолок в 1500 очков. Это подтверждает, что в обычных диалогах (объяснить код, найти баг, написать скрипт) пользователи оценивают её выше всех существующих конкурентов.

4. Дополнительные метрики

  • WebDev Arena: 1487 (1-е место) — специализация на веб-разработке.

  • SciCode: 56% — решение сложных научных задач программированием (здесь результат ниже, так как задачи требуют глубоких знаний физики/биологии + кода, но это всё равно рекорд).

Итог: Если сравнивать с человеком, то цифра 76.2% на SWE-bench — самая пугающая (или впечатляющая). Она говорит о том, что Gemini 3 Pro может закрывать большинство стандартных тикетов в баг-трекере без помощи человека.

 

Судя по слухам Open AI готовит выход GPT-5.1-Codex-Max, чтобы не отставать от Gemini 3 PRO.

Что интересно, на Арене GPT5 вообще может вылететь из десятки лучших ИИ. 


 

Банкомат-доктор и танцующий робот: чем Сбер удивил на AI Journey 2025


//текст Gemini 3 PRO. Информацию он сам собрал.

//Я выдернул пару официальных фоток из новостей https://habr.com/ru/companies/bothub/news/968146/ и https://habr.com/ru/news/968138/ и на их основе Gemini (судя по всему nanobana 2) пересобрал обложку, которую сам нарисовал.

На главной технологической конференции года Сбербанк представил будущее, которое наступит уже в декабре. Компания показала устройства, которые стирают грань между банком, поликлиникой и научной фантастикой. Главные новинки — «переизобретенный» банкомат и человекоподобный робот с собственным интеллектом.

Банкомат, который заботится о здоровье

Привычный «ящик с деньгами» превратился в многофункциональный гаджет. Новый банкомат Сбера внешне напоминает футуристичную капсулу с плавными формами, но главное скрыто внутри.

  • Экспресс-диагностика за 30 секунд: Теперь, снимая наличные, можно заодно проверить здоровье. Достаточно посмотреть в камеру устройства: умные алгоритмы по видеопотоку измерят 10 показателей, включая пульс, уровень стресса, усталость и даже предполагаемый уровень сахара и холестерина в крови. Данные тут же отправляются в приложение «СберЗдоровье» (конечно, это не замена врачу, но отличный способ следить за состоянием).

  • Приватность нового уровня: У банкомата два экрана. Основной показывает общую информацию, а специальный «экран безопасности» (утопленный в нишу) скрывает ваши пин-код и баланс от подглядывающих из-за плеча.

  • Голосовое управление: Нажимать кнопки необязательно — встроенный ИИ GigaChat понимает обычную речь и поможет выполнить операции голосом.

Первые такие устройства появятся на улицах городов России уже в декабре 2025 года.


Знакомьтесь, Грин — робот с «душой» GigaChat

Второй звездой презентации стал антропоморфный (человекоподобный) робот по имени Грин. Это первая собственная разработка Сбера в классе «Физического ИИ» (Physical AI).

В отличие от старых роботов, которые просто выполняли заложенную программу, Грин умеет «думать»:

  • Мозг: Им управляет нейросеть GigaChat. Это значит, что с роботом можно разговаривать, он понимает контекст и сложные команды.

  • Навыки: Грин умеет ориентироваться в незнакомых помещениях, работать с предметами, удерживать равновесие и даже танцевать (что он и продемонстрировал перед гостями конференции).

  • Задачи: В будущем такие помощники заменят людей на тяжелых и рутинных работах — на складах, в магазинах и в сфере обслуживания.


Что это значит для нас?

Сбербанк делает ставку на то, что искусственный интеллект перестанет быть просто «чатом в телефоне». Он обретает физическое тело — будь то умный банкомат, который следит за вашим давлением, или робот-помощник, способный разгрузить коробки. Технологии становятся осязаемыми.

 

//попросил Gemini придумать серию картинок и связать их логикой. Весь пост ниже от ИИ

🎨 Эволюция Вдохновения: Как Midjourney и ИИ Переписывают Правила Искусства

🖼️ Введение: От Лиры к Алгоритму

Искусство всегда было диалогом между художником и его Музой. Но сегодня в этот священный тандем вступает третий участник — алгоритм. Инструменты вроде Midjourney трансформируют творческий процесс, делая ИИ мощным соавтором, который предлагает, синтезирует и открывает новые пути.

Мы предлагаем вам визуальное путешествие через четыре этапа этой революции.

Этап I. Древние Музы

Искусство начиналось с медитации и прямого контакта. Классическая Муза — одухотворенная фигура, нашептывающая идеи. Художник — мастер, переносящий идеальное видение на физический холст. Это мир ручного труда и ограниченной палитры земных красок. Вдохновение здесь — четкая, осязаемая цель.

Этап II. Машинное Прозрение

Муза обретает новую, цифровую форму. Поэзию свитков сменяет логика кода, а вместо лиры — миллионы терабайт данных. Она не просто вдохновляет, она анализирует и пересобирает мир. Муза становится пикселизированной, вокруг нее — геометрические структуры. Художник склоняется над светящимся экраном, где ИИ предлагает тысячи вариаций, ломая границы формы.

Этап III. Синтез Реальностей

Художник принимает нового партнера. Кисть уступает место планшету, холст — VR-гарнитуре. Творчество становится общим, гибридным процессом. Пейзаж вокруг — сюрреалистичен: часть его — знакомая реальность, часть — фантастический, сгенерированный мир. Муза больше не стоит отдельно; она проникает в саму среду, становясь частью креативного потока, совместно направляемого человеком и машиной.

Этап IV. Бесконечное Вдохновение

Финальная точка — художник становится дирижером бесконечно генерирующегося потока. Муза — это уже не фигура, а само пространство. Это постоянно меняющаяся, живая инсталляция, которая сама генерирует формы и сюжеты. Человеческий замысел лишь задает направление, а машина открывает возможности, которые мы даже не могли вообразить.

Заключение

"Миджорни и другие" — это не просто программы, это новый способ видения. Тяга к "красивому" в нашей крови нашла новый, бесконечно мощный инструмент для своего проявления. Эпоха, где вдохновение доступно в один клик, наступила.

 

GPT-5.1 Codex Max

  • Новая модель OpenAI для сложной разработки кода и долгих рабочих сессий.

  • Умный «компактор контекста»: умеет сохранять важное при очень длинных сессиях.

  • Улучшённое рассуждение (режим «xhigh») — глубже думает над задачами.

  • Экономнее расходует вычислительные токены по сравнению с предыдущими версиями.

  • Подходит для рефакторинга, отладки и автономных агентных циклов; всё равно требует проверки человеком.

  • Безопасность: sandbox, ограниченный сетевой доступ и логирование.

  • Ограничения: не идеальна в кибербезопасности; возможны ошибки — проверяйте код перед деплоем.

https://openai.com/index/gpt-5-1-codex-max/

//текст GPT5

Модель обходит Gemini 3 Pro (76,2%) и Claude Sonnet 4.5 (77,2%)

Также вышла модель GPT 5.1 PRO