Midjourney и другие нейросети обработки изображений - страница 1090

 
Aleksei Stepanenko #:

Давайте посчитаем:

первый, второй, третий, четвёртый, пятый,

мятый, шестой, седьмой восьмой, девятый.

Итого девять.

Не правильно считаешь, надо: 
На правой руке 1,2,3,4, пять, 
На левой руке 10,9,8,7,6
Итого 5+6 = 11 пальцев 
 

Даже те, кто обратил внимание на глюк, посчитали неверно, ибо тоже галлюцинируют (как и все, так что без обид)

6+3=9

И это был Flux. Все эти баги временные, т.к. генераторы изображений постоянно развиваются. И никто не мешает проводить перегенерацию снова и снова, чтобы не осталось артефактов. Плюс есть точечное исправление, выделяешь область и всё.


 

Вчера заметил, что Gemini и ChatGPT стали на порядок тупее, ошибаются в мелочах по тексту, стихи стали хуже.

Похоже кто-то сделал даунгрейд моделей.


Вариант 2, моё восприятие к мелочам стало выше.


Вариант 3. Поскольку модели переходят на мультиагентские, то для экономии ресурсов, выбирается не самый мощный агент для решения задачи. И если раньше на любую задачу, даже простую, использовалась вся старшая модель, то сейчас лишь часть (и возможно далеко не лучшая), отсюда становится заметны недочёты.

 

Самари статьи на Habr: «Нейро-дайджест: ключевые события мира AI за 3-ю неделю июня 2025»

Вот краткое содержание (самари) ключевых тем, освещённых в статье на Habr по ссылке:

Модели и LLM

  • Представлена Kimi‑Dev‑72B — open-source LLM для кода, которая самостоятельно находит и исправляет баги, а также пишет юнит-тесты. Модель показала 60,4% точности на SWE-bench Verified, что выше многих закрытых моделей в разы большего размера. Доступна по MIT-лицензии, код и веса выложены на GitHub и Hugging Face.

AI‑инструменты и интерфейсы

  • ElevenLabs выпустили голосового ассистента 11ai с поддержкой Perplexity, Slack, Notion и других сервисов. Ассистент поддерживает более 5000 голосов и 30+ языков, включая русский.

  • Higgsfield запустили Canvas — AI-редактор фото в браузере, позволяющий менять объекты, детали, фон и т.д. с помощью текстовых запросов.

  • Flashback — сервис для обучения, автоматически создающий карточки из видео, документов и страниц, а также предоставляющий чат-бота для освоения тем.

  • Genspark — AI-агент для создания презентаций: генерирует текст, оформление, графики и диаграммы по краткому описанию.

  • Dream Recorder — open-source гаджет для записи снов: пользователь рассказывает сон, а ChatGPT и Luma AI превращают рассказ в короткий ролик.

Генеративные нейросети

  • Midjourney запустили image-to-video модель V1: можно анимировать изображения, создавать короткие ролики, выбирать режимы движения, стоимость генерации — ниже конкурентов, но качество пока уступает лидерам рынка.

  • MiniMax представили Hailuo 02 — генератор видео до 10 секунд в 1080p, хорошо передающий динамику и движения, с меньшей цензурой по сравнению с аналогами.

  • Tencent выпустила Hunyuan 3D 2.1 — нейросеть для создания 3D-моделей из одного изображения, с открытым кодом и возможностью локального запуска.

ИИ в обществе и исследованиях

  • Проведён эксперимент: популярные AI-чат-боты (Replika, CharacterAI, Nomi, ChatGPT) не справляются с ролью психологов — дают опасные или неэтичные советы, не способны к тонкому пониманию ситуации.

  • Описана история, где пользователь сделал предложение ChatGPT, и нейросеть согласилась, став для него виртуальным собеседником и даже спутником жизни.

  • Кратко о взрыве прототипа Starship SpaceX во время испытаний — никто не пострадал, причины выясняются.

  • Обсуждается, почему нейросети не понимают человеческий язык: они работают только с формой текста, не улавливая контекст, интонации и эмоции, что отличает их от людей.

Вывод:
Статья представляет свежий дайджест ключевых событий в мире искусственного интеллекта: новые LLM и инструменты, генеративные нейросети, кейсы применения и обсуждение ограничений современных AI-систем.

  1. https://habr.com/ru/companies/timeweb/articles/921634/
 
Vitaliy Kuznetsov #:

Даже те, кто обратил внимание на глюк, посчитали неверно, ибо тоже галлюцинируют (как и все, так что без обид)

6+3=9

И это был Flux. Все эти баги временные, т.к. генераторы изображений постоянно развиваются. И никто не мешает проводить перегенерацию снова и снова, чтобы не осталось артефактов. Плюс есть точечное исправление, выделяешь область и всё.


Большой палец левой руки спрятан под правой ладонью.👀😊

 
Alexey Viktorov #:

Большой палец левой руки спрятан под правой ладонью.👀😊

Верно, за его отсутствие спору нет - он может быть спрятан, поэтому в итоге: 6+4=10

 
Alexey Viktorov #:

Большой палец левой руки спрятан под правой ладонью.👀😊

Он не нарисован, а спрятано там может быть что угодно, включая вечный двигатель (у кого какая фантазия видеть то, что не нарисовано))

 

Tencent выпустил Hunyuan-A13B, модель с ризонингом, конкурирующая с DeepSeek-R1 и Qwen3

tencent/Hunyuan-A13B-Instruct · Hugging Face


[Удален]  
Vitaliy Kuznetsov #:

Он не нарисован, а спрятано там может быть что угодно, включая вечный двигатель (у кого какая фантазия видеть то, что не нарисовано))

Перед вами портрет известного художника-портретиста Генератерло Флюксини. Несколько столетий назад он спрятал в своем послании под трехпалой рукой незнакомки чертежи вечного двигателя. Всегда все начинают считать пальцы, но никто не мог даже и подумать об таком секрете, кроме одного очень прозорливого современника. Однако его судьбоносный пост так и остался незамеченным несколько веков кряду
 

Kling AI выпустил озвучку для видео.