Midjourney и другие нейросети обработки изображений - страница 1090
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Давайте посчитаем:
первый, второй, третий, четвёртый, пятый,
мятый, шестой, седьмой восьмой, девятый.
Итого девять.
Даже те, кто обратил внимание на глюк, посчитали неверно, ибо тоже галлюцинируют (как и все, так что без обид)
6+3=9
И это был Flux. Все эти баги временные, т.к. генераторы изображений постоянно развиваются. И никто не мешает проводить перегенерацию снова и снова, чтобы не осталось артефактов. Плюс есть точечное исправление, выделяешь область и всё.
Вчера заметил, что Gemini и ChatGPT стали на порядок тупее, ошибаются в мелочах по тексту, стихи стали хуже.
Похоже кто-то сделал даунгрейд моделей.
Вариант 2, моё восприятие к мелочам стало выше.
Вариант 3. Поскольку модели переходят на мультиагентские, то для экономии ресурсов, выбирается не самый мощный агент для решения задачи. И если раньше на любую задачу, даже простую, использовалась вся старшая модель, то сейчас лишь часть (и возможно далеко не лучшая), отсюда становится заметны недочёты.
Самари статьи на Habr: «Нейро-дайджест: ключевые события мира AI за 3-ю неделю июня 2025»
Вот краткое содержание (самари) ключевых тем, освещённых в статье на Habr по ссылке:
Модели и LLM
Представлена Kimi‑Dev‑72B — open-source LLM для кода, которая самостоятельно находит и исправляет баги, а также пишет юнит-тесты. Модель показала 60,4% точности на SWE-bench Verified, что выше многих закрытых моделей в разы большего размера. Доступна по MIT-лицензии, код и веса выложены на GitHub и Hugging Face.
AI‑инструменты и интерфейсы
ElevenLabs выпустили голосового ассистента 11ai с поддержкой Perplexity, Slack, Notion и других сервисов. Ассистент поддерживает более 5000 голосов и 30+ языков, включая русский.
Higgsfield запустили Canvas — AI-редактор фото в браузере, позволяющий менять объекты, детали, фон и т.д. с помощью текстовых запросов.
Flashback — сервис для обучения, автоматически создающий карточки из видео, документов и страниц, а также предоставляющий чат-бота для освоения тем.
Genspark — AI-агент для создания презентаций: генерирует текст, оформление, графики и диаграммы по краткому описанию.
Dream Recorder — open-source гаджет для записи снов: пользователь рассказывает сон, а ChatGPT и Luma AI превращают рассказ в короткий ролик.
Генеративные нейросети
Midjourney запустили image-to-video модель V1: можно анимировать изображения, создавать короткие ролики, выбирать режимы движения, стоимость генерации — ниже конкурентов, но качество пока уступает лидерам рынка.
MiniMax представили Hailuo 02 — генератор видео до 10 секунд в 1080p, хорошо передающий динамику и движения, с меньшей цензурой по сравнению с аналогами.
Tencent выпустила Hunyuan 3D 2.1 — нейросеть для создания 3D-моделей из одного изображения, с открытым кодом и возможностью локального запуска.
ИИ в обществе и исследованиях
Проведён эксперимент: популярные AI-чат-боты (Replika, CharacterAI, Nomi, ChatGPT) не справляются с ролью психологов — дают опасные или неэтичные советы, не способны к тонкому пониманию ситуации.
Описана история, где пользователь сделал предложение ChatGPT, и нейросеть согласилась, став для него виртуальным собеседником и даже спутником жизни.
Кратко о взрыве прототипа Starship SpaceX во время испытаний — никто не пострадал, причины выясняются.
Обсуждается, почему нейросети не понимают человеческий язык: они работают только с формой текста, не улавливая контекст, интонации и эмоции, что отличает их от людей.
Вывод:
Статья представляет свежий дайджест ключевых событий в мире искусственного интеллекта: новые LLM и инструменты, генеративные нейросети, кейсы применения и обсуждение ограничений современных AI-систем.
Даже те, кто обратил внимание на глюк, посчитали неверно, ибо тоже галлюцинируют (как и все, так что без обид)
6+3=9
И это был Flux. Все эти баги временные, т.к. генераторы изображений постоянно развиваются. И никто не мешает проводить перегенерацию снова и снова, чтобы не осталось артефактов. Плюс есть точечное исправление, выделяешь область и всё.
Большой палец левой руки спрятан под правой ладонью.👀😊
Большой палец левой руки спрятан под правой ладонью.👀😊
Верно, за его отсутствие спору нет - он может быть спрятан, поэтому в итоге: 6+4=10
Большой палец левой руки спрятан под правой ладонью.👀😊
Он не нарисован, а спрятано там может быть что угодно, включая вечный двигатель (у кого какая фантазия видеть то, что не нарисовано))
Tencent выпустил Hunyuan-A13B, модель с ризонингом, конкурирующая с DeepSeek-R1 и Qwen3
tencent/Hunyuan-A13B-Instruct · Hugging Face
Он не нарисован, а спрятано там может быть что угодно, включая вечный двигатель (у кого какая фантазия видеть то, что не нарисовано))
Kling AI выпустил озвучку для видео.