Midjourney и другие нейросети обработки изображений - страница 1083

 

Из недавнего интервью Павла Дурова.

— Вас впечатляет искусственный интеллект?

— Проблема в том, что современный генеративный ИИ типа LLM не думает. Он не понимает. Он просто считывает огромное количество текста и выплёвывает консенсусную версию. Звучит правдоподобно, но это не обязательно так. И мы, люди, позволяем себя обмануть, потому что ассоциируем сложный язык с интеллектом. Но эти модели не интеллектуальны. Они просто сложные. Мой брат Николай сейчас работает над настоящим ИИ — ИИ, который способен логически мыслить и понимать мир.

— Заменит ли он некоторые профессии?

— Мы переживаем беспрецедентное технологическое ускорение. Для подростка адаптация естественна. Но для опытных профессионалов, таких как юристы или врачи с высокой зарплатой, процесс адаптации будет жестоким. Их воспринимаемая рыночная стоимость может упасть, даже если они прекрасно себя чувствуют. Да, рабочие места исчезнут. Но история показывает, что появятся и другие. Главное — это созданное богатство. Жить как король, не работая как раб, — это форма прогресса. И пока люди хотят творить, вносить свой вклад в развитие общества, место найдётся для всех.

 
Vitaliy Kuznetsov #:

Из недавнего интервью Павла Дурова.

...

— Проблема в том, что современный генеративный ИИ типа LLM не думает. Он не понимает. Он просто считывает огромное количество текста и выплёвывает консенсусную версию. Звучит правдоподобно, но это не обязательно так. И мы, люди, позволяем себя обмануть, потому что ассоциируем сложный язык с интеллектом. Но эти модели не интеллектуальны. Они просто сложные. Мой брат Николай сейчас работает над настоящим ИИ — ИИ, который способен логически мыслить и понимать мир.

...

Мыслить...

Вот бы Николай с Павлом раскрыли тему мышления. Когда оно трушное, а когда нетрушное. 

 

Minimax выпустили ИИ-агента.

Сделает глубокое исследование, соберёт всю инфу, картинки, создаст сайт и озвучку

https://agent.minimax.io

 

Veo3 добавят в YouTube


Итак, что имеем:

1) Создавать сайты уже не очень хорошая затея. Вероятность, что его будут посещать крайне мала. Разве что в поисковом саммари будет отсылка, что текст взят с твоего сайта

2) Создавать видео тоже уже не очень затея. Те же саммари и тонны сгенерированного контента утопят всех видеоблогеров

 

Gigachat выпустил приложение на смартфон и добавил новую знакомую всем функцию - глубокие исследования


 

В Яндекс.Переводчик добавили ИИ Алису. Теперь можно не только переводом заниматься, но и уточнять детали, правила, произношение.

// Один переводчик ушёл, а другой стал лучше того


 

В Поиск Google добавлен аудиорежим. Задавайте и уточняйте вопросы, ответ также голосом. Работает на базе Gemini

 

Пересказ статьи «Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025» (Habr, Timeweb Cloud)

Выпуск охватывает главные новости в сфере искусственного интеллекта за вторую неделю июня 2025 года. Вот основные события:

Модели и LLM

  • OpenAI o3 Pro
    OpenAI выпустила модель o3 Pro — это reasoning-модель, доступная в ChatGPT Pro, Team и через API, которая стоит в 7,5 раз дешевле предыдущей версии o1 Pro. За миллион токенов теперь $20 на вход и $80 на выход (против $150/$600 ранее). Модель поддерживает интернет-поиск, работу с файлами, Python, визуальное восприятие и персонализированную память. По тестам o3 Pro превосходит Claude 4 Opus и Gemini 2.5 Pro. Также снижены цены на обычную o3 ($2/$8 за миллион токенов). Это делает линейку o3 более доступной для разработчиков и стартапов.
  • Magistral от Mistral
    Французский стартап Mistral представил Magistral — свою первую reasoning-модель. Magistral Medium по бенчмаркам сравнима лишь с январской версией DeepSeek-R1, но стоит дороже (2/5 доллара за миллион токенов). Модель обучалась только с помощью RL, без стадии SFT, из-за чего не дотягивает до продакшн-уровня, но отличается высокой скоростью генерации (1000+ токенов/сек).
  • LLM от Avito
    Avito показала собственную LLM, оптимизированную под русский язык, с токенизатором, который требует на 29% меньше токенов, что делает модель до 2 раз быстрее аналогов. Визуальная модель умеет распознавать и описывать изображения, считать объекты и определять бренды. Для автоматизации рутинных задач создана ML-платформа с no-code интерфейсом. На Data Fest модель заняла первое место среди небольших моделей.
  • MiniMax M1
    Китайский стартап MiniMax выпустил открытую модель M1 с reasoning и контекстным окном в 1 млн токенов. В бенчмарках по математике и программированию MiniMax-M1 сравнима или превосходит Gemini 2.5 Pro, DeepSeek-R1 и Qwen3-235B, при этом требует меньше ресурсов для генерации длинных текстов.

AI-инструменты и интерфейсы

  • Apple iOS 26 и Apple Intelligence
    На WWDC 2025 Apple представила iOS 26 с офлайн AI-функциями: перевод разговоров в реальном времени, интеграция ChatGPT в камеру (аналог Google Lens), возможность сторонним разработчикам подключать свои LLM через Foundation Models Framework. Все функции работают офлайн и доступны на многих устройствах бесплатно.
  • Sparc3D
    Новый генератор 3D-моделей, способный создавать детализированные объекты, достраивать скрытые части сцены и работать с органическими формами. Доступен через демо и открытую репу на GitHub.
  • Wispr Flow
    Голосовая клавиатура, распознающая более 100 языков и даже шёпот, работает на iOS, macOS, Windows. Поддерживает адаптацию под пользователя, словари и специальные символы. Бесплатный план ограничен, платная подписка — $12 в месяц.
  • Seedance от ByteDance
    Новый видеогенератор, по слепому голосованию превосходящий Google Veo 3 по качеству. Ориентирован на креативные задачи, плавность движения и точное соответствие запросу. Пока доступна мини-версия, интеграция идёт в платформу Dreamina.
  • Dolphin от ByteDance
    Модель для преобразования PDF в редактируемые документы без потери структуры и форматирования. Особенно полезна для презентаций, отчётов и сканов. Доступна на Hugging Face и GitHub.
  • Rocket
    No-code генератор приложений и сайтов: создаёт сервисы по текстовому запросу, поддерживает импорт из Figma, моментальную публикацию и редактирование в браузере. Бесплатен и подходит для MVP и быстрых прототипов.

AI в обществе и исследованиях

  • Embryo от Nucleus
    «Конструктор детей» — ИИ-платформа с настройкой IQ и других параметров эмбриона.
  • Нанопротез для зрения
    Новый нанопротез возвращает зрение и даже даёт инфракрасное зрение.
  • Ограничения ИИ в Китае
    На время экзаменов в Китае отключат распознавание фото ИИ.
  • Суд Disney против Midjourney
    Disney и Universal подали в суд на Midjourney за нарушение авторских прав.
  • Исследование RAND
    Вероятность ИИ-апокалипсиса признана маловероятной, но не исключённой.
  • Дети и ИИ
    Каждый четвёртый ребёнок уже использует ИИ, не всегда по назначению.

AI-инфраструктура

  • Абу-Даби
    Первый город в мире под полным управлением ИИ.
  • AMD против Nvidia
    AMD представила MI400x, Helios AI-Rack и облако для разработчиков, конкурируя с Nvidia.
  • IBM
    Строит отказоустойчивый квантовый компьютер на 200 логических кубит.
  • Meta
    Показала новую версию открытого «ИИ-мозга» для роботов.

Вывод:
Неделя была насыщенной: новые модели, снижение цен на ИИ, массовое внедрение AI-функций в устройства и приложения, а также важные сдвиги в инфраструктуре и регулировании. Китайские и европейские компании активно догоняют лидеров, а Apple делает AI максимально доступным для пользователей и разработчиков.

https://habr.com/ru/companies/timeweb/articles/919536/

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025
Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025
  • 2025.06.19
  • habr.com
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта. Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ. Неделя выдалась интересной: выход o3-pro , думающая модель от Mistral , презентации от Apple и AMD , интересные спейсы на HuggingFace...
 

Арты. Миджорни