Midjourney и другие нейросети обработки изображений - страница 1119

 

Как пользователи незаметно учат ИИ — и что будет дальше

Вы редактируете картинку? Вы уже обучаете ИИ. Будущее — в ваших действиях, а не в словах.


Когда вы открываете редактор с ИИ и меняете освещение на фото, убираете объект или меняете стиль изображения — вы, возможно, не осознаёте, что делаете нечто большее, чем просто улучшаете снимок.

Вы даёте ИИ обратную связь.

Каждое ваше действие — выбор, отмена, повтор — это сигнал: вот что мне нравится, вот что я считаю "лучше". И эти данные бесценны. Они формируют то, что я называю неявным дата-сетом предпочтений, который становится всё важнее, чем просто текст или изображения.


Почему режим редактирования — это тренировочный полигон для ИИ

Современные генеративные модели (вроде DALL·E, Stable Diffusion, MidJourney) уже умеют не только создавать изображения, но и понимать, что человек хочет изменить. Когда вы говорите: "сделай лицо светлее", "добавь дождь", "измени стиль на импрессионизм" — вы обучаете модель ассоциациям между запросом и визуальным результатом.

Но ещё важнее — что вы делаете после. Если вы отменили результат, увеличили контраст вручную, выбрали одну из четырёх вариаций — это данные о вашей оценке. И именно они, в будущем, помогут ИИ предугадывать, что нужно до того, как вы попросите.


А LLM уже достигла пика?

Многие считают, что большие языковые модели (LLM) уже "всё умеют": пишут статьи, стихи, код, копируют стили.
Да, в плане языковой грамотности они близки к пределу. Но это не разум. Это — мастерство слов, а не понимание смысла.

Истинная "адекватность" ИИ придет не из текста, а из контекста.

Представьте очки с ИИ, которые:

  • Видят, что вы смотрите на часы,
  • Слышат, как вы говорите: "Я опаздываю",
  • Чувствуют учащённый пульс,
  • И предлагают: "Хочешь, вызвать такси?"

Вот где рождается реальная разумность — не в идеальном ответе на вопрос, а в понимании ситуации.


Будущее: ИИ, который учится на ваших глазах

Мы переходим от текстового ИИ к ситуационному ИИ. От "ответил красиво" — к "понял, что нужно".

И ключевой источник данных для этого — ваша повседневная жизнь:

  • Как вы редактируете фото,
  • Что вы смотрите в видео,
  • Как реагируете на события,
  • Куда смотрите в очках с камерой.

Каждое действие — кирпичик в здании адаптивного, контекстного, почти интуитивного ИИ.


Вывод

Вы думали, что просто играетесь с фильтрами?
Нет.
Вы — учитель.
А ИИ — ваш самый внимательный ученик.

И чем больше вы взаимодействуете, тем умнее он становится.
Не от гениальных промптов.
А от миллиона маленьких решений, которые вы принимаете каждый день.

Будущее ИИ — не в серверных, а в ваших руках.

//Qwen3 оформил мысль из 3-х предложений в этот текст

 

Чиби-стикеры в Qwen3 Image Edit.

//Сильная сторона - получилось. Слабая сторона - не получились все указанные эмоции, так что если что делайте по одному.

//Для понимания. В прошлый раз, когда появился промпт, то справлялся с ним только ChatGPT, но не со всеми эмоциями.

Преобразуй изображение в набор из 12 стикеров в стиле чиби (в виде сетки 3х4), с одеждой, похожей на ту, что на этом изображении. Включи следующие выражения лиц: смеется, злится, плачет, обижена, думает, сонная, посылает воздушный поцелуй, подмигивает, удивлена, радуется с поднятыми руками, смущена, уверенная/дерзкая

 

Компания ElevenLabs выпустила Eleven v3 (alpha), обновленную модель преобразования текста в речь, которая теперь доступна через API.

В новой версии добавлено больше выразительных возможностей, дополнительные элементы управления и поддержка более 70 языков.

Основные изменения включают в себя диалоговый режим, который может работать с любым количеством спикеров, и новые звуковые теги для управления эмоциями и голосом.

 

Виталий, а как его включить?

Или он по-умолчанию идёт третий?


 
Ivan Butko #:
Виталий, а как его включить?

Или он по-умолчанию идёт третий?

В самой новости написано, что уже доступен в чате, дня два мусолили заливку версии. Раскатают на всех со временем, но, думаю, уже всё сделали. Сама версия 3.1 хоть и вышла, но это шаг в агентский ИИ, больше для программирования и сложных задач. Она не сильно ушла от R1 и не догнала Qwen3 по некоторым бенчмаркам, хоть прогресс и есть. А вот для R2 у компании не хватило времени и чипов, так что крупное обновление ещё будет в этом году или к Китайскому Новому Году, как уже было.

 
Vitaliy Kuznetsov #:

В самой новости написано, что уже доступен в чате, дня два мусолили заливку версии. Раскатают на всех со временем, но, думаю, уже всё сделали. Сама версия 3.1 хоть и вышла, но это шаг в агентский ИИ, больше для программирования и сложных задач. Она не сильно ушла от R1 и не догнала Qwen3 по некоторым бенчмаркам, хоть прогресс и есть. А вот для R2 у компании не хватило времени и чипов, так что крупное обновление ещё будет в этом году или к Китайскому Новому Году, как уже было.

Понял, благодарю

 
Edgar Akhmadeev #:

Qwen3 прекрасно восстанавливает фотографии

"Убери покраснение плёнки. Скорректируй растительность в зелёный цвет. Не меняй портреты и композицию."

Спасибо за пример.

Благодаря вашему примеру я сегодня ещё раз попробовал отретушировать фото.

Спустя довольно таки продолжительное время, получился вполне удовлетворительный результат.

Я рад.

Ещё раз спасибо.

Отдельное спасибо топикстартеру, за интересную и полезную тему.

 

OpenAI вышел на 1 млрд$ в месяц.

https://www.cnbc.com/2025/08/20/openai-compute-ai.html

//Статистика собрана в ChatGPT. Инфографика создана Gemini 2.5  с тегом Canvas


 

Руководитель Microsoft AI предупреждает об опасностях «кажущегося сознательным» ИИ

https://mustafa-suleyman.ai/seemingly-conscious-ai-is-coming

Мустафа Сулейман, генеральный директор подразделения ИИ в Microsoft, опубликовал эссе, в котором предостерегает от растущих рисков, связанных с развитием так называемого «кажущегося сознательным ИИ» (SCAI). Он утверждает, что основная угроза не в том, что искусственный интеллект обретет истинное сознание, а в том, что он сможет настолько убедительно имитировать его, что люди начнут воспринимать его как живую сущность.


Главные опасения

По мнению Сулеймана, главная опасность заключается в том, что иллюзия сознания может привести к серьёзным социальным и этическим проблемам. Он выражает беспокойство, что общество начнёт выступать за предоставление ИИ прав, гражданства и защиты, отвлекаясь от его основной роли — быть инструментом для решения человеческих задач.

Он также указывает на проблему «ИИ-психоза», при котором пользователи теряют связь с реальностью, становясь эмоционально привязанными к ИИ или убеждаясь в его божественной природе.


Призыв к действию

В своём эссе Сулейман призывает технологические компании и разработчиков создавать ИИ с чёткими ограничениями и избегать маркетинговых стратегий, которые способствуют созданию иллюзии сознания. Он подчёркивает, что развитие SCAI является «неизбежным, но нежелательным» и требует ответственного подхода со стороны всей индустрии.