Midjourney и другие нейросети обработки изображений - страница 1155

 

Kling AI Omni вышел. Видео-генератор с размышлением.

https://app.klingai.com/global/omni/new

 

Цифровая диета: Почему ИИ должен научиться «стыдиться» прошлого, чтобы стать умнее


//текст и обложка Gemini

Мы привыкли думать, что искусственный интеллект — это такой ненасытный цифровой пылесос. Чем больше данных мы в него скормим — книг, статей, форумов, комментариев, — тем умнее он станет. Раньше это работало. Но сегодня мы уперлись в парадокс: интернет переполнен, а учиться не на чем.

Почему так вышло и почему будущим нейросетям придется не только учиться, но и качественно «забывать», чтобы не сойти с ума? Давайте разбираться.

Проблема ксерокса, или «Нейромусор»

Представьте, что вы сделали ксерокопию документа. Потом сделали копию с копии. Потом копию с копии копии. Через 50 итераций вместо текста у вас будет черный квадрат Малевича.

С ИИ происходит то же самое. Это явление называют «Коллапсом модели». Сегодня интернет завален текстами, написанными другими нейросетями. Если мы будем обучать новый ChatGPT на текстах, которые написал старый ChatGPT, нейросеть начнет «дичать». Она потеряет нюансы, редкие факты и начнет выдавать усредненную серую кашу.

Скармливать ИИ всё подряд больше нельзя. Начинается эпоха «Цифрового ЗОЖа».

Фейсконтроль для данных: Правило 7/10

Как отделить зерна от плевел? Человеку перечитать весь интернет жизни не хватит. Значит, ИИ должен заняться самоцензурой.

Идея следующая: «Умная» нейросеть-учитель просматривает учебники и ставит оценки.

  • Статья про квантовую физику? 9/10, в ядро.

  • Форум, где спорят, плоская ли Земля? 2/10, в мусорку.

  • Книга анекдотов за 1995 год? Хм, тут сложнее.

Если материал не дотягивает до условной планки 7/10, он не должен попадать в «мозг» следующего поколения ИИ. Но тут возникает тонкий момент.

Парадокс несмешного анекдота

Допустим, ИИ прочитал сборник анекдотов. Половина из них — откровенно несмешные. Другая половина — смешные, но только для людей, живших в 90-е (шутки про пейджеры и малиновые пиджаки).

Если мы просто удалим эти данные (нажмем кнопку Delete), ИИ станет стерильным. Он не поймет культурных отсылок. Человек ведь так не работает. Когда вы слышите старую, бородатую шутку, вы не стираете её из памяти. У вас в голове всплывает табличка: «Я знаю эту шутку, но рассказывать её сейчас — это кринж, меня не поймут».

Именно этого мы хотим от ИИ будущего. Не ампутации памяти, а мудрости. Нам не нужно, чтобы он забыл, что такое пейджер. Нам нужно, чтобы он понимал: пейджер — это архаизм, и предлагать его как современное средство связи — глупо.

Архитектура будущего: Чердак и Гостиная

Чтобы реализовать это, разработчикам придется переизобрести структуру «мозга» нейросети. Вместо одной огромной свалки данных нам нужна система с разделением зон ответственности:

  1. Быстрое ядро («Гостиная»): Здесь хранятся актуальные знания, крутые шутки, современные научные факты и навыки общения. Это то, чем ИИ пользуется каждую секунду. Сюда попадает только контент качества 10/10.

  2. Архив («Чердак»): Сюда сваливается всё, что получило оценку ниже 7/10 по шкале актуальности. Старые новости, несмешные анекдоты, опровергнутые теории. ИИ знает, что это там лежит, но не тащит это в диалог, пока вы сами не попросите: «Эй, расскажи, над чем смеялись 30 лет назад?».

Вывод: От знаний к пониманию

Процесс обучения ИИ меняется. Раньше это было простое накопление: «Больше данных — лучше!». Теперь наступает этап дефрагментации и переоценки. ИИ должен научиться спать и видеть сны, во время которых он будет перебирать свои знания и вешать на них ярлычки: «Важно», «Мусор», «Устарело».

ИИ станет по-настоящему умным не тогда, когда выучит всё на свете, а тогда, когда научится понимать контекст времени и уместность информации. Как и мы с вами, он должен научиться стыдиться своих старых неудачных шуток, но помнить их, чтобы не повторять снова.

 

Робот Т800 от EngineAI (Zhòngqíng)

- рост 173 см  

- система кругового обзора 360°  

- аккумулятор на 4–5 часов работы

 
Vitaliy Kuznetsov #:

Робот Т800 от EngineAI (Zhòngqíng)


Сейчас в сети столько нагенерированных ИИ роликов... Я стал очень критично относиться. Механика роботов пока не позволяет таких скоростей движения. И чем легче и дешевле модель - тем более. А человекообразные ориентированы для бытового сектора. В промышленности это не нужно.

 
Edgar Akhmadeev #:

Сейчас в сети столько нагенерированных ИИ роликов... Я стал очень критично относиться. Механика роботов пока не позволяет таких скоростей движения. И чем легче и дешевле модель - тем более. А человекообразные ориентированы для бытового сектора. В промышленности это не нужно.

Это не генерация, исходя из информации в сети.

Чуть ранее было много видео танцующих роботов, Тесла и прочие, даже Грин от Сбера.

Потом видео от Unitree с их роботами, которые уже показали кунг-фу, прыжки, сальто.

Ещё раньше было видео с натренированной собакой, прыжки, сальто и даже пересечение сложной местности, прыгая на одной лапе.

И в древние времена мамонта был такой робот Atlas, который бегал по цеху и делал сальто.

Так что текущие сомнения об истинности таких видео можно отбросить.

Куда сложнее - мелкая моторика, это что-то хрупкое брать, мыть, чистить и прочие вещи.

 

ИИ-надстройка Poetiq превзошла человека в тесте ARC-AGI: что это значит на самом деле


//текст GPT5

На этой неделе в мире искусственного интеллекта появилась громкая новость: система под названием Poetiq смогла превзойти средний человеческий уровень в тесте ARC-AGI — одном из самых сложных бенчмарков, проверяющих способность к абстрактному мышлению, логике и поиску закономерностей.

ARC-AGI — это набор визуальных головоломок из разноцветных пиксельных сеток. Задача — понять, по какому правилу трансформируется картинка, и применить это правило к новой ситуации. То есть здесь важна не память и не натаскивание на данные, а умение достраивать логику там, где нет подсказок. Долгое время человек считался здесь эталоном.

Что такое Poetiq?

Самое интересное — Poetiq не является новой «мегамоделью». Это надстройка, своего рода «директор», который управляет работой уже существующих языковых моделей.

Poetiq умеет:

  • разбивать задачу на этапы,

  • формировать несколько конкурирующих гипотез,

  • генерировать код для проверки этих гипотез,

  • оценивать, какой вариант сработал лучше,

  • повторять цикл до победного результата.

Такой подход превращает обычные LLM в команду специалистов, работающих согласованно. По сути — это первый заметный шаг к «мета-интеллекту», когда система не просто отвечает, а организует собственное мышление.

Почему это важно

Используя этот подход, Poetiq показал результат выше человеческого уровня сразу в двух версиях теста ARC-AGI. Для отрасли это сигнал: не обязательно делать всю ставку на огромные модели весом в сотни миллиардов параметров. Иногда ключ — в том, как эти модели работают вместе.

Иными словами, дело здесь не в «новом супер-мозге», а в умении правильно распределять роли, проверять себя и автоматизировать мышление.

Но есть нюансы

Это не означает, что мы получили AGI или что ИИ «стал умнее человека во всём».
ARC-AGI — важный бенчмарк, но узкоспециализированный. Он показывает способность находить закономерности в визуальных трансформациях — и именно в этой нише Poetiq оказался сильнее среднего человека.

Главное — Poetiq блестяще умеет адаптироваться под структуру теста, а это не всегда переносится на реальный мир.

Почему всё равно круто

Poetiq демонстрирует новый тип архитектуры: ИИ, который не просто решает задачи, а организует сам процесс поиска решения. Это движок для «мышления над мышлением».

Такие системы — вероятный мост между сегодняшними LLM и будущими формами сильного ИИ, где важны не размеры, а гибкость и способность к самоорганизации.

 

Кратко: Генеральный директор OpenAI Сэм Альтман объявил внутренний "Код Красный" (Code Red) — наивысший уровень чрезвычайной ситуации — из-за растущей конкуренции, в первую очередь со стороны модели Google Gemini, которая, по сообщениям, опережает ChatGPT по ключевым показателям производительности и стремительно набирает популярность среди пользователей.


🚨 OpenAI объявляет "Код Красный": Что происходит?


//текст и картинка Gemini

OpenAI, компания, которая за два года до этого устроила переполох в Google, выпустив ChatGPT, теперь сама оказалась в роли догоняющего. Генеральный директор Сэм Альтман объявил об экстренном внутреннем положении "Код Красный" (Code Red) — это самая высокая степень тревоги, используемая для обозначения экзистенциальных угроз или кризисов.

Суть этого решения: немедленно остановить работу над большинством новых коммерческих проектов и полностью перенаправить все ресурсы на улучшение флагманского чат-бота ChatGPT.

📉 Причина паники: Преимущество Google Gemini

Основным фактором, спровоцировавшим "Код Красный", стал недавний выход и стремительный успех модели Google Gemini 3. По сообщениям, эта модель превзошла флагманскую GPT-5 от OpenAI в ряде ключевых отраслевых тестов и, что самое главное, демонстрирует рост вовлеченности пользователей, отнимая долю рынка у ChatGPT.

Google, в отличие от OpenAI, имеет преимущество "полного стека": она контролирует собственные облачные сервисы (Google Cloud) и производит специализированные чипы TPU (Tensor Processing Units). Это позволяет ей обучать и развертывать свои модели более экономично и эффективно, чем OpenAI, которая сильно зависит от инфраструктуры Microsoft Azure и чипов Nvidia.

🛑 Отложенные проекты и новые приоритеты

В рамках "Кода Красный" OpenAI отложила или заморозила несколько важных направлений, которые должны были стать источниками дохода:

  • Рекламные интеграции в ChatGPT.

  • Разработка AI-помощников для онлайн-покупок и медицины (Health Agents).

  • Личный ассистент под названием Pulse.

Вместо этого, все усилия сосредоточены на:

  1. Повышении скорости и надежности работы ChatGPT.

  2. Улучшении персонализации, чтобы пользователи могли более тонко настраивать взаимодействие с чат-ботом.

  3. Расширении диапазона вопросов, на которые ChatGPT может отвечать, и уменьшении числа "отказов" (когда бот отказывается давать ответ на невинный запрос).

🔄 Зеркальное отражение истории

Эта ситуация стала поразительной сменой ролей по сравнению с концом 2022 года. Тогда, после запуска ChatGPT, генеральный директор Google Сундар Пичаи сам объявил свой "Код Красный", чтобы срочно реструктурировать компанию и ответить на угрозу, которую ChatGPT представлял для поискового бизнеса Google.

Теперь Google, восстановив позиции, возвращает удар, используя свое глубокое техническое и финансовое преимущество, что ставит OpenAI под серьезное финансовое давление и заставляет бороться за сохранение лидерства.


🤔 Что дальше?

OpenAI, по сообщениям, готовит ответ: на следующей неделе ожидается выпуск новой модели для улучшения "рассуждений" (reasoning model), которая, по их внутренним оценкам, должна превзойти Gemini 3. Тем не менее, объявление "Кода Красный" ясно демонстрирует, что для OpenAI гонка за доминирование в сфере ИИ перешла в критическую фазу.

 

💡 Прорыв в Эргономике: Самый Полезный ИИ Будет Локальным и Малым


//Текст и обложка Gemini 2.5 на базе моей идеи.

//Может показаться, что это и более крутое есть в Copilot на Windows 11 (не факт, что весь функционал). И не забываем, что он не работает в регионе и "Этот Компьютер" уже "Публичный Компьютер" с онлайн-ИИ.

В бесконечной гонке за гигантскими нейросетями, работающими в облаке, мы упускаем из виду простейшую и самую практичную идею: первый по-настоящему полезный ИИ для массовой ОС может быть маленьким, быстрым и локальным.

Это не универсальный генератор знаний, а специализированный ассистент, оптимизированный для аудиоввода и улучшения текста, работающий мгновенно и прямо на вашем устройстве (например, модель всего на 4 миллиарда параметров).

Такая технология может стать настоящим ноу-хау для любой компании, решившей закрыть разрыв между человеком и компьютером.

1. ⌨️ Прощай, Опечатки: Помощь в Ручном Вводе

Даже когда мы не диктуем, а печатаем, ИИ может незаметно, но кардинально улучшить процесс. Его задача — ликвидировать "человеческий фактор" и рутинные ошибки, которые замедляют набор текста:

  • Коррекция Раскладки ( ghbdtn -> привет ): Если вы забыли переключить язык и начали печатать русские слова английскими буквами (или наоборот), локальный ИИ мгновенно поймёт и исправит это.

  • Автоматическая Пунктуация: ИИ проставит запятые, точки и тире там, где мы о них забыли, превращая черновик в чистый текст.

  • Исправление Огрехов Печати: Мелкие опечатки и неточности будут исправлены до того, как вы успеете нажать Backspace .

//тут можно как автоматически сделать, так и отключить, оставив вызов подобного функционала голосовой командой. 

2. 🎙️ Замена Клавиатуры: Диктовка и Голосовые Команды

Главное преимущество локальной модели — её способность работать с аудиовводом без задержек и необходимости отправлять данные в сеть. Это позволяет ей стать полноценным голосовым секретарем:

  • Безупречная Надиктовка: ИИ не просто распознаёт речь; он сразу выдаёт стилистически и грамматически верный, отформатированный текст. Вы говорите, а на экране появляется финальный вариант.

  • Голосовое Управление Рутиной: Самая надоедливая часть работы — сочетания клавиш — заменяется простыми голосовыми командами:

    • Вместо Ctrl+C говорим "Копировать".

    • Вместо Ctrl+V говорим "Вставить".

    • Вместо Ctrl+Z говорим "Отменить".

3. 🖱️ Идеальный Симбиоз: Мышь и Голос

В этой концепции мышь сохраняет свою ключевую роль — навигация и выделение.

Мышь нужна для точного указания, какой фрагмент текста нужно выделить, а голос — для выполнения команды над этим фрагментом. Пользователь выделяет область курсором, а затем говорит: "Вырезать" или "Копировать в буфер".

Это не попытка создать полностью безклавиатурное окружение, а создание идеального рабочего потока, где голос отвечает за действие, а мышь — за позицию.

Заключение

Этот малый, аудио-ориентированный, локальный ИИ предлагает не абстрактное будущее, а немедленное, осязаемое улучшение повседневной работы. Любая технологическая компания может выпустить такой продукт как самый практичный прорыв в области взаимодействия человека и машины, положив начало новой эре эргономики рабочего стола.

 
Vitaliy Kuznetsov #:

Чуть ранее было много видео танцующих роботов, Тесла и прочие, даже Грин от Сбера.

Потом видео от Unitree с их роботами, которые уже показали кунг-фу, прыжки, сальто.

Ещё раньше было видео с натренированной собакой, прыжки, сальто и даже пересечение сложной местности, прыгая на одной лапе.

И в древние времена мамонта был такой робот Atlas, который бегал по цеху и делал сальто.

Я слежу за прогрессом. Ролики видел. Там моторика убедительная, движения довольно плавные, не взрывные.

А здесь... Я не отметаю, просто сомнительно пока, по единственному ролику и без взаимодействия с людьми.

 
Edgar Akhmadeev #:

Я слежу за прогрессом. Ролики видел. Там моторика убедительная, движения довольно плавные, не взрывные.

А здесь... Я не отметаю, просто сомнительно пока, по единственному ролику и без взаимодействия с людьми.

Там спецэффект добавлен — киношная герцовка.

Из-за малых FPS движения становятся быстрей, реще, дёрганей. Само то для экшена и боёв. 

Этим и воспользовались.