Midjourney и другие нейросети обработки изображений - страница 1189
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Anthropic представила Project Glasswing: сверхмощную нейросеть для кибербезопасности, которую решили не выпускать публично
//текст Grok 4.20. Сам проект https://www.anthropic.com/glasswing. Картинки взяты там же.
Сегодня компания Anthropic объявила о запуске Project Glasswing — совместной инициативы с ведущими технологическими компаниями по защите критически важного программного обеспечения. В основе проекта лежит новая модель Claude Mythos Preview, которая по тестам на порядок превосходит предыдущую флагманскую модель Claude Opus 4.6.
Новая нейросеть показывает выдающиеся результаты в поиске уязвимостей: 83,1 % в CyberGym против 66,6 % у Opus 4.6, а в задачах по программированию разрыв ещё заметнее. За считанные недели она обнаружила тысячи серьёзных дыр, включая те, что десятилетиями ускользали от людей и автоматики.
Однако модель не станет общедоступной. Anthropic объясняет это высоким риском: возможности Mythos Preview слишком велики, чтобы отдавать их в неконтролируемые руки. Пока доступ открыт только участникам Glasswing — крупным корпорациям и организациям, которые будут использовать ИИ исключительно для защиты.
Это важный сигнал отрасли: ИИ достиг уровня, когда его мощь в киберпространстве сравнима с человеческими экспертами высшего класса. И теперь вопрос безопасности выходит на первый план.
Какое-то обновление у ДипСика
Сам Дипсик отвечает так:
Вы правы, это важное обновление в DeepSeek, которое появилось вечером 7 апреля 2026 года. Теперь при начале нового диалога можно выбрать один из двух режимов работы. По сути, это разделение на «Быстрый» (для простых задач) и «Экспертный» (для сложных).
Основные различия между режимами
Что это значит и зачем это сделали
Разная логика работы: Судя по всему, в Экспертном режиме используется более «тяжелая» цепочка рассуждений или ранняя версия новой модели V4. Он думает дольше, но глубже. Быстрый режим, вероятно, работает на облегченной версии модели, чтобы выдавать ответы мгновенно.
Подготовка к запуску DeepSeek V4: Это обновление рассматривается как техническая и маркетинговая подготовка к выходу новой флагманской модели DeepSeek V4.
Управление нагрузкой: Разделяя пользователей на потоки (кому нужно быстро, а кому — сложно), компания лучше распределяет мощности своих серверов и справляется с пиковыми нагрузками.
Важное примечание: Полноценная мультимодальность (Vision) — то есть распознавание картинок не просто как текста, а понимание того, что изображено — пока отсутствует в обоих режимах. Ожидается, что эту функцию добавят с выходом финальной версии V4. Пока что в Быстром режиме файлы просто распознаются как текст (OCR).
//учитывая сколько уже волн обновлений конкурентов вышло, Дипсик 4 может быть уже "устарел", но ждём, надеемся на лучшее
Есть некоторый софт, который очень дорогой, а бесплатные альтернативы какие-то кособокие и неудобные.
Попробовал с одного промпта сделать интерфейс CAD программы для 2D чертежей. Пока что слишком лайтово, но мне кажется, такой софт сделать по силам.
В итоге может получиться смесь фотошопа со слоями и объектами, поддержка форматов автокада, компаса и других.
GLM5.1 может попробовать 8 часов потрудится над проектом. Однако, всё же самым сложным будет самостоятельно создать интерфейс и максимально подробное описание функций, файлов, конструкции, чтобы проект был поддерживаемым.
HappyHorse 1.0: Загадочная нейросеть, порвавшая лидерборды генерации видео
//текст и обложка Gemini 3.1
Несколько дней назад на платформе оценки ИИ Artificial Analysis произошла тихая революция. Без громких анонсов, пресс-релизов и официальной корпоративной поддержки на первую строчку рейтинга AI Video Arena ворвалась модель под названием HappyHorse 1.0, сместив с пьедестала Seedance 2.0 от ByteDance.
Бенчмарки и результаты слепых тестов
Успех HappyHorse 1.0 полностью основан на системе независимого слепого тестирования, где пользователи оценивают два видеоряда, не зная, какими моделями они сгенерированы.
В категории генерации видео по тексту (text-to-video) без аудио новинка достигла выдающегося рейтинга Elo 1357, оторвавшись от предыдущего лидера Seedance 2.0 более чем на 80 пунктов. В категории image-to-video результат оказался еще более впечатляющим — Elo 1392. В терминах рейтинговой системы такой разрыв означает, что в прямых столкновениях пользователи отдают предпочтение «счастливой лошадке» почти в 60% случаев, оставляя позади признанных гигантов вроде Kling и Tiangong.
https://artificialanalysis.ai/video/leaderboard/text-to-video
Что под капотом: 40-слойный Transformer
С технической точки зрения архитектура модели вызывает особый интерес. В отличие от сложных каскадных пайплайнов, HappyHorse 1.0 использует единый 40-слойный Transformer, который совместно обрабатывает текстовые, графические, видео- и аудиотокены в одной последовательности.
Это позволяет модели генерировать не только визуальный ряд, но и нативное аудио за один проход (заявлена поддержка шести языков). Особенно хорошо архитектура справляется с задачей оживления изображений: исходное фото обрабатывается как встроенная зависимость внутри последовательности токенов, что обеспечивает высокую стабильность объекта и беспрецедентную плавность его движений.
Кто за этим стоит: след Alibaba
Отсутствие публичной команды породило множество слухов в сообществе. Главная интрига — происхождение модели. По информации, активно циркулирующей на профильных ресурсах (включая обсуждения на Habr), за проектом может стоять бывший технический руководитель команды Kling, который собрал эту видеомодель в недрах Alibaba.
Другие аналитики предполагают, что это глубоко оптимизированная версия открытой архитектуры daVinci-MagiHuman от лаборатории Sand.ai, доработанная специально под метрики арен.
Сильные и слабые стороны
Анализ пользовательских тестов показывает, что HappyHorse 1.0 не пытается быть универсальным инструментом для любых задач. Её главная специализация и неоспоримое преимущество — портретная генерация, виртуальные люди и цифровые аватары. Модель демонстрирует отличную визуальную согласованность при создании персонажей и сохранении их лиц.
Однако пользователи отмечают, что в сложных многоплановых сценах, при активной смене ракурсов или при попытках генерации очень длинных видеороликов нейросеть пока может испытывать трудности и уступать конкурентам.
HappyHorse 1.0 стала главной «темной лошадкой» апреля 2026 года. Она наглядно доказала, что грамотно оптимизированная архитектура на базе единого трансформера способна эффективно конкурировать с закрытыми решениями корпораций, меняя баланс сил на рынке генеративного ИИ.
GLM-5.1 уже завезли в чат. Сильнейший в коде после Claude
https://chat.z.ai
Gemma 4 E4B появилась в LM Studio от Unsloth
Работает быстро, небольшая и превосходит прошлую Gemma3-27B
Самые важные новости ИИ за неделю: «Пугающая» модель от Anthropic, прорыв открытого кода и новые генераторы видео
//текст и обложка Gemini 3.1. Частично на базе анализа видео Мэтта https://youtu.be/SguncMvE77I
Прошедшая неделя оказалась невероятно насыщенной на события в сфере искусственного интеллекта. Главной темой дискуссий стала новая модель, которая настолько хороша в поиске программных уязвимостей, что ее разработчики боятся выпускать релиз в открытый доступ. Представляем еженедельный дайджест главных ИИ-новостей.
1. Claude Mythos: Слишком опасен для интернета?
Компания Anthropic разработала новую ИИ-модель Claude Mythos Preview, которая показывает беспрецедентные результаты в написании кода и анализе систем кибербезопасности.
В тестах модель продемонстрировала пугающую способность находить критические «дыры» в софте, которые оставались незамеченными десятилетиями (например, 27-летняя уязвимость в сверхзащищенной OpenBSD или 16-летняя брешь в кодировщике FFmpeg).
Осознав потенциальные масштабы катастрофы в случае попадания модели к злоумышленникам, Anthropic отказалась от публичного релиза. Вместо этого компания запустила инициативу Project Glasswing. Доступ к Mythos получили исключительно специалисты по кибербезопасности из корпораций-партнеров (Apple, Google, Microsoft, Cisco и др.). Их задача — успеть использовать ИИ для закрытия уязвимостей в своих продуктах до того, как аналогичные открытые модели появятся у хакеров.
2. Релиз Muse Spark* от Meta*
Лаборатория Super Intelligence Labs*, собранная компанией Meta* из ведущих специалистов индустрии, представила свою первую значимую языковую модель — Muse Spark*.
В отличие от знаменитого семейства Llama*, новинка не является open-source проектом. По результатам бенчмарков, Muse Spark* уверенно держится в топе, лишь немного уступая абсолютным лидерам (GPT 5.4, Gemini 3.1 и Claude 4.6), но при этом обходит их в решении сложных медицинских запросов. Одно из главных преимуществ модели — высочайшая эффективность использования токенов, что сделает её работу сравнительно дешевой.
3. GLM 5.1: Триумф Open-Source
Пока все обсуждали закрытые флагманы, компания ZAI тихо выпустила открытую модель GLM 5.1 под лицензией MIT. Ее веса уже можно скачать на HuggingFace.
Впечатляет то, что в тестах на программную инженерию (SWEBench Pro) эта открытая модель обходит закрытые GPT 5.4 и Opus 4.6. Тот факт, что каждый желающий теперь может локально запустить и дообучить ИИ, программирующий на уровне лучших коммерческих решений, является одним из самых значимых (хоть и недооцененных) событий недели.
4. Битва видеогенераторов: Seed Dance 2.0 и Happy Horse 1.0
Пока OpenAI задерживает релиз новых версий Sora, на рынке появляются сверхмощные конкуренты:
Seed Dance 2.0: Эта нашумевшая модель наконец-то начала разворачиваться для пользователей за пределами Азии. Она доступна в приложениях CapCut и Runway. Модель генерирует видео отличного качества в разы быстрее аналогов (хотя из нее вырезали возможность создавать ролики с известными персонажами и брендами из-за авторских прав).
Happy Horse 1.0: Загадочная модель, неожиданно возглавившая мировые лидерборды генерации видео. Она выдает сверхреалистичные кадры, которые невозможно отличить от стоковых видео. По слухам из индустрии, за этим анонимным релизом стоит корпорация Alibaba.
5. Важные обновления от гигантов индустрии
Новый тарифный план OpenAI: Запущен уровень Pro за $100 в месяц. Он ориентирован на разработчиков и предлагает в 5 раз больше лимитов на использование самых сложных моделей для долгих сессий программирования.
Google Gemini: Чат-бот научился создавать интерактивные визуализации (с ползунками и графиками, меняющимися в реальном времени — аналог Artifacts от Claude). Также появились Notebooks — рабочие пространства для проектов с собственной памятью и интеграцией с NotebookLM.
Локальное распознавание от Google: На iOS вышло приложение Google AI Edge, которое использует компактную модель Gemma для высокоточной транскрипции голоса в текст полностью в офлайн-режиме.
Инструменты Anthropic: Запущен Managed Agents — консоль с шаблонами для быстрой привязки Claude к рабочим приложениям (Notion, Slack). При этом компания запретила использовать безлимитную подписку для покрытия расходов токенов в сторонних агентах (таких как OpenClaw).
6. Короткой строкой
HeyGen Avatar 5: Новая версия сервиса позволяет создать реалистичного цифрового клона пользователя всего по 15 секундам записанного видео.
Аналитика финансов в Perplexity: Поисковик интегрировал сервис Plaid. Теперь ИИ может анализировать ваши банковские счета, расходы и кредиты, не сохраняя данные на своих серверах.
Утечки OpenAI: На тестовых аренах замечены модели Masking tape alpha и Gaffer tape alpha. Судя по качеству генерации графиков, инфографики и отражений, это тестируется неанонсированная GPT Image 2.
Удаленное управление Cursor: Популярная ИИ-среда разработки получила обновление — теперь вы можете запускать задачи для программирующих агентов на своем рабочем компьютере прямо с мобильного телефона.
Spotify и подкасты: ИИ-генератор плейлистов Spotify теперь работает с подкастами. Вы можете попросить собрать подборку выпусков на очень узкую тему, и ИИ найдет нужные эпизоды.
X.ai (Grok): В iOS-приложении появилась возможность редактировать элементы на фотографиях с помощью текстовых промптов.
⚡ Бонус: Что осталось за кадром видео (дополнения редакции)
Мэтт не упомянул несколько критически важных новостей прошедшей недели, которые серьезно влияют на расстановку сил на рынке:
Секретный альянс США против дистилляции ИИ: По данным Bloomberg, непримиримые конкуренты — OpenAI, Anthropic и Google — объединили усилия, чтобы остановить китайские стартапы. Компании делятся разведданными через Frontier Model Forum для выявления и блокировки скоординированных атак (например, использования тысяч фейковых аккаунтов), через которые извлекаются веса и возможности американских флагманских моделей для обучения китайских аналогов.
Паника в финансовом секторе из-за Mythos: Министерство финансов США экстренно созвало руководителей крупнейших банков в Вашингтоне. Причиной встречи стали как раз беспрецедентные хакерские возможности новой модели Claude Mythos и обсуждение защиты критической финансовой инфраструктуры от ИИ-угроз нового поколения.
OpenAI готовит свой «Mythos»: Журналисты Axios выяснили, что OpenAI идет по стопам Anthropic и сейчас завершает создание собственного закрытого ИИ-продукта для кибербезопасности, который также не увидит публичного релиза и будет передан только избранным организациям для защиты систем.
Огромные закупки Anthropic: Компания заключила многомиллиардные контракты с Google, Broadcom и CoreWeave на поставку новых вычислительных мощностей. Это показывает, что масштабы тренировки будущих моделей (вероятно, Claude 5) будут беспрецедентными.
* Деятельность компании Meta и её продуктов запрещена в РФ по основаниям осуществления экстремистской деятельности.