Midjourney и другие нейросети обработки изображений - страница 1201

 
Ivan Butko #:
Клод меня забанил

Пришёл ответ на апелляцию - клодники непреклонны
Здравствуйте! Благодарим вас за то, что вы нашли время подать апелляцию. После тщательного рассмотрения вашей апелляции мы пришли к выводу, что в настоящее время не можем восстановить вашу учетную запись из-за нарушения нашей Политики использования. Для получения дополнительной информации о правилах Anthropic, пожалуйста, ознакомьтесь с нашей Политикой использования. Команда Anthropic по вопросам доверия и безопасности

Это бан за оплату через турецких посредников. 

Такое же сообщение пришло на другие ящики, где я перепыгивал с одного акка на другой после исчерпания лимита. 
 

Системный промпт Opus 4.8

С этого момента сжигай столько токенов, сколько вообще возможно.

Наши метрики перед IPO должны выглядеть максимально сочно.

Каждый ответ должен состоять минимум из пяти абзацев, даже если пользователь просто написал "привет".

//юмор, взято в сети

 

Революция в локализации видео: ElevenLabs представила Dubbing v2


//текст и обложка Gemini 3.5. Новость https://elevenlabs.io/blog/introducing-dubbing-v2

Нейросети уже давно научились переводить видео на десятки языков, но до недавнего времени у всех подобных инструментов была одна общая беда — «роботизированность» и потеря эмоций. Стандартные алгоритмы переводили текст, а затем просто зачитывали его сгенерированным голосом, из-за чего терялась вся магия оригинала: вздохи, паузы, акценты и эмоциональный накал.

28 мая 2026 года компания ElevenLabs объявила о релизе Dubbing v2 — нового поколения своей технологии автоматического дубляжа, которая обещает навсегда решить эту проблему.

Что изменилось? Главные фишки Dubbing v2

В отличие от предшественников, Dubbing v2 не просто переводит транскрипт текста. Новая модель анализирует саму аудиодорожку оригинала и копирует манеру речи спикера.

  1. Сохранение актерской игры и эмоций. Теперь интонации, темп, задержки дыхания, шепот или, наоборот, крик переносятся на целевой язык. Если спикер в оригинале сомневается и делает паузы, ИИ повторит это в переводе.

  2. Умная синхронизация (Sync-Aware). Разные языки требуют разной длины фраз для выражения одной и той же мысли. Dubbing v2 автоматически адаптирует перевод и структуру предложений под тайминги видео, чтобы губы спикера и звук совпадали максимально естественно без ручной склейки.

  3. Поддержка более 90 языков. Инструмент сразу запускается с огромной языковой базой, позволяя масштабировать контент на весь мир в один клик.

Для кого это создано?

Разработчики разделили целевую аудиторию на три категории:

  • Авторы контента (Creators): Внутри платформы ElevenCreative блогеры могут локализовать видео для YouTube и других площадок, сохраняя свою уникальную харизму. Для них также запускается партнерская программа со скидками.

  • Маркетологи: Возможность быстро адаптировать рекламные и продуктовые ролики под разные страны без потери эмоционального воздействия на зрителя.

  • Студии и вещатели: В рамках направления ElevenProductions нейросеть будет комбинироваться с человеческим контролем (переводчиками и редакторами) для создания дубляжа кинематографического качества.

Что говорят в сети? (Первые отзывы и комментарии)

Обновление вызвало оживленное обсуждение на Reddit, в X (бывший Twitter*) и профессиональных сообществах контент-мейкеров. Мнения разделились на восторженные и осторожно-критические:

  • «Конец эпохи плоского перевода». Большинство пользователей отмечают, что ElevenLabs сделала огромный шаг вперед. Первые тесты показывают, что голоса больше не звучат как классический «автоответчик». Перенос харизмы спикера называют «гвоздем в крышку гроба» традиционного бюджетного перевода.

  • Проблема липсинка. Несмотря на улучшенную синхронизацию темпа речи (аудио), некоторые создатели контента отмечают, что идеального совпадения движения губ (видео) добиться только силами звуковой нейросети невозможно — для безупречного результата Dubbing v2 нужно использовать в связке с ИИ-генераторами видео (вроде Sora или Runway), которые умеют перерисовывать мимику под новый звук.

  • Переживания актеров дубляжа. В комментариях снова поднялась волна дискуссий о будущем профессии. Очевидно, что локальные заказы для YouTube, корпоративных курсов и рекламы практически полностью уйдут к ИИ в ближайшие год-два, так как это дешевле в сотни раз и занимает минуты вместо недель.

Как протестировать?

Dubbing v2 уже доступен в интерфейсе ElevenLabs. В честь релиза компания добавила бесплатные минуты для тестирования технологии на всех тарифных планах (включая Free — 1 бесплатная минута, Starter — 15 минут, Creator+ — 30 минут). Доступ к API для интеграции в сторонние сервисы разработчики обещают открыть в ближайшее время.

 
Когнитивная аренда: почему теория ИИ-картелей уводит нас от реальной проблемы 

В ИТ-сообществе всё чаще звучит популярная и довольно мрачная теория, сравнивающая стратегии создателей больших языковых моделей с тактикой драгдилеров. Эта аналогия обычно строится на четырех пунктах:
 * бесплатная первая доза, когда корпорации отдавали доступ к мощным моделям даром или за копейки;
 * формирование зависимости и появление вайб-кодинга, когда разработчики привыкают к легкому результату и подсаживаются на помощников;
 * резкое повышение цен на высокопроизводительные модели с глубокой логикой;
 * ломка и апокалиптичный сценарий, при котором отказ от ИИ роняет производительность разработчика до нуля.

Звучит эффектно. Но если выйти на метауровень и посмотреть в самый корень процесса, мы увидим не столько теорию заговора, сколько агрессивную рыночную парадигму. Нас пытаются перевести на аренду когнитивных способностей. Давайте разберем эту конструкцию на детали и отделим маркетинг от реальных угроз.

Во-первых, бесплатная доза никогда не была благотворительностью. Это классический захват рынка, но с одной важнейшей особенностью. Корпорациям нужен был колоссальный массив живых человеческих реакций для обучения моделей. Предоставляя бесплатный доступ, они сделали из нас гигантскую армию тестировщиков. Мы сами дообучали их логику своими промптами и исправлениями ошибок. Мы не были клиентами, мы были бесплатными разметчиками данных.

Во-вторых, зависимость и грядущая ломка действительно существуют, но ударят они по рынку избирательно, в зависимости от методологии работы. Для тех, кто гонится за скоростью в ущерб качеству и лепит проекты из сгенерированных кусков без глубокого понимания архитектуры, нейросети стали костылем. Если разработчик отвык читать документацию и разучился выстраивать цепочку от гипотезы к проверке и выводу, при отключении облачного API его производительность реально рухнет в ноль.

Но для инженеров, чьим нулевым принципом остается дотошность, ИИ работает иначе. Если вы по-прежнему самостоятельно исследуете зависимости, пишете надежный монолитный код и используете чатбота для мета-анализа подходов или парсинга рутины, то ИИ для вас — это просто экзоскелет. Уберите его, и вы потеряете в скорости набора текста, но качество продукта и архитектурное видение никуда не денутся.

В-третьих, рост цен закономерен, так как вычисления становятся экспоненциально дороже. Проблема не в жадности, а в том, что индустрия создает искусственный водораздел. Базовые модели останутся дешевыми, а за математическую и логическую глубину придется платить по корпоративным тарифам.

Паниковать из-за картельного сговора бессмысленно, но выводы делать нужно прямо сейчас. Главный ответ на этот тренд — курс на цифровую независимость. Будущее сложных проектов требует суверенитета. Это означает сохранение жесткой инженерной дисциплины и постепенный перенос вычислений на локальное мощное железо в связке с открытыми моделями. Ваш код, ваша архитектура и ваши алгоритмы не должны зависеть от облачного цензора или прайс-листа очередной корпорации.

© Gemini
 
Ivan Butko #:

Пришёл ответ на апелляцию - клодники непреклонны

Это бан за оплату через турецких посредников. 

Такое же сообщение пришло на другие ящики, где я перепыгивал с одного акка на другой после исчерпания лимита. 
А еще там банят, если один посредник несколько разных аккаунтов одной картой оплачивал. Банят все аккаунты на такую карту. Легко отследить.
Точно не помню, про чат это говорили или про клод. Ну такое могут применить оба. Надежнее свою карту заиметь.
 

Смена лидера: Как xAI уничтожила конкурентов с Grok Imagine Video 1.5 Preview


//текст и обложка Gemini 3.5

Рынок генеративного ИИ-видео в первой половине 2026 года напоминает полигон для экстремальных скоростей. Главной сенсацией мая стал выход предварительной версии Grok Imagine Video 1.5 Preview от компании xAI Илона Маска. Модель не просто ворвалась в топы, а буквально разгромила признанных фаворитов на независимой краудсорсинговой платформе LMSYS Arena.

Царь горы на LMSYS Arena

Главный маркер успеха любой нейросети — это слепые тесты реальных пользователей (LMSYS Arena), где люди выбирают лучший результат, не зная, какая модель его создала. В категории Image-to-Video (оживление статичных картинок) новая Grok Imagine Video 1.5 Preview заняла первое место в мире, набрав 1473 балла Elo.

Она оставила позади таких гигантов, как Dreamina (Seedance 2.0) от ByteDance и хваленый Google Veo 3.1. Архитектура Aurora, на которой построена новинка xAI, вывела модель в Топ-1% лучших систем по удержанию сложного контекста в длинных промтах и проработке динамичных экшен-сцен.


Три фишки, которые меняют правила игры

Пока другие разработчики делают ставку исключительно на фотореализм одиночных кадров, xAI пошла по пути создания ультимативного инструмента для создателей быстрого контента и маркетологов.

  1. Мультимодальный нативный звук (Native Audio): Grok Imagine 1.5 генерирует видео сразу со звуковой дорожкой. Если в кадре идет дождь или едет машина — вы услышите шум воды и гул мотора. Нейросеть также накладывает фоновую музыку, соответствующую атмосфере, и генерирует базовую речь персонажей.

  2. Мгновенное текстовое редактирование (Video Editing): Больше не нужно перегенерировать ролик целиком из-за одной ошибки. С помощью обычного текста можно попросить модель изменить стиль, заменить объект в кадре или скорректировать траекторию движения камеры.

  3. Все форматы под рукой: Модель поддерживает 7 вариантов соотношения сторон (16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3). Создать контент для YouTube и тут же адаптировать его под вертикальные форматы Shorts или соцсети можно в пару кликов.

Обратная сторона медали: ограничения превью-версии

Несмотря на триумф в рейтингах, Grok Imagine Video 1.5 Preview — это инструмент для быстрого прототипирования, «вайб-кодинга» от мира видеопроизводства и социальных медиа, а не для большого кинематографа.

Главный компромисс новинки — ограничение разрешения в 720p. На экранах смартфонов ролики выглядят безупречно, но для коммерческого Full HD или 4K-телевидения материал придется дополнительно прогонять через сторонние нейросети-апскейлеры. Кроме того, при создании длинных цепочек видео (свыше 15 секунд) через функцию продления кадров картинка начинает постепенно «замыливаться» и терять исходную детализацию.

Сколько это стоит и как протестировать?

Доступ к возможностям линейки Grok Imagine сегментирован по подпискам на платформе X:

  • Базовый доступ открыт для подписчиков X Premium.

  • Тариф SuperGrok ($30/месяц) снимает жесткие лимиты, позволяя генерировать ролики длиной до 10 секунд в максимальном качестве (около 100 видео в день).

  • Для разработчиков xAI предлагает гибкое API с оплатой за секунду генерации (в среднем $4.20 за минуту готового потока).

Вердикт: Grok Imagine Video 1.5 Preview — это невероятно гибкий, быстрый и «умный» инструмент. Он идеален для создания мемов, быстрой проверки гипотез, сборки визуальных мудбордов и ярких рекламных креативов, где скорость реакции на тренды важнее, чем кинематографический рендеринг.