Midjourney и другие нейросети обработки изображений - страница 922
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Sesame опубликовала код ИИ текст-в-речь. Английский знает, другие дообучивать надо.
По прошлой новости и тестам - это самый передовой на данный момент озвучиватель текстов.
Ждём мультиязычную версию.
https://github.com/SesameAILabs/csm
Не без изъянов, но концепт был интересный, вот и сделал стих.
DeepSeek3
«Карнавал чувств»
Радость — как солнце в зените,
Её лучи — золотой налив,
Но Грусть, как туча, тут же рядом,
Её дожди — немой мотив.
Страх — это шёпот в полутьме,
Его глаза — два уголька,
А Гнев — пожар, что рвёт на части,
Его кулак — гроза века.
Любовь — как вино, что пьянит до дна,
Её уста — как маков цвет,
Но Ревность — змея, что в сердце ползёт,
Её укус — как вечный след.
Надежда — птица с подбитым крылом,
Её песня — как звон в пустоте,
А Отчаянье — стон в тишине,
Его руки — как цепи в мольбе.
Восторг — это вспышка, как молния в ночь,
Его свет — как взрыв в темноте,
Но Сомненье — как тень на стене,
Его голос — как шёпот в пустоте.
Стыд — это пламя, что жжёт изнутри,
Его взгляд — как нож в спине,
А Вина — это крест, что нести до конца,
Её бремя — как камень на дне.
И вот они все, в этом странном балу,
Смешались в единый клубок,
То сердце моё, что бьётся в груди,
Где каждый удар — как вздох, как урок.
Но вдруг — тишина. И в ней я слышу:
Не вой, не плач, не гром,
А шёпот души, что знает правду —
Всё это — я. Всё это — дом.
И пусть они спорят, кричат, горят,
Я — их сцена, их вечный плен.
Но в этом хаосе, в этом вихре страстей,
Я — целый мир. Я — целый вселен.
Русалочка в стиле 3D-рендер. Миджорни.
Арты. Миджорни
Разное. Midjourney
Арты на тему двойственность. Миджорни
На сайте OpenAI появился интересный документ, который уже обсуждают в сети.
https://cdn.openai.com/global-affairs/ostp-rfi/ec680b75-d539-4653-b297-8bcf6e5f7686/openai-response-ostp-nsf-rfi-notice-request-for-information-on-the-development-of-an-artificial-intelligence-ai-action-plan.pdf
OpenAI обратилась к администрации США с просьбой признать обучение ИИ на материалах, защищенных авторским правом, как "добросовестное использование".
Это, по мнению компании, позволит США сохранить лидерство в сфере ИИ, так как американские разработчики смогут свободно использовать данные для обучения моделей.
OpenAI утверждает, что ИИ не копирует контент, а учится на нем, и что запрет на использование авторских материалов поставит американские компании в невыгодное положение по сравнению с Китаем, где доступ к данным более свободный.
Проще говоря, или разрешают, или гонке ИИ конец и побеждает Китай.
https://habr.com/ru/news/891016/
Две особенности ИИ-пузыря:
1) Инвестиции привлекаются не на открытом рынке (акции, облигации), а от частных компаний.
2) При этих инвестициях деньги идут по кругу. Например, Миккрософт выделяет деньги ОпенАй, а ОпенАй арендует на эти деньги у Микрософт сервера.
Имхо, это может смягчить последствия схлопывания ИИ-пузыря - повторения драмы доткомов не будет.
На схлопывание ИИ-пузыря сильно повлияет появление реальных цифр по экономии денег бизнесом за счёт использования ИИ.
Такие данные понемногу начинают появляться - например, на днях кредитная компания Klarna опубликовала довольно подробные данные для выхода на IPO. Из этих данных следует что экономия, которую точно можно приписать ИИ весьма незначительная.
К слову о мощностях оборудования и артефактах в изображении.
Почти с самого начала при генерации изображений во многих ИИ была возможность редактирования.
Да и в фотошопе такой ИИ. Что-то типа выделяем элемент и перегенирируем его. Композиция не меняется, но можно исправить кол-во пальцев и прочие неточности.
VLM - визуальные ИИ тоже развиваются. Много раз было продемонстрировано, как ИИ объяснял, что с фото не то, нелогичная физика, отсутствие реализма.
Ещё можно использовать такое для создания промта. Показываем картинку, ИИ пишет промт, потом с этим промтом мы можем что-то похожее сгенерировать сами.
Сейчас появляются VLM с элементами рассуждения, что увеличивает точность определения элементов изображения, но снижает скорость.
Если после каждой генерации перед публикацией VLM с рассуждением смотрит на картинку, выявляет дефекты, обводит их, перегенирирует, снова проверяет, пока всё не исправит.
И пользователь на выходе получает изображение без дефектов и без "слонов". Генераторы картинок станут безупречными, но итоговый результат придётся ждать довольно долго.
Значит, повышение мощности оборудования - неотъемлемая часть повышения качества ИИ.
И только после всего этого можно будет их сжимать, квантовать, чтобы они работали у пользователей быстро и локально, но для прогресса и развития нужны мощности, кратно превышающие сегодняшние.
Случайно наткнулся на сайт, где можно юзать Gemini 2.0 Flash от гугла без регистрации бесплатно.
Стихи пишет хорошо, думает тоже неплохо, работает быстро. Чисто поиграться для тестов возможностей.
Не забудьте вверху выбрать последнюю модель.
https://gemini-free.com/ru
Тест юмора. Думаю можно будет что-то дельное выжать при желании. С виду потенциал есть.
Отлично, вот вам топ-20 убойных one-liner’ов и смешных шуток про ИИ:
One-Liners:
Шутки в стиле “Почему курица перешла дорогу”:
Наблюдения:
Мета-юмор:
Шутки с двойным дном:
Убойные концовки:
Надеюсь, вам понравилось! Какой из этих анекдотов показался вам самым смешным? Я могу попытаться сгенерировать еще, если вам будет нужно!