Midjourney и другие нейросети обработки изображений - страница 1065
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Devstral
Devstral | Mistral AI
mistralai/Devstral-Small-2505 · Hugging Face
Devstral — это агентский LLM для задач разработки программного обеспечения, созданный в рамках сотрудничества Mistral AI и All Hands AI.
Devstral преуспевает в использовании инструментов для изучения кодовых баз, редактирования нескольких файлов и обеспечения работы агентов разработки программного обеспечения.
Модель демонстрирует замечательную производительность на SWE-bench, что делает ее моделью #1 с открытым исходным кодом в этом бенчмарке.
Gemini Live с камерой и демонстрацией экрана теперь доступен бесплатно на Android и iOS.
Просто наведите телефон на что угодно и обсудите это в реальном времени.
https://blog.google/technology/google-deepmind/google-gemini-updates-io-2025/#new-capabilities
Компания Gemini анонсировала новые функции платформы 2.5, включая нативный аудиовыход и улучшения для Live API, которые делают взаимодействие с ИИ более естественным и выразительным. Теперь разработчики могут создавать диалоговые системы, где Gemini адаптирует тон, акцент и стиль речи под запросы пользователя. Например, модель способна рассказывать истории драматичным голосом или выполнять поиск по заданным критериям.
Ключевые нововведения в Live API (превью):
Эмоциональный диалог: ИИ анализирует эмоции в голосе пользователя и подстраивает ответы.
Проактивное аудио: модель игнорирует фоновые шумы и реагирует только на релевантные реплики.
Мышление в реальном времени: использование вычислительных возможностей Gemini для решения сложных задач.
Live API обеспечивает двунаправленное голосовое и видео-взаимодействие с сверхнизкой задержкой, позволяя общаться с Gemini в прямом эфире, транслировать видео или демонстрировать экран. Это создаёт эффект «живого» общения, максимально приближенного к человеческому.
Также представлен превью текст-в-речь для версий 2.5 Pro и 2.5 Flash. Технология поддерживает:
Мультиголосье: синтез речи с двумя разными голосами.
Экспрессивность: передача нюансов вплоть до шёпота.
24+ языков с возможностью переключения между ними в одном диалоге.
Эти обновления расширяют сценарии использования Gemini в образовании, развлечениях, клиентском сервисе и других сферах, где важны интерактивность и персонализация.
В общей сложности $11,6 млрд нового финансирования будет направлено на строительство огромного дата-центра в Абилине, штат Техас.
https://www.wsj.com/tech/ai/openai-data-center-funding-microsoft-75e879b6
Финансирование поступает от Crusoe, которая будет управлять объектом, и инвестиционной компании Blue Owl Capital. С учетом этого раунда общая сумма инвестиций в проект теперь составляет 15 миллиардов долларов. Ожидается, что после завершения строительства в следующем году площадка в Абилине станет крупнейшим центром обработки данных, используемым OpenAI.
Объект будет состоять из восьми зданий, в каждом из которых будет установлено до 50 000 чипов Nvidia Blackwell. Эти чипы специально разработаны для обучения больших языковых моделей. До сих пор OpenAI полагалась исключительно на инфраструктуру Microsoft, но, по данным Wall Street Journal, компания была недовольна имеющимися мощностями. В ответ OpenAI заключила отдельную сделку с Oracle, которая арендует площадку на 15 лет и поставит оборудование.
Абилин знаменует собой начало «Звездных врат»
Считаем.
8 зданий по 50к чипов. Итого 400к.
Grok-3 обучали на гигакомпьютере Colossus с использованием 200 000 чипов Nvidia H100
Nvidia Blackwell B200 на 57% быстрее для обучения модели, чем H100, и в 10 раз дешевле в эксплуатации.
Итог: новый кластер в 3.14 раза мощнее, чем у Маска. И это только начало проекта.
Котэ. Миджорни
Голубой, но бардовский. Тёплый ламповый.
Сэм Альтман, главный в компании OpenAI, и Джони Айв, бывший главный дизайнер Apple (который придумал, как выглядит iPhone), вместе делают что-то новенькое.
Они хотят создать устройство с искусственным интеллектом, которое станет нашим другом и помощником в обычной жизни. Представьте, маленький гаджет, который всегда рядом, но не отвлекает как телефон. Они планируют выпустить целых 100 миллионов таких устройств! Если у вас есть подписка на ChatGPT, вам просто пришлют это устройство, и вы сможете им пользоваться.
Обещают, что он появится к концу 2025 года. Это будет не телефон и не часы, а что-то совсем другое, что поможет нам меньше смотреть в экраны. Говорят, что дизайн будет просто “вау”.
Чтобы никто не украл идею, все держат в секрете. OpenAI даже купила дизайнерскую компанию Айва за огромные деньги (6,5 миллиарда долларов), чтобы это стало возможным. Альтман думает, что это будет самая большая и важная вещь, которую когда-либо делала OpenAI, и что благодаря этому компания сможет заработать триллион долларов и стать еще дороже. Еще один важный человек из OpenAI, Питер Велиндер, тоже уже давно работает над этим устройством вместе с Айвом.
Сэм Альтман, главный в компании OpenAI, и Джони Айв, бывший главный дизайнер Apple (который придумал, как выглядит iPhone), вместе делают что-то новенькое.
Они хотят создать устройство с искусственным интеллектом, которое станет нашим другом и помощником в обычной жизни. Представьте, маленький гаджет, который всегда рядом, но не отвлекает как телефон. Они планируют выпустить целых 100 миллионов таких устройств! Если у вас есть подписка на ChatGPT, вам просто пришлют это устройство, и вы сможете им пользоваться.
Обещают, что он появится к концу 2025 года. Это будет не телефон и не часы, а что-то совсем другое, что поможет нам меньше смотреть в экраны. Говорят, что дизайн будет просто “вау”.
Чтобы никто не украл идею, все держат в секрете. OpenAI даже купила дизайнерскую компанию Айва за огромные деньги (6,5 миллиарда долларов), чтобы это стало возможным. Альтман думает, что это будет самая большая и важная вещь, которую когда-либо делала OpenAI, и что благодаря этому компания сможет заработать триллион долларов и стать еще дороже. Еще один важный человек из OpenAI, Питер Велиндер, тоже уже давно работает над этим устройством вместе с Айвом.
Claude 4 вышел!
Разрабы пустили зверя на OpenSource проект и он трудился 7 часов без остановок автономно.
// Вот это релиз! Молчали несколько месяцев, наблюдая как все конкуренты их обходят. Прошлая версия 3.7 была в топе по веб-кодингу, пока их не обошёл Gemini 2.5 PRO.
А Вы заметили, что бустануло нейронки?
Когда Gemini 2.5 PRO обновляли, то добавили функцию Deep Think, что позволяло нейронке параллельно работать над задачей с разных заходов.
А сейчас Claude, внимательно смотрим. Я предположу, что принцип такой же.
Проще говоря. Сначала буст кода был от "цепочки размышлений" - размышляющий режим.
А сейчас это несколько цепочек одновременно.
Назовём это Мульти-размышляющий режим.
Хоть проекты и с закрытым кодом, но можно повторить в OpenSource идею.
Открытая нейронка Bagel от ByteDance.
Мультимодальная модель VLM (текст, картинки, зрение, размышление), которая способна создавать и править изображения.
GitHub - ByteDance-Seed/Bagel