Midjourney и другие нейросети обработки изображений - страница 1139

 
Vitaliy Kuznetsov #:
свой промт-конструктор и адаптивный поиск (уже залил себе на сайт)

это какое-то рекурсивное безумие :-)

писать промптами тулз для составления промптов, чтобы писать промптами

 
Maxim Kuznetsov #:

это какое-то рекурсивное безумие :-)

писать промптами тулз для составления промптов, чтобы писать промптами

Так с какой стороны посмотреть. Писать кодом софт для написания кода - и вот уже различные языки программирования, среды, библиотеки появляются.

Тем более, я написал инструмент и всё, он готов. Это ведь не цель, а средство. Это как мини-библиотека-тренажёр постановки целей. Помогает не только в промт-инженерии, а учит грамотно формулировать мысли.

В итоге - колоссальная экономия времени и нервов на пути к качественному ответу ИИ. И вот эти фразы, что ИИ тупой, не понимает, что от него требуют и т.д. будут происходить всё реже.

 

OpenAI на DevDay 2025 представила важные обновления для разработчиков и компаний — новую версию Codex и инструментарий AgentKit для создания AI-агентов.

//текст perplexity

Codex теперь доступен в общем доступе и построен на GPT‑5-Codex — усовершенствованной модели, оптимизированной для помощи в программировании. В реальных условиях Codex используется через IDE, терминал, Slack-каналы и облачные среды под общим аккаунтом ChatGPT. Среди новых возможностей — Slack-интеграция для делегирования задач напрямую из обсуждений, SDK для встраивания Codex-агента в рабочие процессы с типизированным выводом (TypeScript), и расширенный набор админ-инструментов с мониторингом, аналитикой и безопасностью. В Cisco Codex ускорил проверку pull-реквестов на 50%, а у Instacart автоматизировал очистку кода и задачу технического долга.

AgentKit — это полный набор инструментов для построения автономных агентов, включающий:

  • Agent Builder — визуальный конструктор с drag-and-drop для составления сложных логик и мультиагентных сценариев с возможностью версионирования и тестирования на лету;

  • Connector Registry — панель администрирования для управления интеграциями с Dropbox, Google Drive, Teams и другими источниками;

  • ChatKit — SDK для быстрого встраивания кастомных чат-агентов с управлением потоками сообщений и адаптацией под бренд.

Безопасность поддерживается открытым модулем Guardrails, позволяющим фильтровать конфиденциальные данные, предотвращать взломы и обеспечивать надежность агентов. Встроенный набор инструментов для оценки производительности агентов (Evals) теперь расширен возможностями автоматической оптимизации и поддержкой сторонних моделей.

Всё это включено в стандартное ценообразование API OpenAI, а Agent Builder и Connector Registry доступны в бета-версии для корпоративных клиентов. Новые возможности Codex и AgentKit меняют подход к разработке, ускоряя цикл релизов и делая ИИ-помощников эффективным инструментом для инженеров и продуктовых команд.

Для разработчиков открывается уникальная возможность строить сложные автономные рабочие процессы и интеллектуальные чат-боты, которые уже доказали свою эффективность у крупных компаний и стартапов.

 

Если кому интересно по коду.

Устанавливаем Visual Studio Code

Внутри есть "магазин приложений". И там много разных агентов программирования.

Я поставил Cline и почти сразу израсходовал Claude 4.5 (там стартовый баланс дали в софте, ничего покупать не надо). Потом выбрал Grok-code-fast-1 и всё стало бесплатным

Также я установил бесплатный Blackbox (ещё один агент программирования). Собственно Codex от Open AI и другие, все там есть, но платные.

В итоге, все установленные расширения появляются иконками в левом сайбдаре. Я их перетащил мышкой вправо, там появился чат и агенты в табах.

Т.е. Visual Studio Code + любые расширения = аналог Cursor. И всё, нечего возиться с другими оболочками.


Как пример. Кто бы мог подумать, что скрипт динамического поиска можно оптимизировать в разы.

Плюс также устранены все уязвимости, крушения, неправильные ссылки и т.д.


 
Не всегда можно доверять доводам ИИ, тесты покажут истинную производительность, к примеру я писал генератор ходов шахмат на js в браузере, ИИ меня отговаривал что максимум я смогу делать 100-200.000 ходов  в сек, мой же код показал 80мио ходов в сек... ИИ ошибался... 
 
Человекоподобный робот Tesla Optimus показал кунг-фу Джареду Лето 


Гуманоидный робот Optimus от Tesla совершил свой первый публичный выход на красной дорожке в Голливуде. В ходе мероприятия, приуроченного к премьере фильма «Трон: Арес», машина продемонстрировала актеру Джареду Лето элементы боевого искусства кунг-фу. Кадры взаимодействия были опубликованы на официальной странице робота в социальной сети X (Twitter).

Разработка Optimus, также известного как Tesla Bot, была анонсирована в октябре 2024 года, хотя концепция создания универсального человекоподобного робота была озвучена главой Tesla Илоном Маском еще в августе 2021 года.

Руководитель компании ранее озвучивал планы по массовому производству устройства, предполагая, что его розничная цена будет находиться в пределах от $20 000 до $30 000 (примерно 1,6-2,4 млн руб. по курсу на 7 октября 2025 года, – «Газета.Ru»). Маск также высказывал мнение, что в перспективе этот проект может превзойти по значимости автомобильный бизнес Tesla.

«Трон: Арес» — это научно-фантастическая картина, снятая режиссером Йоахимом Реннингом. Основные роли в фильме исполнили Джаред Лето и Эван Питерс. Премьера фильма запланирована на 8 октября 2025 года.

 

Google представляет модель Gemini 2.5 Computer Use для работы с интерфейсами


// Текст Grok 4 на основе новости: https://blog.google/technology/google-deepmind/gemini-computer-use-model/

Google DeepMind анонсировала Gemini 2.5 Computer Use — ИИ-модель на базе Gemini 2.5 Pro, которая позволяет агентам взаимодействовать с пользовательскими интерфейсами (UI) как человек. Доступна в публичном превью через Google AI Studio и Vertex AI для разработчиков, использующих Gemini API.

Что такое Gemini 2.5 Computer Use?

Модель работает напрямую с графическими интерфейсами, без структурированных API, выполняя навигацию, клики, прокрутку и заполнение форм. Оптимизирована для веб-браузеров и мобильных UI. Процесс итеративный: анализ запроса, скриншота, истории и URL, генерация команд, выполнение и обновление.

Возможности и примеры

Лидирует в бенчмарках (Online-Mind2Web, WebVoyager, AndroidWorld) с точностью >70% и latency ~225 сек. Примеры: извлечение данных из форм в CRM, организация заметок. Тестеры (Poke.com, Autotab) отмечают ускорение workflow на 50% и рост производительности на 18%. В Google используется в Project Mariner и Firebase для автопоиска ошибок (восстановление >60% сбоев).

Безопасность и этика

Модель обучена на распознавание рисков (вредоносное использование, инъекции). Инструменты контроля: проверка действий, системные инструкции для отказа от опасных операций (CAPTCHA, медицинские устройства). Рекомендуется тщательное тестирование.

Доступность и перспективы

Доступна для экспериментов. Шаг к универсальным ИИ-агентам; планы интеграции в поиск AI Mode. Открывает горизонты автоматизации для разработчиков.

 

xAI официально представила обновление Grok Imagine до версии 0.9 — мощный скачок вперед по сравнению с v0.1, запущенной всего пару месяцев назад.

Это не просто апгрейд: новая модель радикально улучшила визуальное качество, плавность движения, реализм и, главное, генерацию аудио.

// До уровня Sora 2 не дотягивает, но и проекту всего 2 месяца с хвостиком.

Вот тут - https://grok.com/imagine

Рандомно оживил чью-то генерацию (ждать результат и правда не долго)

 
В ВК последнее время очень много генераций высокого класса с замутнëнной областью справа посередине. Следы удаления водяного знака. Я так предполагаю, там надпись Sora. 

В связи с "хулиганством" некоторых админов пабликов в части непредупреждения о том, что видео есть генерация, а также наивностью, неразборчивостью и глупостью некоторых админов, особенно исторического направления, когда "клюют" и репостят чей-то фейк, - очень много стало откровенно глупых не только постов, но и комментариев: ведь теперь даже на видео 10-летней давности, когда генераций еще не было до 50% каментов могут написать "ИИ!" 
И даже доказывать свою правоту. 

Издержки новой реальности. 
 

OpenAI заключила контракты на 1 трлн долларов: новые партнеры, круговые инвестиции и рост рисков

Кратко:
OpenAI подписала рекордные соглашения на поставку вычислительных мощностей — почти на 1 трлн долларов. Nvidia инвестирует 100 млрд долларов в OpenAI, AMD предоставляет право выкупа до 10% своих акций. Акции партнеров резко выросли, но аналитики предупреждают: долг превышает доходы, а финансовые потери OpenAI в этом году могут достигнуть 10 млрд долларов.


//Обложка Gemini 2.5, разбор Perplexity

Новость о том, что OpenAI заключила контракты на сумму около 1 триллиона долларов на поставку вычислительных мощностей с такими компаниями, как Nvidia, AMD, Oracle и CoreWeave, а также о связанном с этим сложном финансировании и высоких рисках, подтверждается ведущими мировыми СМИ и аналитическими обзорами.

Суть контракта и финансовые детали

OpenAI действительно подписала соглашения со стратегическими партнёрами — Nvidia, AMD, Oracle, CoreWeave — на общую сумму около 1 триллиона долларов, чтобы обеспечить развитие собственной инфраструктуры искусственного интеллекта. Например, объём сделки с Nvidia оценивается в 500 миллиардов, с AMD — в 300 миллиардов, с Oracle — еще в 300 миллиардов, с CoreWeave — более 22 миллиардов долларов. Всего речь идёт о доступе к 20 ГВт вычислительных ресурсов, что эквивалентно мощности двадцати атомных электростанций в течение 10 лет.

Особые условия финансирования

Финансовые схемы действительно весьма сложны:

Nvidia инвестирует до $100 миллиардов в создание дата-центров OpenAI, эти средства поступают на инфраструктуру с постепенной реализацией по мере ввода в строй новых мощностей.

AMD выдала OpenAI варрант на приобретение до 10% своих акций по номинальной цене (до 160 млн акций), причем право на выкуп активируется после запуска первой секции проекта.

Акции партнеров резко выросли на фоне этих новостей: Oracle +36%, AMD +23%.

Оценки аналитиков и риски

Аналитики, такие как DA Davidson, и крупнейшие инвесторы предупреждают о высокой степени финансового риска:

Прогнозируемый убыток OpenAI по итогам 2025 года может достичь 10 миллиардов долларов — при этом годовая выручка компании (12 млрд долларов) покрывает лишь малую часть обязательств, а прибыльность остается неопределенной.

Финансирование обеспечивается акционерным капиталом, венчурными инвестициями и инструментами долга. В 2023 году OpenAI привлекла 47 млрд долларов венчурных денег, в основном от Microsoft, но этого недостаточно для покрытия текущих обязательств.

Итоги и подтверждение

Вся цепочка сделок, их масштаб, условия сотрудничества и связанные с этим финансовые риски подтверждены ведущими деловыми изданиями и комментариями экспертов. Новость не является фэйком, однако она сопровождается серьёзными предостережениями относительно будущей устойчивости компании и высокой вероятности финансовых потерь.