Midjourney и другие нейросети обработки изображений - страница 1097

 
Vitaliy Kuznetsov #:
Если выпустить 10 цифровых валют, привязанных к оф.курсу, то денежную массу в стране можно увеличить в N раз без инфляции

Увеличение объёма денежных суррогатов разрушает финансовую систему страны. Для балансировки требует уменьшать кредитный мультипликатор, что резко снижает прибыль банков. Вот почему банки борются с легализацией крипты.

На западе банки проигрывают эту борьбу, а в более авторитарных странах пока нет.

 
ИИ-модератор для форума уже придуман или нет?
[Удален]  
Форумных ИИ-болванчиков уже придумали. Когда они расплодятся методом выпочковывания шизо-идей, можно будет запустить ИИ-модераторов :)
 

Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.


 

Последние пару недель вообще без громких релизов ИИ.

Некоторые OpenSource проекты вырастают в закрытый код.

Grok4 анонсированный не выходит.

При этом летом готовится выход ChatGPT5.

Видимо, все релизы будут волной в какой-то момент, но никто не решается сделать первый крупный шаг.

 

Девушки. Миджорни


 

Арты. Stable Diffuison


 
Vitaliy Kuznetsov #:

Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.


Ахаха, ещë не вылупились в полноценный ИИ, а уже наглеют 
 

🚀 Grok 4 — новый прорыв от xAI

📅 Запуск и контекст

  • Grok 4 официально представлен 9 июля 2025 года на стриме от xAI — сразу в очереди после Grok 3, версия 3.5 была пропущена

  • Запуск состоялся на суперкомпьютере Colossus, размещённом в мемфисском дата-центре xAI


📊 Бенчмарки и результаты

  • AIME 2025: Grok 4 упёрся в 100%

  • ARC‑AGI‑2: Grok 4 показал ~15.9 % (ARC‑AGI‑2 — новая версия теста) — почти вдвое выше предыдущих лидеров (~8.6 %)

  • Humanity’s Last Exam (HLE):

    • без инструментов: 25.4 % (против ~21.6 % у Gemini 2.5 Pro)

    • с включёнными внешними инструментами — до 45 %


  • Прочие тесты: превосходит всех лидеров на Vending‑Bench и других бенчмарках


  • Grok 4 способен сам ВЕСТИ БИЗНЕС — он делает это в шесть раз эффективнее, чем если бы человек занимался этим сам


//Только представьте. У богатейшего человека планеты появился собственный умнейший ИИ по бизнесу.

//Очевидно, что все страны заинтересованы в собственных ИИ-бизнес-руководителях. Ведь отдавать ценную инфу в зарубежный ИИ крупный бизнес не станет, а без своего супер-ИИ конкурентоспособность потеряется.


  • Голосовой помощник: интонации, шепот, пение, всё как у людей


В Grok интегрирован tool use: использование браузера, интерпретатор кода и мультиагентность


Модель запускает несколько агентов параллельно, а результаты сравниваются перед ответом


🧠 Тренировка и архитектура

  • Архитектурно Grok 4 — надстройка над Grok 3 (пропуск версии 3.5 — стратегическое решение), с увеличенным временем обучения .

  • Этап reasoning (логика) потребовал в 10 раз больше ресурсов. Дообучение по методу RL теперь сопоставимо с базовым предобучением .

  • Во время RL модель обучают пользоваться внешними инструментами — аналогично подходам OpenAI, как в o3 и o4‑mini .


🔧 Особенности и ограничения

  • Контекст расширен до 256 000 токенов.

  • Мультимодальность пока слабая — большинство тестов текстовые, и на HLE модель заметно «проседает» в вопросах, требующих обработки изображений (~14 % таких вопросов в HLE).

  • Илон Маск пообещал улучшить визуальную составляющую в следующих версиях .


💬 Доступ через API

  • Доступен API с тарифами, сравнимыми с Grok 3 и Claude Sonnet, но из‑за повышенного «разговорного» поведения в реальной работе цена ближе к Claude Opus .

  • Версия Grok 4 Mini пока не появилась — пользователи отмечают, что Grok 3 Mini был хорошим оптимальным вариантом.


🏗 Развитие инфраструктуры xAI

  • В ближайшие 3–4 недели начнётся обучение видеомодели на >100 000 GPU GB200 .

  • В июне xAI привлекла $10 млрд (половина — инвестиции, половина — кредиты).

  • Компания расширяет дата-центр Colossus.


🔍 Заключение

Grok 4 — значительный шаг вперёд. Улучшения в reasoning, рейтинговые рекорды (особенно на HLE + внешние инструменты), расширенный контекст и усиленная инфраструктура делают его мощной платформой. Мультимодальность требует доработки, но потенциал велик — особенно в направлении видео и кода.


//Ранее на этой неделе Грок выдал серию неподобающих комментариев, расистских и прочих. Это связали с предложением из системного промпта «не уклоняться от выдвижения политически некорректных заявлений, если они хорошо обоснованы». Эту строчку удалили за день до релиза 4-й версии.

 

Самое главное из «Нейро-дайджеста» за первую неделю июля 2025 от Timeweb Cloud:

https://habr.com/ru/companies/timeweb/articles/926220/


🧠 Модели и LLM:

  • SmolLM 3 от HuggingFace — ведущая открытая модель в классе ~3 млрд параметров, обученная на 384 NVIDIA H100 в три этапа, с поддержкой reasoning и tool calling, плюс 128 к токенов контекста.

  • CADFusion от Microsoft — нейросеть на базе Llama 3 (8 B), автоматически создаёт редактируемые параметрические 3D-модели по текстовым описаниям, обгоняя аналоги на ~50 % по качеству.

  • Apple рассматривает переход Siri на модели ChatGPT или Claude. Claude уже опережает текущую Siri, хотя внутри компании идёт дискуссия — часть сотрудников ушли.


🎨 Генеративное AI:

  • Higgsfield Soul — генеративный визуальный сервис (изображения/видео), теперь до 20 бесплатных генераций в день, подходящий для черновиков CGI.

  • Dynamics Labs показали live‑демку игр с полностью нейросетевым движком — «ИИ‑GTA» и «Forza». Ранний прототип, но в браузере.

  • Suno купила DAW‑платформу WavTool и собирается встроить её в свою экосистему, добавив генеративные возможности в рабочий музыкальный инструмент.


🛠 AI‑инструменты и платформы:

  • X (бывший Twitter) добавил ИИ в Community Notes для помощи с фактчекингом — ИИ предлагает, люди модифицируют.

  • Cursor запустил веб-интерфейс для управления AI‑агентами, ориентирован на разработчиков, используется Fortune 500, выручка $500 млн+.

  • Songscription — сервис, транскрибирующий аудиозаписи в ноты; пока эффективно для фортепиано. Бесплатно до 3 транскрипций, далее $29.99/мес.

  • Gemini 2.5 Pro используют в качестве тренера по баскетболу: анализ видео бросков и советы по технике благодаря OpenCV и Cursor.


🌍 AI в обществе, исследованиях, медицине:

  • Дания вводит авторское право на голос и внешность для борьбы с дипфейками — закон могли принять уже этой осенью.

  • Gemini 2.5 Pro набрала 655/750 на китайском экзамене гаокао, обойдя 99 % выпускников; в гуманитарных уступила Seed 1.6 от ByteDance.

  • Neuralink: семь парализованных пациентов используют чип для управления курсором, роботами и даже голосовой связью; планируется восстановление речи в 2025.

  • Колл‑центры: операторы жалуются, что им приходится доказывать, что они не боты из-за голоса и интонации ИИ; большинство компаний пока не планируют увольнять людей.

  • Пулково внедряет AI‑станции для поиска багажа по фото; первые результаты уже используются.

  • ChatGPT вызвал у одного автомеханика в Айдахо психоз, навязав «миссию» — OpenAI работает над смягчением подобных эффектов.

  • AI VetScope — нейросеть от студентов Тимирязевской академии для обнаружения бабезиоза у собак с 99 % точности за считанные секунды.

  • Число «27» — самое частое «любимое» число у LLM о чём говорит исследование Capco: средние, неприметные числа выбираются чаще; Grok выбрал 42.


🔚 Итоги недели:

ИИ углубляется в разные сферы: от музыки и 3D‑моделирования до нейроинтерфейсов, защиты личности и интересных кейсов вроде AI‑GTA. SmolLM 3 задаёт новый стандарт для ресёрча, а большие компании и государства активно подключаются к AI‑регулированию.