Midjourney и другие нейросети обработки изображений - страница 1097
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Если выпустить 10 цифровых валют, привязанных к оф.курсу, то денежную массу в стране можно увеличить в N раз без инфляции
Увеличение объёма денежных суррогатов разрушает финансовую систему страны. Для балансировки требует уменьшать кредитный мультипликатор, что резко снижает прибыль банков. Вот почему банки борются с легализацией крипты.
На западе банки проигрывают эту борьбу, а в более авторитарных странах пока нет.
Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.
Последние пару недель вообще без громких релизов ИИ.
Некоторые OpenSource проекты вырастают в закрытый код.
Grok4 анонсированный не выходит.
При этом летом готовится выход ChatGPT5.
Видимо, все релизы будут волной в какой-то момент, но никто не решается сделать первый крупный шаг.
Девушки. Миджорни
Арты. Stable Diffuison
Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.
🚀 Grok 4 — новый прорыв от xAI
📅 Запуск и контекст
Grok 4 официально представлен 9 июля 2025 года на стриме от xAI — сразу в очереди после Grok 3, версия 3.5 была пропущена
Запуск состоялся на суперкомпьютере Colossus, размещённом в мемфисском дата-центре xAI
📊 Бенчмарки и результаты
AIME 2025: Grok 4 упёрся в 100%
ARC‑AGI‑2: Grok 4 показал ~15.9 % (ARC‑AGI‑2 — новая версия теста) — почти вдвое выше предыдущих лидеров (~8.6 %)
Humanity’s Last Exam (HLE):
без инструментов: 25.4 % (против ~21.6 % у Gemini 2.5 Pro)
с включёнными внешними инструментами — до 45 %
Прочие тесты: превосходит всех лидеров на Vending‑Bench и других бенчмарках
Grok 4 способен сам ВЕСТИ БИЗНЕС — он делает это в шесть раз эффективнее, чем если бы человек занимался этим сам
//Только представьте. У богатейшего человека планеты появился собственный умнейший ИИ по бизнесу.
//Очевидно, что все страны заинтересованы в собственных ИИ-бизнес-руководителях. Ведь отдавать ценную инфу в зарубежный ИИ крупный бизнес не станет, а без своего супер-ИИ конкурентоспособность потеряется.
Голосовой помощник: интонации, шепот, пение, всё как у людей
В Grok интегрирован tool use: использование браузера, интерпретатор кода и мультиагентность
Модель запускает несколько агентов параллельно, а результаты сравниваются перед ответом
🧠 Тренировка и архитектура
Архитектурно Grok 4 — надстройка над Grok 3 (пропуск версии 3.5 — стратегическое решение), с увеличенным временем обучения .
Этап reasoning (логика) потребовал в 10 раз больше ресурсов. Дообучение по методу RL теперь сопоставимо с базовым предобучением .
Во время RL модель обучают пользоваться внешними инструментами — аналогично подходам OpenAI, как в o3 и o4‑mini .
🔧 Особенности и ограничения
Контекст расширен до 256 000 токенов.
Мультимодальность пока слабая — большинство тестов текстовые, и на HLE модель заметно «проседает» в вопросах, требующих обработки изображений (~14 % таких вопросов в HLE).
Илон Маск пообещал улучшить визуальную составляющую в следующих версиях .
💬 Доступ через API
Доступен API с тарифами, сравнимыми с Grok 3 и Claude Sonnet, но из‑за повышенного «разговорного» поведения в реальной работе цена ближе к Claude Opus .
Версия Grok 4 Mini пока не появилась — пользователи отмечают, что Grok 3 Mini был хорошим оптимальным вариантом.
🏗 Развитие инфраструктуры xAI
В ближайшие 3–4 недели начнётся обучение видеомодели на >100 000 GPU GB200 .
В июне xAI привлекла $10 млрд (половина — инвестиции, половина — кредиты).
Компания расширяет дата-центр Colossus.
🔍 Заключение
Grok 4 — значительный шаг вперёд. Улучшения в reasoning, рейтинговые рекорды (особенно на HLE + внешние инструменты), расширенный контекст и усиленная инфраструктура делают его мощной платформой. Мультимодальность требует доработки, но потенциал велик — особенно в направлении видео и кода.
//Ранее на этой неделе Грок выдал серию неподобающих комментариев, расистских и прочих. Это связали с предложением из системного промпта «не уклоняться от выдвижения политически некорректных заявлений, если они хорошо обоснованы». Эту строчку удалили за день до релиза 4-й версии.
Самое главное из «Нейро-дайджеста» за первую неделю июля 2025 от Timeweb Cloud:
https://habr.com/ru/companies/timeweb/articles/926220/
🧠 Модели и LLM:
SmolLM 3 от HuggingFace — ведущая открытая модель в классе ~3 млрд параметров, обученная на 384 NVIDIA H100 в три этапа, с поддержкой reasoning и tool calling, плюс 128 к токенов контекста.
CADFusion от Microsoft — нейросеть на базе Llama 3 (8 B), автоматически создаёт редактируемые параметрические 3D-модели по текстовым описаниям, обгоняя аналоги на ~50 % по качеству.
Apple рассматривает переход Siri на модели ChatGPT или Claude. Claude уже опережает текущую Siri, хотя внутри компании идёт дискуссия — часть сотрудников ушли.
🎨 Генеративное AI:
Higgsfield Soul — генеративный визуальный сервис (изображения/видео), теперь до 20 бесплатных генераций в день, подходящий для черновиков CGI.
Dynamics Labs показали live‑демку игр с полностью нейросетевым движком — «ИИ‑GTA» и «Forza». Ранний прототип, но в браузере.
Suno купила DAW‑платформу WavTool и собирается встроить её в свою экосистему, добавив генеративные возможности в рабочий музыкальный инструмент.
🛠 AI‑инструменты и платформы:
X (бывший Twitter) добавил ИИ в Community Notes для помощи с фактчекингом — ИИ предлагает, люди модифицируют.
Cursor запустил веб-интерфейс для управления AI‑агентами, ориентирован на разработчиков, используется Fortune 500, выручка $500 млн+.
Songscription — сервис, транскрибирующий аудиозаписи в ноты; пока эффективно для фортепиано. Бесплатно до 3 транскрипций, далее $29.99/мес.
Gemini 2.5 Pro используют в качестве тренера по баскетболу: анализ видео бросков и советы по технике благодаря OpenCV и Cursor.
🌍 AI в обществе, исследованиях, медицине:
Дания вводит авторское право на голос и внешность для борьбы с дипфейками — закон могли принять уже этой осенью.
Gemini 2.5 Pro набрала 655/750 на китайском экзамене гаокао, обойдя 99 % выпускников; в гуманитарных уступила Seed 1.6 от ByteDance.
Neuralink: семь парализованных пациентов используют чип для управления курсором, роботами и даже голосовой связью; планируется восстановление речи в 2025.
Колл‑центры: операторы жалуются, что им приходится доказывать, что они не боты из-за голоса и интонации ИИ; большинство компаний пока не планируют увольнять людей.
Пулково внедряет AI‑станции для поиска багажа по фото; первые результаты уже используются.
ChatGPT вызвал у одного автомеханика в Айдахо психоз, навязав «миссию» — OpenAI работает над смягчением подобных эффектов.
AI VetScope — нейросеть от студентов Тимирязевской академии для обнаружения бабезиоза у собак с 99 % точности за считанные секунды.
Число «27» — самое частое «любимое» число у LLM о чём говорит исследование Capco: средние, неприметные числа выбираются чаще; Grok выбрал 42.
🔚 Итоги недели:
ИИ углубляется в разные сферы: от музыки и 3D‑моделирования до нейроинтерфейсов, защиты личности и интересных кейсов вроде AI‑GTA. SmolLM 3 задаёт новый стандарт для ресёрча, а большие компании и государства активно подключаются к AI‑регулированию.