Грок 4 стал значительным шагом вперед благодаря улучшениям в логике, рейтинговым рекордам и расширенному контексту.

Edgar Akhmadeev 2025.07.07 18:03 #10961

Vitaliy Kuznetsov #:
Если выпустить 10 цифровых валют, привязанных к оф.курсу, то денежную массу в стране можно увеличить в N раз без инфляции

Увеличение объёма денежных суррогатов разрушает финансовую систему страны. Для балансировки требует уменьшать кредитный мультипликатор, что резко снижает прибыль банков. Вот почему банки борются с легализацией крипты.

На западе банки проигрывают эту борьбу, а в более авторитарных странах пока нет.

Биткоин и все с Может ли хорошая стратегия FOREX - Тенденции, прогнозы

Ilya Filatov 2025.07.08 01:36 #10962

ИИ-модератор для форума уже придуман или нет?

[Удален] 2025.07.08 03:30 #10963

Форумных ИИ-болванчиков уже придумали. Когда они расплодятся методом выпочковывания шизо-идей, можно будет запустить ИИ-модераторов :)

Vitaliy Kuznetsov 2025.07.08 18:24 #10964

Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.

Vitaliy Kuznetsov 2025.07.08 18:28 #10965

Последние пару недель вообще без громких релизов ИИ.

Некоторые OpenSource проекты вырастают в закрытый код.

Grok4 анонсированный не выходит.

При этом летом готовится выход ChatGPT5.

Видимо, все релизы будут волной в какой-то момент, но никто не решается сделать первый крупный шаг.

[ВНИМАНИЕ, ТЕМА ЗАКРЫТА!] Любой Как найти цену открытия DayTrading2

Vitaliy Kuznetsov 2025.07.08 18:34 #10966

Девушки. Миджорни

Vitaliy Kuznetsov 2025.07.08 18:36 #10967

Арты. Stable Diffuison

Ivan Butko 2025.07.08 18:57 #10968

Vitaliy Kuznetsov #:

Условия труда. Роботы ночью не работают! А курьеры - пожалуйста.

Ахаха, ещë не вылупились в полноценный ИИ, а уже наглеют

Vitaliy Kuznetsov 2025.07.10 06:43 #10969

🚀 Grok 4 — новый прорыв от xAI

📅 Запуск и контекст

Grok 4 официально представлен 9 июля 2025 года на стриме от xAI — сразу в очереди после Grok 3, версия 3.5 была пропущена
Запуск состоялся на суперкомпьютере Colossus, размещённом в мемфисском дата-центре xAI

📊 Бенчмарки и результаты

AIME 2025: Grok 4 упёрся в 100%

ARC‑AGI‑2: Grok 4 показал ~15.9 % (ARC‑AGI‑2 — новая версия теста) — почти вдвое выше предыдущих лидеров (~8.6 %)

Humanity’s Last Exam (HLE):

без инструментов: 25.4 % (против ~21.6 % у Gemini 2.5 Pro)
с включёнными внешними инструментами — до 45 %

Прочие тесты: превосходит всех лидеров на Vending‑Bench и других бенчмарках

Grok 4 способен сам ВЕСТИ БИЗНЕС — он делает это в шесть раз эффективнее, чем если бы человек занимался этим сам

//Только представьте. У богатейшего человека планеты появился собственный умнейший ИИ по бизнесу.

//Очевидно, что все страны заинтересованы в собственных ИИ-бизнес-руководителях. Ведь отдавать ценную инфу в зарубежный ИИ крупный бизнес не станет, а без своего супер-ИИ конкурентоспособность потеряется.

Голосовой помощник: интонации, шепот, пение, всё как у людей

В Grok интегрирован tool use: использование браузера, интерпретатор кода и мультиагентность

Модель запускает несколько агентов параллельно, а результаты сравниваются перед ответом

🧠 Тренировка и архитектура

Архитектурно Grok 4 — надстройка над Grok 3 (пропуск версии 3.5 — стратегическое решение), с увеличенным временем обучения .
Этап reasoning (логика) потребовал в 10 раз больше ресурсов. Дообучение по методу RL теперь сопоставимо с базовым предобучением .
Во время RL модель обучают пользоваться внешними инструментами — аналогично подходам OpenAI, как в o3 и o4‑mini .

🔧 Особенности и ограничения

Контекст расширен до 256 000 токенов.
Мультимодальность пока слабая — большинство тестов текстовые, и на HLE модель заметно «проседает» в вопросах, требующих обработки изображений (~14 % таких вопросов в HLE).
Илон Маск пообещал улучшить визуальную составляющую в следующих версиях .

💬 Доступ через API

Доступен API с тарифами, сравнимыми с Grok 3 и Claude Sonnet, но из‑за повышенного «разговорного» поведения в реальной работе цена ближе к Claude Opus .
Версия Grok 4 Mini пока не появилась — пользователи отмечают, что Grok 3 Mini был хорошим оптимальным вариантом.

🏗 Развитие инфраструктуры xAI

В ближайшие 3–4 недели начнётся обучение видеомодели на >100 000 GPU GB200 .
В июне xAI привлекла $10 млрд (половина — инвестиции, половина — кредиты).
Компания расширяет дата-центр Colossus.

🔍 Заключение

Grok 4 — значительный шаг вперёд. Улучшения в reasoning, рейтинговые рекорды (особенно на HLE + внешние инструменты), расширенный контекст и усиленная инфраструктура делают его мощной платформой. Мультимодальность требует доработки, но потенциал велик — особенно в направлении видео и кода.

//Ранее на этой неделе Грок выдал серию неподобающих комментариев, расистских и прочих. Это связали с предложением из системного промпта «не уклоняться от выдвижения политически некорректных заявлений, если они хорошо обоснованы». Эту строчку удалили за день до релиза 4-й версии.

Искусственный интеллект 2020 - Машинное обучение и нейронные AI 2023. Встречайте ChatGPT.

Vitaliy Kuznetsov 2025.07.10 08:37 #10970

Самое главное из «Нейро-дайджеста» за первую неделю июля 2025 от Timeweb Cloud:

https://habr.com/ru/companies/timeweb/articles/926220/

🧠 Модели и LLM:

SmolLM 3 от HuggingFace — ведущая открытая модель в классе ~3 млрд параметров, обученная на 384 NVIDIA H100 в три этапа, с поддержкой reasoning и tool calling, плюс 128 к токенов контекста.
CADFusion от Microsoft — нейросеть на базе Llama 3 (8 B), автоматически создаёт редактируемые параметрические 3D-модели по текстовым описаниям, обгоняя аналоги на ~50 % по качеству.
Apple рассматривает переход Siri на модели ChatGPT или Claude. Claude уже опережает текущую Siri, хотя внутри компании идёт дискуссия — часть сотрудников ушли.

🎨 Генеративное AI:

Higgsfield Soul — генеративный визуальный сервис (изображения/видео), теперь до 20 бесплатных генераций в день, подходящий для черновиков CGI.
Dynamics Labs показали live‑демку игр с полностью нейросетевым движком — «ИИ‑GTA» и «Forza». Ранний прототип, но в браузере.
Suno купила DAW‑платформу WavTool и собирается встроить её в свою экосистему, добавив генеративные возможности в рабочий музыкальный инструмент.

🛠 AI‑инструменты и платформы:

X (бывший Twitter) добавил ИИ в Community Notes для помощи с фактчекингом — ИИ предлагает, люди модифицируют.
Cursor запустил веб-интерфейс для управления AI‑агентами, ориентирован на разработчиков, используется Fortune 500, выручка $500 млн+.
Songscription — сервис, транскрибирующий аудиозаписи в ноты; пока эффективно для фортепиано. Бесплатно до 3 транскрипций, далее $29.99/мес.
Gemini 2.5 Pro используют в качестве тренера по баскетболу: анализ видео бросков и советы по технике благодаря OpenCV и Cursor.

🌍 AI в обществе, исследованиях, медицине:

Дания вводит авторское право на голос и внешность для борьбы с дипфейками — закон могли принять уже этой осенью.
Gemini 2.5 Pro набрала 655/750 на китайском экзамене гаокао, обойдя 99 % выпускников; в гуманитарных уступила Seed 1.6 от ByteDance.
Neuralink: семь парализованных пациентов используют чип для управления курсором, роботами и даже голосовой связью; планируется восстановление речи в 2025.
Колл‑центры: операторы жалуются, что им приходится доказывать, что они не боты из-за голоса и интонации ИИ; большинство компаний пока не планируют увольнять людей.
Пулково внедряет AI‑станции для поиска багажа по фото; первые результаты уже используются.
ChatGPT вызвал у одного автомеханика в Айдахо психоз, навязав «миссию» — OpenAI работает над смягчением подобных эффектов.
AI VetScope — нейросеть от студентов Тимирязевской академии для обнаружения бабезиоза у собак с 99 % точности за считанные секунды.
Число «27» — самое частое «любимое» число у LLM о чём говорит исследование Capco: средние, неприметные числа выбираются чаще; Grok выбрал 42.

🔚 Итоги недели:

ИИ углубляется в разные сферы: от музыки и 3D‑моделирования до нейроинтерфейсов, защиты личности и интересных кейсов вроде AI‑GTA. SmolLM 3 задаёт новый стандарт для ресёрча, а большие компании и государства активно подключаются к AI‑регулированию.

Интересное и Юмор Машинное обучение и нейронные Claude Opus 4 -

Midjourney и другие нейросети - страница 1097