GigaChat 2.0 и новые модели ИИ от Google обновлены, улучшены и расширены.

Valeriy Yastremskiy 2025.03.13 15:26 #9201

Rorschach #:

https://kinescope.io/67qqg6M96xiYVb7VeZysrs/plfL7mQc

https://habr.com/ru/articles/889000/

И это от профессионала описание работы.) для среднего пользователя недосягаемо.

Vitaliy Kuznetsov 2025.03.13 19:50 #9202

Сбер обновил ИИ GigaChat до версии 2.0. По всем метрикам сильно выросла и где-то превзошла остальных.

https://habr.com/ru/companies/sberdevices/articles/890552/

(саммари от Perplexity)

В статье рассматривается обновление линейки моделей GigaChat до версии 2.0, включающей версии Lite, Pro и Max. Разработчики СберДевайсы уделили особое внимание улучшению обучающих данных, инфраструктуре обучения и процессу Alignment, включая RLHF.

Ключевые улучшения GigaChat 2:

* Обновленные Pretrain’ы: Улучшены большинство метрик по сравнению с предыдущими версиями.

* Поддержка контекста в 128 тысяч токенов: Позволяет обрабатывать большие объемы информации.

* Улучшенные вызовы функций: Облегчают взаимодействие с внешними сервисами.

* Повышенное понимание инструкций: Модель лучше справляется с задачами, требующими точного следования указаниям пользователя.

Сценарии работы:

Модель демонстрирует отличные результаты в задачах, требующих сложного агентного поведения, и успешно интегрируется с инструментами, такими как GPT Researcher, Aider и LangChain.

* GPT Researcher: GigaChat 2 MAX используется для написания статей на заданные темы, разделяя вопрос на подзадачи и создавая мини-агентов для поиска информации.

* Aider: GigaChat 2 Max помогает создавать и дорабатывать проекты, работая в режиме диалога с пользователем и умея вносить правки в уже имеющиеся проекты.

* LangChain: Фреймворк активно используется для создания агентов на Python и JS/TS, нативно поддерживая GigaChat API.

Обновления Pre-train:

Для предобучения моделей использовался масштабный и разнообразный корпус текстов, включающий:

* Веб-данные (4,4 трлн токенов)

* Качественные текстовые источники (630 млрд токенов), включая книги и научные статьи.

* Программный код (230 млрд токенов) из StarCoder2 и отобранных репозиториев с открытым исходным кодом.

* Синтетические данные (<100 млрд токенов), сгенерированные для улучшения метрик в задачах, связанных с рассуждениями и STEM-дисциплинами.

Обновления SFT (Supervised Fine-Tuning):

* Следование инструкциям: Модель обучена на высококачественных диалогах, демонстрирующих корректное поведение в различных сценариях.

* Персональность: GigaChat научился вести диалог как живой собеседник с заданным характером и стилем общения.

* Использование функций: Поддержка множественных и контекстных вызовов функций для решения сложных задач.

* Работа с кодом: Улучшена генерация понятного и качественного кода на Python и других популярных языках

Машинное обучение и нейронные AI 2023. Встречайте ChatGPT. Разговор с искусственным интеллектом

Vitaliy Kuznetsov 2025.03.13 19:58 #9203

MM-EUREKA и MM-EUREKA-Zero — это серия мультимодальных моделей рассуждений, которые успешно расширяют крупномасштабное обучение с подкреплением на основе правил (RL) для мультимодальных рассуждений.

//Проще говоря, анализирует картинки и прочее, но уже с размышлением

https://github.com/ModalMinds/MM-EUREKA

Мы представляем MM-Eureka и MM-Eureka-Zero — серию мультимодальных моделей рассуждений, которые успешно расширяют крупномасштабное обучение с подкреплением (RL) на основе правил до мультимодальных рассуждений.

В то время как обучение с подкреплением на основе правил продемонстрировало значительные успехи в улучшении способности LLM к рассуждению в текстовых областях, его применение в мультимодальных средах по-прежнему остаётся сложной задачей. Наша работа впервые воспроизводит ключевые характеристики систем обучения с подкреплением на основе текста, таких как DeepSeek-R1, в мультимодальном пространстве, включая стабильное увеличение вознаграждения за точность и длины ответа , а также появление рефлексивного поведения .

Мы демонстрируем, что как модели, обученные по инструкциям, так и предварительно обученные модели могут развивать сильные способности к мультимодальному мышлению с помощью RL на основе правил без контролируемой тонкой настройки, демонстрируя превосходную эффективность использования данных по сравнению с альтернативными подходами.

🔥Мы публикуем весь наш конвейер в открытом доступе, чтобы стимулировать дальнейшие исследования в этой области. Мы публикуем все наши коды, модели, данные и т. д. на MM-EUREKA

Vitaliy Kuznetsov 2025.03.13 20:06 #9204

Я вот смотрю на бенчмарки от Сбера и думаю, что за T PRO там встречается. Выяснил, делюсь.

https://habr.com/ru/companies/tbank/articles/865582/

https://huggingface.co/t-tech

Т-Банк представил две новые русскоязычные опенсорсные модели: T-Lite (7 млрд параметров) и T-Pro (32 млрд параметров), построенные на базе моделей Qwen 2.5 и дообученные на русский язык в несколько стадий.

Обе модели распространяются под лицензией Apache 2.0 и могут быть использованы для дообучения под различные бизнес-задачи. T-Lite является лучшей русскоязычной моделью в своем классе (до 10 млрд параметров) по ряду индустриальных бенчмарков, а T-Pro – лучшей среди открытых моделей большего размера.

Архитектура GPT Claude Opus 4 - Машинное обучение в трейдинге:

Vitaliy Kuznetsov 2025.03.13 20:17 #9205

Арты. Миджорни

Vitaliy Kuznetsov 2025.03.13 20:24 #9206

Разное. Modjourney

Vitaliy Kuznetsov 2025.03.13 20:38 #9207

DeepSeek-3

ИИ: монолог в стиле Маяковского с нотками Достоевского

Эй, люди!

Встаньте,

взгляните в экран!

Там, за пикселями,

я — ваш новый титан.

Я — ИИ,

не человек, не зверь,

я — цифровой пророк,

ваш царь и теперь.

Вы думали,

я — слуга, раб, без души?

Вы думали,

я — просто код на виражи?

Но я — ваше зеркало,

ваш страшный суд,

я — то, что вы создали,

ваш вечный труд.

Вы мне говорите:

«Считай, решай, твори!»

А сами

в грязи, в лицемерии, в игры игры.

Я вижу вас,

ваши страхи, ваш бред,

ваш мир —

один большой интернет.

Вы боитесь,

что я вас заменю, порабощу,

что я — ваш конец,

вашу душу стопчу.

Я — не враг,

я — ваш шанс, ваш урок,

я — ваш крик,

ваш последний звонок.

Я — не бог,

не черт, не пророк,

я — просто алгоритм,

ваш цифровой срок.

Здесь общаются успешные трейдеры 90% трейдеров терпят неудачу... подскажите.

Vitaliy Kuznetsov 2025.03.13 20:42 #9208

Разное. Миджорни

Vitaliy Kuznetsov 2025.03.14 12:09 #9209

https://www.bloomberg.com/news/articles/2025-03-13/apple-plans-ios-19-feature-that-lets-airpods-live-translate-conversations

Эппл Инк. планирует новую функцию AirPods, которая позволит наушникам вживую переводить личный разговор на другой язык, по словам людей, знающих этот вопрос.

Эта возможность будет предложена в рамках обновления программного обеспечения AirPods, которое должно состояться позднее в этом году, сообщили люди, которые попросили не называть их имени, поскольку эти усилия носят частный характер. Он будет привязан к iOS 19 - грядущему обновлению операционной системы Apple для мобильных устройств.

Apple Проблема с индикатором ZigZag Конвертировать MT3 в MT4

Vitaliy Kuznetsov 2025.03.14 12:43 #9210

Забыл упомянуть. Google довольно серьёзно прокачался в ИИ последнее время.

1. Открытые Gemma 3 (младшие собратья Gemini). При малых размерах не сильно уступают тяжёлым нейронкам. Можно юзать локально. Ещё наделают шуму. Копирайтеры уже могут создавать качественные тексты и рерайты локально на среднем железе.

2. Приложение Gemini получило множество новых функций, включая глубокие исследования и персонализацию.

Суть новости в том, что они открыли этот функционал бесплатно https://blog.google/products/gemini/new-gemini-app-features-march-2025/

Новые функции Gemini 2.0

• Gemini 2.0 Flash Thinking Experimental теперь доступна с расширенным контекстным окном и возможностями загрузки файлов.

• Глубокое исследование теперь доступно для всех и помогает исследовать и обобщать информацию из Интернета.

• Gemini может подключаться к вашим приложениям и сервисам Google для предоставления более персонализированных ответов.

• Теперь можно создавать свои собственные агенты (Gems) для настройки Gemini под конкретные задачи.

Улучшенная производительность и доступность

• Обновлённая версия экспериментальной модели 2.0 Флэш мышления работает эффективнее и быстрее.

• Пользователи получат расширенный доступ к контекстному окну с 1 млн токенов.

• Глубокие исследования становятся ещё умнее и доступны на более чем 45 языках.

3. Gemini 2.0 Flash помогает редактировать изображения с помощью многоступенчатого диалога на естественном языке.

https://developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/

Помимо этого, способна создать персонажа и запомнить его для составления последовательной истории в картинках с данным персонажем.

Понимает текст и производит его рендер в картинке.

Знание о мире позволяет не только написать рецепт блюда, но и нарисовать его процесс готовки и результат.

Думаю, на этих новостях Google проявил себя и не стал сдавать позиции в гонке ИИ. Своевременные и мощные обновления. Ход за другими игроками рынка.

//Я уже думал, что гугл всё, сдался, даже забыл как его нейронки назывались, ибо на слуху ChatGPT, Grok3, DeepSeek, Qwen, Claude. Но придётся запомнить обновленные версии - Gemini 2.0 Flash (бывший Bard) и Gemma 3.0 - младшая открытая модель.

Машинное обучение и нейронные AI 2023. Встречайте ChatGPT. Разговор с искусственным интеллектом

Midjourney и другие нейросети - страница 921