Midjourney и другие нейросети обработки изображений - страница 908

 
Valeriy Yastremskiy #:
Сколько каналов ТВ нужно для уверенности, что всегда будет найден интересный канал?) и при этом количество фильмов, тематик ограничено.) уже 300 это зло) 
В связи с тем, что мотивация к просмотру и спектр интересов пользователя являются субъективными явлениями, да ещё и изменчивыми во времени, решать задачу "полезности" или "интересности" можно лишь обобщённо. Кому-то при этом зайдёт, кому-то нет. Это нормально!
 
Valeriy Yastremskiy #:
Сколько каналов ТВ нужно для уверенности, что всегда будет найден интересный канал?) и при этом количество фильмов, тематик ограничено.) уже 300 это зло) 

...

Мой батя, пока был жив, смотрел только канал "Охота и рыбалка", хотя доступных вариантов на эту тему было не менее десятка при наличии больше 250 каналов на выбор в общем. Я рад, что батя смотрел именно то, что ему нравилось. Помню все восходы и закаты на рыбалке с тобой, пап....

 
Vitaliy Kuznetsov #:

Сэм Альтман

GPT-4.5 готов!

хорошие новости: это первая модель, с которой я чувствую себя так, словно разговариваю с вдумчивым человеком.

Хорошо бы прогнать этот ИИ-вариант с теми же вопросами, когда возникло мое (и не только) ощущение (ИИ вижу только в этой ветке) от ответов.

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Midjourney и другие нейросети обработки изображений

fxsaber, 2025.02.25 22:33

Субъективно, ответ Дипа на голову выше остальных. Ощущение сухости с ним полностью отсутствует.

 

Сравнение топовых моделей ИИ, в которых нет функции "размышления" (те другие модели, имеют плюсы и минусы)

1. Описание тестов

  1. GPQA
    Точный источник бенчмарка GPQA не указан, но судя по названию, это набор заданий по General Purpose Question Answering – то есть вопросы общего характера, проверяющие навыки понимания текста, базовые знания по разным темам и способность давать точные ответы.

  2. AIME ’24
    Скорее всего, речь идёт о задачах из математического соревнования AIME (American Invitational Mathematics Examination) – это продвинутый конкурс, нацеленный на решение нетривиальных математических задач. Уровень сложности вопросов достаточно высок, они проверяют способность к математическим рассуждениям, абстрактному мышлению и аккуратным вычислениям.

  3. MMLU
    MMLU (Massive Multitask Language Understanding) – широко известный комплексный тест, включающий вопросы по множеству дисциплин (гуманитарные, точные и естественные науки, инженерия и т. д.). Он проверяет общее языковое понимание и эрудицию модели в самых разных областях знаний.

  4. MATH 500
    Под этим названием обычно подразумевают сложный математический набор задач (иногда это обновлённые/дополненные варианты существующих MATH-бенчмарков). Проверяется умение проводить многошаговые логические и численные рассуждения.

  5. SWE-Bench Verified
    Судя по названию, это бенчмарк, связанный с задачами по программированию и/или тестированию кода (SWE – Software Engineering). “Verified” может указывать на то, что в тесте есть система автоматической проверки корректности решений или тестовых примеров. Здесь важно умение модели понимать код, синтаксис, логику и концепции программирования.

 

Арты. Миджорни


 

Разные арты. Миджорни


 

Разное. Миджорни


 

Исследования на тему просмотра интернет контента:

1. Две недели без интернета в смартфоне значительно улучшают сон, здоровье, работу мозга

https://www.psypost.org/want-better-focus-and-a-happier-mind-this-simple-smartphone-change-could-be-the-answer/


1.1.  Использование телефона сразу после пробуждения негативно влияет на настроение и когнитивные способности.

Согласно исследованию, привычка проверять гаджеты в первые 30 минут после сна перегружает мозг, ухудшает концентрацию внимания и снижает продуктивность на весь день. Ученые объясняют это явление "сонной инерцией" — состоянием, при котором мозг постепенно переходит от сна к бодрствованию. Специалисты рекомендуют начинать день без телефона, уделяя время утренним ритуалам, чтобы помочь мозгу "проснуться".


2. Просмотр TikTok может приводить к уменьшению объёма серого вещества в мозге.

По результатам исследования, проведённого группой специалистов из Нормального университета Тяньцзиня (Китай), у людей с высокой зависимостью от коротких видео, к которым относится и TikTok, объём серого вещества сокращается в орбитофронтальной коре, отвечающей за принятие решений. За два месяца объём серого вещества в этой области у добровольцев уменьшился в среднем на 2,3%. 234


3. Физические упражнения уменьшают симптомы интернет-зависимости. 

https://www.psypost.org/exercise-eases-internet-addiction-in-chinese-college-students/

Интернет-зависимость связана с механизмами вознаграждения в мозге, управляемыми дофамином.

Упражнения также уменьшают тревогу, одиночество, стресс, чувство неадекватности, усталость и депрессию, улучшая психическое здоровье. 

 

202502 Неделя открытого исходного кода (итог) - https://github.com/deepseek-ai/open-infra-index


Мы — крошечная команда @deepseek искусственным интеллектом, расширяющая свои возможности в исследовании AGI.

Начиная с этой недели, 24 февраля 2025 года, мы откроем исходный код 5 репозиториев - один ежедневный дроп - не потому, что мы сделали грандиозные заявления, Но просто как разработчики, которые делятся нашим небольшим, но искренним прогрессом с полной прозрачностью.

Это скромные строительные блоки нашего онлайн-сервиса: задокументированные, развернутые и проверенные в бою в рабочей среде. Никакого пустого программного обеспечения, просто искренний код, который двигал нашу крошечную, но амбициозную мечту вперед.

Почему? Потому что каждая общая линия становится коллективным импульсом, который ускоряет путешествие. В скором времени начнутся ежедневные разблокировки. Никаких башен из слоновой кости - только чистая энергия гаража и инновации 🔧, управляемые сообществом

Оставайтесь с нами — давайте вместе выйдем на улицу.


День 1 - FlashMLA

Эффективное ядро декодирования MLA для графических процессоров
Hopper Оптимизировано для последовательностей переменной длины, проверено в бою в производстве

🔗 FlashMLA GitHub Repo
✅ BF16 поддерживает
✅ выгруженный кэш KV (размер блока 64)
⚡ Производительность: 3000 ГБ/с с привязкой к памяти | BF16 580 TFLOPS с привязкой к вычислительным ресурсам на H800


День 2 - DeepEP

Рад представить DeepEP - первую коммуникационную библиотеку с открытым исходным кодом для обучения и вывода моделей MoE.

🔗 DeepEP GitHub Repo
✅ Эффективная и оптимизированная коммуникация
✅ «все ко всем» Поддержка как внутриузловых, так и межузловых узлов с NVLink и RDMA
✅ Ядра с высокой пропускной способностью для обучения и предварительного заполнения
✅ логических выводов Ядра с низкой задержкой для декодирования
✅ логических выводов Встроенная поддержка
✅ диспетчеризации FP8 Гибкое управление ресурсами графического процессора для перекрытия вычислений и связи


День 3 - DeepGEMM

Представляем DeepGEMM - библиотеку FP8 GEMM, которая поддерживает как плотные, так и MoE GEMM, обеспечивая обучение и вывод V3/R1.

🔗 DeepGEMM GitHub Repo
⚡ До 1350+ FP8 TFLOPS на графических процессорах
✅ Hopper Без сильной зависимости, такой же чистый, как учебник
✅ Полностью скомпилированный Just-In-Time Основная
✅ логика на ~300 строк - но превосходит настроенные экспертами ядра на большинстве размеров
✅ матрицы Поддерживает плотную компоновку и две схемы MoE


День 4 - Оптимизированные стратегии параллелизма

✅ DualPipe - алгоритм двунаправленного параллелизма конвейера для перекрытия вычислений и коммуникаций в обучении V3/R1.
🔗 Репозиторий GitHub

✅ EPLB - экспертно-параллельный балансировщик нагрузки для V3/R1.
🔗 Репозиторий GitHub

📊 Анализ пересечения вычислений и коммуникаций в V3/R1.
🔗 Репозиторий GitHub


День 5 - 3FS, Thruster для доступа к данным DeepSeek

Fire-Flyer File System (3FS) - параллельная файловая система, использующая всю пропускную способность современных SSD и RDMA-сетей.

⚡ 6,6 ТиБ/с совокупная пропускная способность чтения в кластере
⚡ из 180 узлов 3,66 ТиБ/мин пропускная способность в тесте GraySort в кластере
⚡ из 25 узлов 40+ ГиБ/с пиковая пропускная способность на клиентский узел для поиска
🧬 KVCache Дезагрегированная архитектура с высокой согласованностью Предварительная
✅ обработка данных обучения, загрузка набора данных, сохранение/перезагрузка контрольных точек, встраивание векторного поиска и поиск KVCache для вывода в V3/R1

📥 3FS → https://github.com/deepseek-ai/3FS

⛲ Smallpond - фреймворк обработки данных на 3FS → https://github.com/deepseek-ai/smallpond


День 6 - Еще кое-что: Обзор системы вывода DeepSeek-V3/R1

Оптимизированная пропускная способность и задержка за счет:
🔧 Межузлового пакетного масштабирования
🔄 на основе EP Перекрытия
⚖️ вычислений и связи Балансировки нагрузки

Производственные данные онлайн-сервисов V3/R1:
⚡ 73,7k/14,8k токенов ввода/вывода в секунду на узел
🚀 H800 Маржа прибыли по себестоимости 545%


💡 Мы надеемся, что выводы этой недели принесут пользу сообществу и внесут вклад в достижение наших общих целей AGI.

📖 Глубокое погружение: 🔗День 6 - Еще одна вещь: Обзор

 

Эта функция есть давно, но вот только дошли руки её потестить.

В чате Квин (https://chat.qwenlm.ai) можно включить тэг "Артефакты", тогда Вы сможете видеть работу написанного кода.

Попросил создать виджет с анимацией дождя, снега и ветра.

Он написал код и сам решил назначить кнопки для переключения режимов. В визуализации справа в окне всё действительно движется и переключается.

Для лучшего кода также ставьте тэг "Мышление".