Midjourney и другие нейросети обработки изображений

Vitaliy Kuznetsov 2025.06.07 19:11 #10741

Edgar Akhmadeev #:

Для GPU среднего уровня 41 токена в секунду - нормальная скорость. У меня на RTX 3060 DeepSeek-Coder-V2-Lite-Instruct-Q5_K_M.gguf (16B) - 52.37 t/s. Qwen3-14B-128K-UD-Q5_K_XL.gguf (14B) - 25.45 t/s.

Если брать нейронки, не заточенные конкретно на математику и код, то лучше чем Gemma3-12 или 27, если позволяет видюха, на сегодня нет (для локального офлайн пользования).

Andrey Dik 2025.06.07 20:36 #10742

Vitaliy Kuznetsov #:

Если брать нейронки, не заточенные конкретно на математику и код, то лучше чем Gemma3-12 или 27, если позволяет видюха, на сегодня нет (для локального офлайн пользования).

Попробовал Gemma 3 27b. Ухты. Работает.

подумалось, вот говорилось, что один запрос пользователя так много энергии требует для работы модели, стотыщьпятсот тон угля надо сжечь, чтобы обработать... помоему, мягко говоря, звиздёж. меньше энергии требуется.

PS. Иш ты, "я думаю"... Думает он, видишь ли. "Калькулирую", сказал бы, хотябы.

Мультитаймфреймовые индикаторы Нейронные сети Почему для выхода в

Andrey Dik 2025.06.07 20:47 #10743

Vitaliy Kuznetsov #:

Если брать нейронки, не заточенные конкретно на математику и код, то лучше чем Gemma3-12 или 27, если позволяет видюха, на сегодня нет (для локального офлайн пользования).

могу ли я сделать вывод, что "видюха позволяет", раз моделька запустилась и даже отвечает что-то на вопросы?

Edgar Akhmadeev 2025.06.07 21:17 #10744

Vitaliy Kuznetsov #:

Если брать нейронки, не заточенные конкретно на математику и код, то лучше чем Gemma3-12 или 27, если позволяет видюха, на сегодня нет (для локального офлайн пользования).

Gemma3 12B работает, 27B не умещается целиком в 12 Gb VRAM.

Я текстовые модели локально использовать не придумал зачем. Локально использовал только фото-генераторы и улучшайзеры.

Текстовые использую онлайн, только бесплатные и без VPN.

Andrey Dik #:
Попробовал Gemma 3 27b. Ухты. Работает.

Сколько VRAM?

Andrey Dik 2025.06.07 22:17 #10745

Edgar Akhmadeev #:

Сколько VRAM?

8, RTX 4060

Aleksander 2025.06.08 04:51 #10746

Можно делить ии, часть в gpu, остатки в оперативку cpu оьрабатывать, скоррсть токенов только снижается

Vitaliy Kuznetsov 2025.06.08 05:45 #10747

Andrey Dik #:
могу ли я сделать вывод, что "видюха позволяет", раз моделька запустилась и даже отвечает что-то на вопросы?

У меня тоже запускается, но 1,5 токена в секунду. 12B не сильно уступает по качеству 27B, но работает пошустрее, ей пользуюсь. 4B тоже стоит, уверенно летает, с неё всегда начинаю.

Edgar Akhmadeev #:
Я текстовые модели локально использовать не придумал зачем.

Есть несколько вещей, для чего стоит использовать локально.

При всей внешней шумихи, всё равно делаю вывод, что нейронка очень хороший психолог, наставник.

Если нужно сделать рерайт текста и не нарваться на водяные знаки и попадания в обучающую выборку. Это если кто-то продвигает сайты. В какой-то момент все ИИ-тексты будут пессимизироваться поисковиками, а может и не будут, но стоит учитывать риск.

Работа с документами и кодами, своими или компаниями. Не стоит такое онлайнить, т.к. сливы были и будут.

Symbian 60, framework и Kак утановить мабилний терминал Модернизация класса CExpert (Expert.mqh)

Ivan Butko 2025.06.10 09:19 #10748

Предложение по ветке: рубрика «ИИтоги».

Раз месяц, либо раз в три месяца или полгода обобщать самые любопытные посты. С одноимённым тегом, чтобы искать можно было

Aleksey Nikolayev 2025.06.10 16:36 #10749

Интересно, не участвует ли кто-нибудь в тестировании ИИ-браузера Dia? Любопытно насколько перспективно направление по сравнению с провалившимся ИИ-браузером Arc от той же компании.

PS. Есть же ещё обещанный Perplexity ИИ-браузер Comet.

FOREX - Тенденции, прогнозы Как Вам новое оформление Сигналы : Спрашивайте и

Vitaliy Kuznetsov 2025.06.10 17:52 #10750

Мурчащее. Миджорни

Midjourney и другие нейросети обработки изображений - страница 1075