Midjourney и другие нейросети обработки изображений - страница 998
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
* Kimi-VL-A3B-Instruct: рекомендуется для эффективного логического вывода при общем многомодальном восприятии и понимании, OCR, длинных видео и длинных документах, восприятии видео и использовании агентов.
https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct
* Kimi-VL-A3B-Thinking: рекомендуется для расширенного текста и многомодальных рассуждений (например, математических).
https://huggingface.co/moonshotai/Kimi-VL-A3B-Thinking
//Пока что ждём Q4 версию, далее тестим в LM Studio. Идея того, что данная модель в 16B использует в процессе лишь 3B, говорит о том, что она очень быстрая при локальном использовании.
Очень не хватает простого портабельного софта, способного использовать квантованные версии генераторов изображений.
Заметил, что есть gguf версии FLUX и других. Т.е. могут работать локально с приемлемой скоростью
Безусловно, способы запуска есть. Сиди читай мануалы, качай и пробуй.
Однако, чтобы был универсальный софт по типу LM Studio,способный качать и юзать различные фото/видео генераторы, его ещё нет. Pinokio - да, пробовал, выкачал гигов 30 для FLUX, но это не совсем то, что хочется.
И вот тот, кто это сделает первым оставит своё след в индустрии. И желательно, чтобы там были и LLM, поскольку мультимодальность позволяет в дальнейшем использовать генерацию изображений.
Где конечный продукт использования Моделей?
у тебя на аватарке
у тебя на аватарке
Очень не хватает простого портабельного софта, способного использовать квантованные версии генераторов изображений.
Питон-платформа ComfyUI и программы, на ней основанные.
Питон-платформа ComfyUI и программы, на ней основанные.