Midjourney и другие нейросети обработки изображений - страница 818

[Удален]  

Ну там, может быть, скорость будет компенсирована кол-вом агентов

не скорость, а файловые тормоза
 

ByteDance (китайская компания, владеющая Тик-Ток) выпустила UI-TARS модели для взаимодействия с графическими пользовательскими интерфейсами.

Есть локальная ПК версия.

GitHub - bytedance/UI-TARS


UI-TARS — это нативная модель агента с графическим пользовательским интерфейсом нового поколения, предназначенная для беспрепятственного взаимодействия с графическими пользовательскими интерфейсами (GUI) с использованием человеческого восприятия, рассуждений и возможностей действий. В отличие от традиционных модульных фреймворков, UI-TARS интегрирует все ключевые компоненты — восприятие, рассуждение, заземление и память — в единую модель языка машинного зрения (VLM), обеспечивая комплексную автоматизацию задач без предопределенных рабочих процессов или ручных правил.



Основные характеристики

Восприятие

Всестороннее понимание графического интерфейса: обрабатывает мультимодальные входные данные (текст, изображения, взаимодействия) для создания согласованного понимания интерфейсов.

Взаимодействие в режиме реального времени: Непрерывный мониторинг динамических графических интерфейсов и точное реагирование на изменения в режиме реального времени.

Действие

Unified Action Space: стандартизированные определения действий на разных платформах (настольных, мобильных и веб-компьютерах).

Действия, специфичные для платформы: поддерживает дополнительные действия, такие как горячие клавиши, длительное нажатие и жесты, специфичные для платформы.

Рассуждение

Система 1 и система 2 Рассуждение: Сочетает в себе быстрые, интуитивно понятные ответы с продуманным высокоуровневым планированием сложных задач.

Декомпозиция и отражение задач: Поддерживает многоступенчатое планирование, отражение и исправление ошибок для надежного выполнения задач.

Память

Кратковременная память: фиксирует контекст конкретной задачи для ситуационной осведомленности.

Долговременная память: сохраняет исторические взаимодействия и знания для более эффективного принятия решений.

Возможности

Кроссплатформенное взаимодействие: поддержка настольных, мобильных и веб-сред с помощью единой платформы действий.

Многоступенчатое выполнение задач: обучен справляться со сложными задачами с помощью многоступенчатых траекторий и рассуждений.

Обучение на основе синтетических и реальных данных: Объединяет крупномасштабные аннотированные и синтетические наборы данных для улучшения обобщения и надежности.

Производительность


 
Vitaliy Kuznetsov #:

Сделано в v4, хороший вокал и звук.

https://suno.com/song/5132da22-0666-4bae-97e0-67092b3ac87b

Да что же они все не могут победить звук из "мегафона".

Стал грешить на наушники, послушал другое произведение - нет эффекта "мегафона".
Детская - Учат В Школе - скачать песню бесплатно и слушать онлайн
  • sefon.pro
Скачать бесплатно Детская - Учат В Школе в качестве 256 kbps. Возможность слушать песню онлайн и добавить ее к себе в плейлист.
 
fxsaber #:
Да что же они все не могут победить звук из "мегафона".

Дискретизация по времени и квантование по уровню - основы цифро-аналогового преобразования.
Для улучшения качества звука хотя бы до уровня CD потребовалось бы кратно увеличить объёмы обрабатываемых данных, что нецелесообразно.

 
Vitaliy Kuznetsov #:

ByteDance (китайская компания, владеющая Тик-Ток) выпустила UI-TARS модели для взаимодействия с графическими пользовательскими интерфейсами.

Есть локальная ПК версия.

"Так вы и пальцы за меня загибать будете?!"

Вовка в Тридевятом Царстве.

 
Vitaliy Kuznetsov #:

На самом деле, не просто так китайские компании стараются занять пьедестал по всем направлениям ИИ, причём OpenSource.

Есть много мнений. Одно из них, что с приходом AGI, который скорее всего появится первым в известной стране

Как люди поймут, что достигнут уровень AGI? Существует ли его точное определение?

 
Evgeni Gavrilovi #:

Как люди поймут, что достигнут уровень AGI? Существует ли его точное определение?

Когда ИИ начнёт занимать первые строчки среди рейтингов программистов, математиков и прочих.

Не будет ни одного теста, где ИИ не справился бы хуже человека. Вот и весь ответ.


Далее наступит эра ASI, которая кратно переплюнет и этот уровень.

 

Вода, снег, бездорожье. Возможно это тот самый уровень AGI по движению и устойчивости, правда по сравнению с собаками на колёсах)

//при восстании собак, от них будет невозможно сбежать.

 
Vitaliy Kuznetsov #:

Когда ИИ начнёт занимать первые строчки среди рейтингов программистов, математиков и прочих.

Не будет ни одного теста, где ИИ не справился бы хуже человека. Вот и весь ответ.


Далее наступит эра ASI, которая кратно переплюнет и этот уровень.

Вот с чем ИИ мог бы справиться уже сейчас, так это с заполнением этого топика.
 

Девушка и воин. Dalle