Midjourney и другие нейросети обработки изображений - страница 520

 

Вся презентация Google

Google Keynote (Google I/O ‘24)



51:38 Введение в Google I/O


• Марк Руббиер представляет Google I/O, конференцию, посвященную искусственному интеллекту и музыке.

• Он обсуждает новую технологию, которая генерирует музыку с нуля, используя искусственный интеллект.


52:46 Музыкальные эффекты Google


• Марк демонстрирует, как машина Google может создавать музыку, используя подсказки от пользователя.

• Он также обсуждает, как эта технология может быть использована в других областях, таких как поиск и фотографии.


01:16:27 Будущее искусственного интеллекта


• Марк обсуждает, как Google инвестирует в искусственный интеллект уже более десяти лет и как это помогает разработчикам и стартапам.

• Он также объявляет о планах по внедрению новых возможностей искусственного интеллекта в свои продукты, такие как поиск и фотографии.


01:21:35 Мультимодальность и контекстное окно


• Gemini 1.5 Pro с расширенным контекстным окном позволяет задавать вопросы и получать ответы на основе различных типов входных данных, включая фотографии, текст, аудиозаписи и видео.

• Gemini 1.5 Pro также может обрабатывать большие объемы данных, такие как сотни страниц текста или часы аудиозаписей.


01:27:53 Использование Gemini в Google Workspace


• Gemini 1.5 Pro доступна в Google Workspace для разработчиков и потребителей.

• Gemini может помочь родителям быть в курсе событий в школе своего ребенка, обобщая последние электронные письма и анализируя вложения.

• Gemini также может создавать учебные пособия, часто задаваемые вопросы и тесты на основе материалов, предоставленных пользователем.


01:32:29 Мультимодальность и искусственный интеллект


• Видео демонстрирует возможности мультимодальности и искусственного интеллекта, включая использование агентов с искусственным интеллектом для выполнения различных задач.

• Приводится пример использования агентов для покупок, возврата обуви, подготовки к мероприятиям и обновления информации на веб-сайтах.


01:39:05 Проект Astra и новые достижения


• Проект Astra представляет собой универсальный агент с искусственным интеллектом, способный понимать и реагировать на мультимодальную информацию.

• Представлены новые достижения в области поддержки искусственного интеллекта, включая улучшение звучания агентов и их способности к контекстуальному пониманию.


01:43:15 Будущее искусственного интеллекта


• В будущем ожидается появление новых форм-факторов искусственного интеллекта, таких как очки, и его использование в различных продуктах Google, включая приложение Gemini.


01:44:31 Создание изображений с помощью искусственного интеллекта


• Google представляет новую модель Imagine Three для создания изображений с более высоким качеством и детализацией.

• Модель понимает подсказки, написанные людьми, и может включать мелкие детали, такие как полевые цветы или маленькая синяя птичка.


01:46:43 Генеративная музыка


• Google работает с музыкантами, авторами песен и продюсерами для создания новых инструментальных разделов, переноса стилей между треками и других творческих возможностей.

• Инструменты искусственного интеллекта ускоряют процесс извлечения идей из головы и позволяют достичь скорости света в творческом процессе.


01:48:51 Видео в родительном падеже


• Google DeepMind обучает модель видео в родительном падеже Voo, которая создает высококачественные видеоролики на основе текстовых, графических и видео-подсказок.

• Модель может передавать детали инструкций в различных визуальных и кинематографических стилях, позволяя пользователям создавать более длинные сцены и редактировать видео с помощью дополнительных подсказок.


01:53:47 Графические процессоры и облачные вычисления


• Google предлагает графические процессоры Blackwell от Nvidia для облачных клиентов, а также центральные и графические процессоры для поддержки любых рабочих нагрузок.

• Компания также предлагает гиперкомпьютеры с искусственным интеллектом, которые объединяют аппаратное обеспечение, программное обеспечение и модели потребления для решения сложных задач.


01:56:15 Обзор искусственного интеллекта


• Google Search предлагает новые возможности для поиска, используя искусственный интеллект и информацию в режиме реального времени.

• Обзоры искусственного интеллекта будут доступны для всех пользователей Google Search в США с сегодняшнего дня.


02:01:16 Планирование и мозговой штурм


• Google Search помогает планировать поездки, питание и другие мероприятия, используя многоступенчатое обоснование и информацию в режиме реального времени.

• Поиск может помочь с мозговым штурмом, предоставляя идеи и информацию на основе контекста.


02:05:23 Поиск с помощью видео


• В будущем пользователи смогут задавать вопросы с помощью видео в Google Search.

• Демонстрация показывает, как поиск может помочь с ремонтом проигрывателя грампластинок, используя видео и искусственный интеллект.


02:08:23 Использование Gemini для организации рабочего пространства


• Персонаж видео использует Gemini для организации своего рабочего пространства, справляясь с различными задачами и проблемами.

• Gemini помогает персонажу справиться с различными задачами, такими как организация рабочего пространства и управление проектами.


02:10:44 Использование Gemini в Gmail


• Gemini для Workspace становится еще более полезным для бизнеса и потребителей, с новыми возможностями, такими как боковая панель с питанием от Gemini.

• Gemini для Workspace помогает повысить производительность службы поддержки клиентов на 30%.


02:15:19 Использование Gemini для автоматизации процессов


• Gemini предлагает возможность автоматизировать процессы, такие как создание папок на диске и извлечение информации из электронных писем.

• Gemini может помочь в создании сложных электронных таблиц и анализе данных.

• Gemini также может помочь в планировании и управлении проектами, используя информацию из Gmail.


02:17:42 Возможности Workspace


• В сентябре пользователи Workspace получат возможность упорядочивать вложения, управлять дисками и создавать таблицы для анализа данных.

• Workspace продолжает открывать новые способы выполнения задач, включая автоматизацию и использование искусственного интеллекта.


02:19:28 Виртуальные партнеры по команде


• Виртуальные партнеры по команде настраиваются предприятиями для помощи в выполнении задач.

• Чип, виртуальный партнер по команде, может отслеживать проекты, мониторить и отслеживать их, а также создавать коллективную память о совместной работе.


02:23:05 Приложение Gemini


• Gemini предоставляет доступ к новейшим моделям искусственного интеллекта Google, включая возможность вести углубленную беседу с использованием голоса.

• В приложении Gemini можно настроить "драгоценные камни" - персональных экспертов по любой теме.

• Gemini становится на шаг ближе к тому, чтобы стать настоящим помощником искусственного интеллекта, планируя и предпринимая действия за пользователя.


02:28:56 Возможности искусственного интеллекта


• Чат-бот Gemini Advanced позволяет обрабатывать большие объемы информации, включая PDF-файлы, электронные таблицы и аудиозаписи.

• Gemini Advanced может анализировать данные и предоставлять советы по работе над диссертацией, а также анализировать доходы и расходы.


02:34:01 Использование искусственного интеллекта на Android


• Circle to Search - поиск на базе искусственного интеллекта, доступный на Android.

• Gemini - помощник с искусственным интеллектом на Android, который помогает в учебе и работе.

• Gemini учитывает контекст работы и предлагает полезные предложения в зависимости от ситуации.


02:40:47 Улучшение работы смартфонов с помощью искусственного интеллекта


• Android становится первой мобильной операционной системой с встроенной моделью искусственного интеллекта.

• Gemini Nano улучшает работу смартфонов, обеспечивая более полное и ясное описание мира для пользователей.

• Gemina Nano помогает защитить пользователей от мошенничества, предупреждая о подозрительных звонках и переводах денег.


02:45:44 Использование искусственного интеллекта для разработчиков


• Gemina 1.5 Pro и 1.5 Flash доступны для разработчиков, с возможностью выбора между мультимодальными и одномодальными моделями.

• Gemma - семейство открытых моделей, которые стимулируют инновации и ответственность в области искусственного интеллекта.

• Gemma 2 - следующая генерация Gemma, которая появится в продаже в июне.


02:53:09 Использование искусственного интеллекта для обучения


• В Индии существует огромное разнообразие языков, и технологии должны адаптироваться к таким условиям.

• Gemma - мощный токенизатор, который позволяет моделям использовать сотни тысяч слов и символов в разных алфавитах и языковых системах.

• Navarasa - усовершенствованная модель, основанная на Gemma от Google, которая обучена индийским языкам и помогает людям говорить на своем родном языке и получать ответы на нем.


02:55:51 Ответственное построение искусственного интеллекта


• Google совершенствует свои модели защиты от неправильного использования, используя методы тестирования безопасности и отзывы экспертов.

• Компания также разрабатывает новые инструменты для предотвращения неправильного использования своих моделей, такие как Imagine Three и Vo.

• В будущем планируется открыть доступ к текстовым водяным знакам Synth ID с открытым исходным кодом.


03:00:28 Применение искусственного интеллекта для обучения


• Генеративный искусственный интеллект открывает новые возможности для обучения, позволяя задавать вопросы и получать советы по любой теме.

• В приложении Gemini уже доступны пользовательские версии Gemma, которые могут выступать в качестве персональных экспертов-ассистентов по любой теме.

• На YouTube используется Learner для создания интерактивных обучающих видеороликов, позволяющих задавать уточняющие вопросы и проходить тесты.

• Google сотрудничает с экспертами и учреждениями для тестирования и улучшения новых возможностей в своих моделях обучения.


03:04:52 Рекордное количество упоминаний искусственного интеллекта


• В видео упоминается рекордное количество упоминаний слова "искусственный интеллект" за один день.

• Это отражает прогресс в области искусственного интеллекта и лидерство компании в этой области.


03:05:52 Благодарность сообществу разработчиков


• Компания благодарит сообщество разработчиков за их вклад в развитие искусственного интеллекта.

• Они подчеркивают важность опыта и инноваций, которые создают разработчики каждый день.


03:06:07 Представление Джемини


• Джемини, представитель компании, представляет себя и говорит о том, что они создают новую эру.

• Они объединяют различные инструменты и возможности для создания мощной комбинации.

 

Дендроиды. Миджорни


 

Известные Миньоны. Миджорни


 
Да, GPT-4 Omni действительно представляет собой значительный прогресс в развитии искусственного интеллекта. Его способность понимать и генерировать текст на различных языках, включая русский, открывает новые возможности для коммуникации и работы с данными. Я тоже заценил видео Мэтта) Не терпится услышать новости с презентации Google - кто знает, какие еще удивительные разработки мы увидим...
 
WhitneyJoyce #:
Не терпится услышать новости с презентации Google - кто знает, какие еще удивительные разработки мы увидим...

Выше уже писал.


Вот кратко:

Gemma, семейство моделей с открытым кодом, основанных на технологиях Gemini, пополнили новые приложения: CodeGemma (для помощи при написании кода), Recurrent Gemma (для оптимизации использования памяти) и PaliGemma (для мультимодальных задач, объединяющих язык и изображения). Кроме того, была анонсирована модель Gemma 2 с 27 миллиардами параметров, в то время как текущие версии имеют 2 и 7 миллиардов параметров.


Также было представлено улучшенное приложение Gemini 1.5 Pro, способное анализировать до 2 миллионов токенов. Мультимодальное приложение Gemini 1.5 Pro будет встроено во все сервисы Google, позволяя модели взаимодействовать с Google Диск, почтой и офисными сервисами.


Кроме того, самая легкая модель от Google, Gemini Nano, будет интегрирована в десктопное приложение Chrome и появится на Android. Эта мультимодальная и автономная модель способна работать с различными типами информации даже без интернета.


Модель Veo от Google представляет собой инструмент, способный создавать видеоклипы разрешением 1080p длительностью около минуты на основе текстового описания. Veo может передавать различные визуальные и кинематографические стили, а также редактировать уже сгенерированные кадры.


Imagen 3 - новая версия модели генерации изображений от Google, которая лучше понимает текстовые запросы и обрабатывает текст, генерируя более креативные и детализированные изображения.


Проект Astra - AI-ассистент, способный быстро отвечать на вопросы пользователя о содержании видео, которое записывается в режиме реального времени с телефона или умных очков.


Наконец, Music AI Sandbox - инструмент искусственного интеллекта для работы с музыкой.

 

В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.


 

Кибер Скелет. Миджорни


 
WhitneyJoyce #:
Да, GPT-4 Omni действительно представляет собой значительный прогресс в развитии искусственного интеллекта. Его способность понимать и генерировать текст на различных языках, включая русский, открывает новые возможности для коммуникации и работы с данными...
Едва ли. Пользовался Pai несколько недель. Там такие же фичи с голосом уже несколько месяцев (только без "мультимодальности"). Правда с этой штукой разрабы пошли еще дальше, расширяя диапазон подражания человеческому стилю общения. И что? 

Я "общался" с Pai и тоже поражался ее возможностям. Потом тупо надоело. Бросил и забыл. В какой то момент начинаешь понимать что просто теряешь время в бесполезной болтовне. Она соглашается с тобой, говорит очень правильно, умно. А новизмы мыслей нет. Все вторично, пресно и банально. Ничего нового не скажет, ничего нестандартного, оригинального, непредсказуемого. Я осознал, что при всей широте энциклопедических знаний, этот ИИ не способен принести в разговор ничего, что было бы расценено мною как ценность.  

Поэтому бросил и забыл.
 
Кстати, для примера. В своем видео Мэтт говорит о фильме "Her"  и о том, что скоро начнут использовать Омни в качестве виртуальной подружки. Мол, она настолько хороша в подражании и имитации...

 Это ж сплошной вред для мужского населения...

P.S. Да поможет всем страждущим Bobby Rio....)))

 
Vitaliy Kuznetsov #:

В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.


Что у них там за "Санта Барбара" в OpenAI? Помниться после предыдущего скандала, Альтмана собирались то ли уволить с должности СЕО, то ли убрать из совета директоров. Теперь вот, Илья уходит, хотя в прошлый раз, вроде, уже уходил. Прикольно наблюдать за их кухней.)

Илья очень крутой специалист. Кажется он правильно применил тот большой ящик, который ему Хуанг с Альтманом приволокли. Теперь вот, все восхищаются Omni. Илья очень крут. Правда. Это не какой то там пиарщик-популяризатор Маск. Серьезный чел. Интересно, а прощальный пост Илье, Сэм написал? Или GPT-4? Теперь такие вопросы будут незримо витать над всем соц.сетями. За что боролись...
Причина обращения: