Компания Google представила новую технологию, которая генерирует музыку с помощью искусственного интеллекта - Общее обсуждение

Vitaliy Kuznetsov 2024.05.14 19:16 #5191

Вся презентация Google

Google Keynote (Google I/O ‘24)

51:38 Введение в Google I/O

• Марк Руббиер представляет Google I/O, конференцию, посвященную искусственному интеллекту и музыке.

• Он обсуждает новую технологию, которая генерирует музыку с нуля, используя искусственный интеллект.

52:46 Музыкальные эффекты Google

• Марк демонстрирует, как машина Google может создавать музыку, используя подсказки от пользователя.

• Он также обсуждает, как эта технология может быть использована в других областях, таких как поиск и фотографии.

01:16:27 Будущее искусственного интеллекта

• Марк обсуждает, как Google инвестирует в искусственный интеллект уже более десяти лет и как это помогает разработчикам и стартапам.

• Он также объявляет о планах по внедрению новых возможностей искусственного интеллекта в свои продукты, такие как поиск и фотографии.

01:21:35 Мультимодальность и контекстное окно

• Gemini 1.5 Pro с расширенным контекстным окном позволяет задавать вопросы и получать ответы на основе различных типов входных данных, включая фотографии, текст, аудиозаписи и видео.

• Gemini 1.5 Pro также может обрабатывать большие объемы данных, такие как сотни страниц текста или часы аудиозаписей.

01:27:53 Использование Gemini в Google Workspace

• Gemini 1.5 Pro доступна в Google Workspace для разработчиков и потребителей.

• Gemini может помочь родителям быть в курсе событий в школе своего ребенка, обобщая последние электронные письма и анализируя вложения.

• Gemini также может создавать учебные пособия, часто задаваемые вопросы и тесты на основе материалов, предоставленных пользователем.

01:32:29 Мультимодальность и искусственный интеллект

• Видео демонстрирует возможности мультимодальности и искусственного интеллекта, включая использование агентов с искусственным интеллектом для выполнения различных задач.

• Приводится пример использования агентов для покупок, возврата обуви, подготовки к мероприятиям и обновления информации на веб-сайтах.

01:39:05 Проект Astra и новые достижения

• Проект Astra представляет собой универсальный агент с искусственным интеллектом, способный понимать и реагировать на мультимодальную информацию.

• Представлены новые достижения в области поддержки искусственного интеллекта, включая улучшение звучания агентов и их способности к контекстуальному пониманию.

01:43:15 Будущее искусственного интеллекта

• В будущем ожидается появление новых форм-факторов искусственного интеллекта, таких как очки, и его использование в различных продуктах Google, включая приложение Gemini.

01:44:31 Создание изображений с помощью искусственного интеллекта

• Google представляет новую модель Imagine Three для создания изображений с более высоким качеством и детализацией.

• Модель понимает подсказки, написанные людьми, и может включать мелкие детали, такие как полевые цветы или маленькая синяя птичка.

01:46:43 Генеративная музыка

• Google работает с музыкантами, авторами песен и продюсерами для создания новых инструментальных разделов, переноса стилей между треками и других творческих возможностей.

• Инструменты искусственного интеллекта ускоряют процесс извлечения идей из головы и позволяют достичь скорости света в творческом процессе.

01:48:51 Видео в родительном падеже

• Google DeepMind обучает модель видео в родительном падеже Voo, которая создает высококачественные видеоролики на основе текстовых, графических и видео-подсказок.

• Модель может передавать детали инструкций в различных визуальных и кинематографических стилях, позволяя пользователям создавать более длинные сцены и редактировать видео с помощью дополнительных подсказок.

01:53:47 Графические процессоры и облачные вычисления

• Google предлагает графические процессоры Blackwell от Nvidia для облачных клиентов, а также центральные и графические процессоры для поддержки любых рабочих нагрузок.

• Компания также предлагает гиперкомпьютеры с искусственным интеллектом, которые объединяют аппаратное обеспечение, программное обеспечение и модели потребления для решения сложных задач.

01:56:15 Обзор искусственного интеллекта

• Google Search предлагает новые возможности для поиска, используя искусственный интеллект и информацию в режиме реального времени.

• Обзоры искусственного интеллекта будут доступны для всех пользователей Google Search в США с сегодняшнего дня.

02:01:16 Планирование и мозговой штурм

• Google Search помогает планировать поездки, питание и другие мероприятия, используя многоступенчатое обоснование и информацию в режиме реального времени.

• Поиск может помочь с мозговым штурмом, предоставляя идеи и информацию на основе контекста.

02:05:23 Поиск с помощью видео

• В будущем пользователи смогут задавать вопросы с помощью видео в Google Search.

• Демонстрация показывает, как поиск может помочь с ремонтом проигрывателя грампластинок, используя видео и искусственный интеллект.

02:08:23 Использование Gemini для организации рабочего пространства

• Персонаж видео использует Gemini для организации своего рабочего пространства, справляясь с различными задачами и проблемами.

• Gemini помогает персонажу справиться с различными задачами, такими как организация рабочего пространства и управление проектами.

02:10:44 Использование Gemini в Gmail

• Gemini для Workspace становится еще более полезным для бизнеса и потребителей, с новыми возможностями, такими как боковая панель с питанием от Gemini.

• Gemini для Workspace помогает повысить производительность службы поддержки клиентов на 30%.

02:15:19 Использование Gemini для автоматизации процессов

• Gemini предлагает возможность автоматизировать процессы, такие как создание папок на диске и извлечение информации из электронных писем.

• Gemini может помочь в создании сложных электронных таблиц и анализе данных.

• Gemini также может помочь в планировании и управлении проектами, используя информацию из Gmail.

02:17:42 Возможности Workspace

• В сентябре пользователи Workspace получат возможность упорядочивать вложения, управлять дисками и создавать таблицы для анализа данных.

• Workspace продолжает открывать новые способы выполнения задач, включая автоматизацию и использование искусственного интеллекта.

02:19:28 Виртуальные партнеры по команде

• Виртуальные партнеры по команде настраиваются предприятиями для помощи в выполнении задач.

• Чип, виртуальный партнер по команде, может отслеживать проекты, мониторить и отслеживать их, а также создавать коллективную память о совместной работе.

02:23:05 Приложение Gemini

• Gemini предоставляет доступ к новейшим моделям искусственного интеллекта Google, включая возможность вести углубленную беседу с использованием голоса.

• В приложении Gemini можно настроить "драгоценные камни" - персональных экспертов по любой теме.

• Gemini становится на шаг ближе к тому, чтобы стать настоящим помощником искусственного интеллекта, планируя и предпринимая действия за пользователя.

02:28:56 Возможности искусственного интеллекта

• Чат-бот Gemini Advanced позволяет обрабатывать большие объемы информации, включая PDF-файлы, электронные таблицы и аудиозаписи.

• Gemini Advanced может анализировать данные и предоставлять советы по работе над диссертацией, а также анализировать доходы и расходы.

02:34:01 Использование искусственного интеллекта на Android

• Circle to Search - поиск на базе искусственного интеллекта, доступный на Android.

• Gemini - помощник с искусственным интеллектом на Android, который помогает в учебе и работе.

• Gemini учитывает контекст работы и предлагает полезные предложения в зависимости от ситуации.

02:40:47 Улучшение работы смартфонов с помощью искусственного интеллекта

• Android становится первой мобильной операционной системой с встроенной моделью искусственного интеллекта.

• Gemini Nano улучшает работу смартфонов, обеспечивая более полное и ясное описание мира для пользователей.

• Gemina Nano помогает защитить пользователей от мошенничества, предупреждая о подозрительных звонках и переводах денег.

02:45:44 Использование искусственного интеллекта для разработчиков

• Gemina 1.5 Pro и 1.5 Flash доступны для разработчиков, с возможностью выбора между мультимодальными и одномодальными моделями.

• Gemma - семейство открытых моделей, которые стимулируют инновации и ответственность в области искусственного интеллекта.

• Gemma 2 - следующая генерация Gemma, которая появится в продаже в июне.

02:53:09 Использование искусственного интеллекта для обучения

• В Индии существует огромное разнообразие языков, и технологии должны адаптироваться к таким условиям.

• Gemma - мощный токенизатор, который позволяет моделям использовать сотни тысяч слов и символов в разных алфавитах и языковых системах.

• Navarasa - усовершенствованная модель, основанная на Gemma от Google, которая обучена индийским языкам и помогает людям говорить на своем родном языке и получать ответы на нем.

02:55:51 Ответственное построение искусственного интеллекта

• Google совершенствует свои модели защиты от неправильного использования, используя методы тестирования безопасности и отзывы экспертов.

• Компания также разрабатывает новые инструменты для предотвращения неправильного использования своих моделей, такие как Imagine Three и Vo.

• В будущем планируется открыть доступ к текстовым водяным знакам Synth ID с открытым исходным кодом.

03:00:28 Применение искусственного интеллекта для обучения

• Генеративный искусственный интеллект открывает новые возможности для обучения, позволяя задавать вопросы и получать советы по любой теме.

• В приложении Gemini уже доступны пользовательские версии Gemma, которые могут выступать в качестве персональных экспертов-ассистентов по любой теме.

• На YouTube используется Learner для создания интерактивных обучающих видеороликов, позволяющих задавать уточняющие вопросы и проходить тесты.

• Google сотрудничает с экспертами и учреждениями для тестирования и улучшения новых возможностей в своих моделях обучения.

03:04:52 Рекордное количество упоминаний искусственного интеллекта

• В видео упоминается рекордное количество упоминаний слова "искусственный интеллект" за один день.

• Это отражает прогресс в области искусственного интеллекта и лидерство компании в этой области.

03:05:52 Благодарность сообществу разработчиков

• Компания благодарит сообщество разработчиков за их вклад в развитие искусственного интеллекта.

• Они подчеркивают важность опыта и инноваций, которые создают разработчики каждый день.

03:06:07 Представление Джемини

• Джемини, представитель компании, представляет себя и говорит о том, что они создают новую эру.

• Они объединяют различные инструменты и возможности для создания мощной комбинации.

Машинное обучение и нейронные Изучаем ONNX для применения AI 2023. Встречайте ChatGPT.

Vitaliy Kuznetsov 2024.05.14 19:21 #5192

Дендроиды. Миджорни

Vitaliy Kuznetsov 2024.05.14 19:21 #5193

Известные Миньоны. Миджорни

[Удален] 2024.05.14 23:35 #5194

Да, GPT-4 Omni действительно представляет собой значительный прогресс в развитии искусственного интеллекта. Его способность понимать и генерировать текст на различных языках, включая русский, открывает новые возможности для коммуникации и работы с данными. Я тоже заценил видео Мэтта) Не терпится услышать новости с презентации Google - кто знает, какие еще удивительные разработки мы увидим...

Машинное обучение и нейронные AI 2023. Встречайте ChatGPT. Группа пользователей MetaTrader 5

Vitaliy Kuznetsov 2024.05.15 10:12 #5195

WhitneyJoyce #:
Не терпится услышать новости с презентации Google - кто знает, какие еще удивительные разработки мы увидим...

Выше уже писал.

Вот кратко:

Gemma, семейство моделей с открытым кодом, основанных на технологиях Gemini, пополнили новые приложения: CodeGemma (для помощи при написании кода), Recurrent Gemma (для оптимизации использования памяти) и PaliGemma (для мультимодальных задач, объединяющих язык и изображения). Кроме того, была анонсирована модель Gemma 2 с 27 миллиардами параметров, в то время как текущие версии имеют 2 и 7 миллиардов параметров.

Также было представлено улучшенное приложение Gemini 1.5 Pro, способное анализировать до 2 миллионов токенов. Мультимодальное приложение Gemini 1.5 Pro будет встроено во все сервисы Google, позволяя модели взаимодействовать с Google Диск, почтой и офисными сервисами.

Кроме того, самая легкая модель от Google, Gemini Nano, будет интегрирована в десктопное приложение Chrome и появится на Android. Эта мультимодальная и автономная модель способна работать с различными типами информации даже без интернета.

Модель Veo от Google представляет собой инструмент, способный создавать видеоклипы разрешением 1080p длительностью около минуты на основе текстового описания. Veo может передавать различные визуальные и кинематографические стили, а также редактировать уже сгенерированные кадры.

Imagen 3 - новая версия модели генерации изображений от Google, которая лучше понимает текстовые запросы и обрабатывает текст, генерируя более креативные и детализированные изображения.

Проект Astra - AI-ассистент, способный быстро отвечать на вопросы пользователя о содержании видео, которое записывается в режиме реального времени с телефона или умных очков.

Наконец, Music AI Sandbox - инструмент искусственного интеллекта для работы с музыкой.

Машинное обучение и нейронные Интересное и Юмор AI 2023. Встречайте ChatGPT.

Vitaliy Kuznetsov 2024.05.15 10:15 #5196

В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.

Vitaliy Kuznetsov 2024.05.15 10:27 #5197

Кибер Скелет. Миджорни

Реter Konow 2024.05.15 13:33 #5198

WhitneyJoyce #:
Да, GPT-4 Omni действительно представляет собой значительный прогресс в развитии искусственного интеллекта. Его способность понимать и генерировать текст на различных языках, включая русский, открывает новые возможности для коммуникации и работы с данными...

Едва ли. Пользовался Pai несколько недель. Там такие же фичи с голосом уже несколько месяцев (только без "мультимодальности"). Правда с этой штукой разрабы пошли еще дальше, расширяя диапазон подражания человеческому стилю общения. И что?

Я "общался" с Pai и тоже поражался ее возможностям. Потом тупо надоело. Бросил и забыл. В какой то момент начинаешь понимать что просто теряешь время в бесполезной болтовне. Она соглашается с тобой, говорит очень правильно, умно. А новизмы мыслей нет. Все вторично, пресно и банально. Ничего нового не скажет, ничего нестандартного, оригинального, непредсказуемого. Я осознал, что при всей широте энциклопедических знаний, этот ИИ не способен принести в разговор ничего, что было бы расценено мною как ценность.

Поэтому бросил и забыл.

Сервис "Сигналы" приходит в Спамеры, спам в личных ilan в 2014 году

Реter Konow 2024.05.15 13:41 #5199

Кстати, для примера. В своем видео Мэтт говорит о фильме "Her" и о том, что скоро начнут использовать Омни в качестве виртуальной подружки. Мол, она настолько хороша в подражании и имитации...

Это ж сплошной вред для мужского населения...

P.S. Да поможет всем страждущим Bobby Rio....)))

Делаем краудсорсовый проект по Интересное и Юмор Обязан ли продавец в

Реter Konow 2024.05.15 17:46 #5200

Vitaliy Kuznetsov #:

В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.

Что у них там за "Санта Барбара" в OpenAI? Помниться после предыдущего скандала, Альтмана собирались то ли уволить с должности СЕО, то ли убрать из совета директоров. Теперь вот, Илья уходит, хотя в прошлый раз, вроде, уже уходил. Прикольно наблюдать за их кухней.)

Илья очень крутой специалист. Кажется он правильно применил тот большой ящик, который ему Хуанг с Альтманом приволокли. Теперь вот, все восхищаются Omni. Илья очень крут. Правда. Это не какой то там пиарщик-популяризатор Маск. Серьезный чел. Интересно, а прощальный пост Илье, Сэм написал? Или GPT-4? Теперь такие вопросы будут незримо витать над всем соц.сетями. За что боролись...

[ВНИМАНИЕ, ТЕМА ЗАКРЫТА!] Любой Ищу трейдеров для управления Лига Торговых Систем. Продолжаем

Midjourney и другие нейросети обработки изображений - страница 520