Google I/O 2024: «новая эра» Gemini
В амфитеатре Шортлайн в Маунтин-Вью состоялась конференция Google I/O 2024. Основное внимание направлено на модель Gemini и новые ИИ-функции практически во всех продуктах. Компания показала ИИ-помощника Project Astra, генератор видео Veo и новые возможности Gemini на Android.
Мероприятие открылось с доклада главы компании Сундара Пичаи, который рассказал о Gemini 1.5 Pro:
1 млн+ регистраций Gemini Advanced «всего за 3 месяца»;
все пользовательские продукты Google используют Gemini;
более 1,5 млн разработчиков используют Gemini;
понимает и генерирует все типы информации;
с сегодняшнего дня Gemini 1.5 Pro встроена в Gmail, Гугл Фото и Google Meet. В Гугл Фото модель поможет найти фото по голосовым командам: с ней можно будет общаться, как с человеком (например, попросить все фото на определённую тему, и приложение соберёт коллаж). В Google Meet нейросеть покажет лучшие моменты созвонов, а в почте появится умный поиск по письмам.
Место на сцене занял Демис Хассабис.
анонсирована Gemini 1.5 Flash: более лёгкая модель, чем 1.5 Pro. Предназначена для случаев, когда важны низкая задержка и стоимость;
показали прототип Project Astra — обновлённого и улучшенного ИИ-помощника, который способен взаимодействовать с окружающим миром, распознавая объекты и понимая контекстные детали. Он также получил намного более естественную речь, чем у Google Assistant. Astra работает на прототипе умных очков. В короткой демонстрации Project Astra нашёл колонки по запросу «найди то, что воспроизводит звук», и описал, что делает код на экране компьютера.
Даг Эк представил генератор изображений Imagen 3. Новая версия понимает промты, написанные «по-человечески», учитывает и генерирует мелкие детали. Даг обещает, что это лучшая модель для рендеринга текста;
гене
Читать на habr.com
