




Реальность покажется скучной: Google представила Gemini Omni — нейросеть, которая симулирует мир
На конференции Google I/O 2026 состоялся один из самых громких анонсов года в сфере искусственного интеллекта. Глава Google DeepMind Демис Хассабис (Demis Hassabis) представил Gemini Omni — принципиально новую мультимодальную модель, которая способна превращать абсолютно любой входящий формат данных в кинематографичное видео высокого качества.
По словам Сундара Пичаи (Sundar Pichai), если раньше AI просто предсказывал текст, то с приходом Gemini Omni индустрия переходит к "симуляции реальности" благодаря продвинутому пониманию физики, истории и контекста нашего мира.
Главная фишка Gemini Omni — концепция "любой input на входе — видео на выходе". Нейросеть объединила в себе интеллект текстовых моделей Gemini с лучшими наработками Google в генерации медиа (включая видеогенератор Veo и игровую нейросеть Genie).
Пользователь может загрузить в Omni одновременно несколько картинок из галереи, добавить аудиозапись, текстовый промт, существующий видеоролик — и нейросеть соберет из этого совершенно новый, реалистичный клип.
Ключевые возможности новой модели:
Важный аспект безопасности: все видеоролики, созданные с помощью Gemini Omni, будут маркироваться SynthID — невидимыми цифровыми водяными знаками Google. Это поможет верифицировать AI-контент и бороться с дипфейками.
Первая версия модели под названием Gemini Omni Flash начинает разворачиваться уже сейчас.
Она появится непосредственно в приложении Gemini, на YouTube Shorts, а также станет основой для мобильных приложений Google Flow (платформа для создания AI-фильмов) и Flow Music (для работы со звуком). Доступ к новинке первыми получат подписчики платных планов Google AI (Plus, Pro и Ultra).
Источник: Google
Читать на gagadget.com