Компания Runway представила первую общую мировую модель наряду с масштабными обновлениями Gen-4.5
Компания Runway модернизировала модель Gen-4.5 и представила GWM-1, первую в своем роде универсальную мировую модель.
В недавно представленной версии Gen-4.5 теперь есть встроенные функции генерации и редактирования звука, а также многокадровый монтаж, позволяющий пользователям вносить изменения в одну сцену, которые затем распространяются на всё видео.
Новый GWM-1 создает внутреннее представление окружающей среды для моделирования будущих событий в реальном времени. Построенный на архитектуре Gen-4.5, он генерирует видео покадрово, обеспечивая при этом интерактивное управление посредством таких входных данных, как движения камеры, команды робота или звук.
Модель мира поставляется в трех различных версиях: GWM Worlds для создания исследуемых локаций, GWM Avatars для генерации говорящих персонажей с реалистичной мимикой и синхронизацией губ, и GWM Robotics для создания синтетических обучающих данных для роботов. Компания Runway планирует в конечном итоге объединить эти возможности в единую унифицированную модель.
Компания Runway - не единственная, кто стремится внедрить эту технологию. Рынок становится все более конкурентным.
Другие лаборатории, включая Google DeepMind и новый стартап исследователя ИИ Яна Лекуна , также разрабатывают модели окружающего мира. В отрасли эти системы рассматриваются как критически важный шаг вперед по сравнению с традиционными языковыми моделями, которым до сих пор не хватает фундаментального понимания физического мира . Генеральный директор Google DeepMind Демис Хассабис подтвердил , что создание этих моделей является центральным элементом стратегии компании по достижению общего искусственного интеллекта (AGI).
В гонке также участвует World Labs, стартап, основанный Фэй-Фэй Ли, который привлек 230
Читать на habr.com
