ИИ-стартап Genmo запускает открытую модель для генерации видео Mochi 1, которая может стать конкурентом Runway
Компания Genmo, специализирующаяся на генеративных видео-технологиях с использованием ИИ, анонсировала выпуск исследовательской версии модели Mochi 1 — открытого программного решения для создания высококачественных видео на основе текстовых запросов. Genmo заявляет, что Mochi 1 по производительности может конкурировать с ведущими моделями, такими как Runway’s Gen-3 Alpha, Luma AI’s Dream Machine, Kuaishou’s Kling, и другими.Основные особенности Mochi 1
Mochi 1 — это первая в своем роде модель с открытым исходным кодом для видео-генерации, доступная под лицензией Apache 2.0, которая предлагает бесплатный доступ к мощным возможностям генерации видео. В то время как конкурирующие решения предлагают платные тарифы, такие как Hailuo Unlimited за $94,99 в месяц, Mochi 1 предоставляет бесплатную альтернативу.
На момент запуска пользователи могут работать с моделью, поддерживающей разрешение 480p, а версия с высоким разрешением, Mochi 1 HD, ожидается позже в этом году. В начальных тестах модель продемонстрировала реалистичные движения и точное следование текстовым инструкциям, особенно при генерации видео с участием людей.
Посмотреть примеры можно в этой статье.
Mochi 1 существенно продвинула технологии генерации видео, предлагая высокую точность передачи движений и четкое соответствие пользовательским запросам. Модель использует новаторскую архитектуру Asymmetric Diffusion Transformer (AsymmDiT) и состоит из 10 миллиардов параметров, что делает её крупнейшей открытой моделью для генерации видео.
В Mochi 1 используются компрессионные алгоритмы, такие как Variational Autoencoder (VAE), что позволяет значительно уменьшить объём видео-данных и облегчить использование модели на пользовательских устройствах. Это делает её доступной для
Читать на habr.com