Midjourney запускает свою первую видеомодель, которая превращает изображения в короткие ролики
После нескольких месяцев спекуляций Midjourney выпустила свою первую видеомодель. Компания называет этот шаг важной вехой на пути к системам искусственного интеллекта, способным моделировать целые 3D-миры в реальном времени.
Новая функция «Изображение в видео» позволяет пользователям превращать любое изображение Midjourney в короткий анимированный клип. Анимация выполняется с помощью новой кнопки «Анимировать» в веб-интерфейсе Midjourney. Пользователи могут выбирать между автоматическим режимом, в котором система определяет движение, и ручным режимом, в котором они сами описывают, как должна разворачиваться анимация.
Есть два основных режима: «Низкое движение» лучше всего подходит для сцен с неподвижной камерой и медленным движением, а «Высокое движение» более агрессивно анимирует как камеру, так и объект съёмки, хотя иногда это может привести к менее точным результатам, как утверждает Midjourney.
Каждое видео можно увеличить примерно на четыре секунды, в общей сложности до четырёх раз. Пользователи также могут изменять исходное изображение при каждом увеличении.
Пользователи также могут анимировать изображения, созданные за пределами Midjourney, перетащив их в панель подсказок и выбрав в качестве «начального кадра». Затем желаемое движение описывается в текстовой подсказке.
Midjourney не публикует официальные спецификации по разрешению, частоте кадров или битрейту, и пока не предусмотрено встроенное масштабирование. Однако загруженные видео представлены в виде файлов MP4 с разрешением 480p и частотой 24 кадра в секунду.
Функция создания видео в настоящее время доступна только через веб-интерфейс. Каждое видео стоит примерно в восемь раз дороже, чем изображение, и генерирует четыре пятисекундных клипа. На практике это примерно
Читать на habr.com