




Одно изображение — и вы в игре: Tencent представила Hunyuan GameCraft
Компания Tencent представила релиз Hunyuan GameCraft — ИИ‑системы, способной оживлять отдельные картинки, превращая их в интерактивное видео.
В отличие от привычных видеогенераторов, создающих лишь готовый отрезок ролика, GameCraft позволяет зрителю самому управлять камерой в реальном времени с помощью клавиш WASD или стрелок, свободно перемещаясь по созданным сценам. В основе системы лежит открытая модель Tencent для генерации видео по тексту — HunyuanVideo. По словам разработчиков, технология обеспечивает исключительно плавное и стабильное движение камеры.
Система поддерживает три оси перемещения — вперёд/назад, влево/вправо и вверх/вниз, а также две оси вращения для обзора по сторонам. Функция наклона камеры исключена: в Tencent отмечают, что в большинстве игр это редкость. Специальный «кодировщик действий» переводит сигналы с клавиатуры в числовые команды, которые понимает видеогенератор. При этом учитывается и скорость: чем дольше удерживается клавиша, тем стремительнее движение.
Чтобы сохранить высокое качество изображения даже в затяжных эпизодах, GameCraft применяет метод под названием гибридное обучение с опорой на историю (hybrid history‑conditioned training). Вместо того чтобы рождать весь ролик целиком, модель создаёт его постепенно, опираясь на уже сгенерированные куски. Видео делится на сегменты примерно по 1,3 с. Бинарная маска указывает системе, какие части кадра уже готовы, а какие нужно дорисовать, — благодаря этому результат остаётся и последовательным, и гибким.
По наблюдениям Tencent, методы без обучения приводят к резкому падению качества картинки, а опора исключительно на историю снижает отзывчивость. Гибридный подход сочетает оба способа и позволяет получать плавные, устойчивые видео, которые в то же
Читать на habr.com