Об этом же в других СМИ

habr.com / 5 месяцев назад

Google и Apple рекомендовали иностранным сотрудникам не покидать США из-за увеличения сроков обработки виз

habr.com / 5 месяцев назад

Microsoft обновила 3D‑модель TRELLIS и открыла мощный генератор 3D‑моделей из изображений

habr.com / 6 месяцев назад

Компанию Vizio могут обязать предоставить исходный код ПО SmartCast для ТВ

gagadget.com / 6 месяцев назад

Meta разрабатывает новые модели для генерации изображений, видео и текста

habr.com / 6 месяцев назад

YouTube начнет тестировать публикации Shorts в формате изображений и ИИ-аватары авторов контента

Больше по теме

04.12.2025 - 09:44 / habr.com

Video O1 от Kling AI обходит Veo 3.1 в обработке исходных изображений

Китайская компания Kling AI представила свою новую разработку — Video O1. По словам создателей, это «первая в мире единая мультимодальная видеомодель», способная работать и как генератор, и как редактор видео в одном гибком контуре.

По утверждению Kling AI, Video O1 объединила в себе целый набор задач, для которых раньше приходилось держать под рукой разные инструменты. Модель умеет создавать ролики длительностью от 3 до 10 секунд — по текстовому описанию или по набору референсных изображений. Но этим дело не ограничивается: она столь же легко берётся за уже готовый материал — меняет героя, подстраивает погоду, корректирует стилистику или цветовую гамму. И всё это — по одному запросу, позволяющему одновременно добавить персонажа, перестроить фон и накрутить нужный визуальный стиль.

Модель способна параллельно интерпретировать до семи входов — изображения, фрагменты видео, описания персонажей и обычный текст. Пользователь может менять содержимое ролика простыми командами вроде «Убери прохожих» или «Замени дневной свет на сумерки» — никаких масок, подслоёв и ключевых кадров вручную.

Можно загрузить и собственных персонажей, и реквизит, и целые сцены — система использует их в разных условиях, подстраивая под контекст. В качестве ориентиров модель принимает даже действия или движения камеры. В Kling утверждают, что Video O1 хорошо понимает входные данные и умеет сохранять целостность объекта — будь то человек или предмет — даже при смене ракурсов или обстановки.

В основе Video O1 лежит мультимодальная архитектура‑трансформер, хотя подробностями разработчики делиться не торопятся. Компания представила собственный «Multimodal Visual Language» (MVL) — мультимодальный визуальный язык, который служит своеобразным мостом между текстом

погода общество семья самит google Nano dmitrifriend Китай

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Black Forest Labs представила FLUX.2 max, флагман для кинематографической генерации изображений habr.com / 6 месяцев назад

OpenAI выпустила генератор изображений GPT Image 1.5 — бесплатно и лучше Nano Banana Pro habr.com / 6 месяцев назад

OpenAI обновила модель для генерации и редактирования изображений: GPT Image 1.5 habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.06 / 22:30

происшествия люди животные история общество Охота на гигантов – как древние люди делили туши слонов с медведями

Особый состав болотистой почвы помог спасти органический материал от естественного разрушения. Уникальные образцы пролежали в земле тысячи веков.

21.06 / 22:16

доллар Casio выпустила в США новую серию G-Shock Bold Camo: четыре модели с камуфляжным дизайном

В качестве бонуса покупатели новых часов получают фирменный камуфляжный чехол, который Casio временно дарит при покупке любой модели из серии.

21.06 / 20:30

СМИ самит Take-Two Базовая версия GTA VI может обойтись в €90 — онлайн-магазин раскрыл цену трех изданий мега-ожидаемой игры

Возможно, геймеры получили ответ на один из самых волнительных вопросов последних лет — сколько будет стоить GTA VI.

21.06 / 20:15

технологии Apple прогноз журналист планшеты Apple готовит крупное обновление устройств до 2027 года: что ожидать

В своей рассылке Power On журналист Bloomberg Марк Гурман перечислил около 20 устройств, которые компания может выпустить до конца 2026 и в 2027 году. По его данным, часть проектов была отложена до завершения разработки новой версии Siri, которая недавно добралась до бета-тестирования — спустя два года после анонса на WWDC 2024.

21.06 / 20:13

люди здоровье общество Здоровье и красота лечение Как побороть храп в домашних условиях и без таблеток

Храп не только мешает выспаться, но и вредит вашему здоровью, предупреждают врачи.

21.06 / 20:13

люди ученые здоровье общество жизнь Почему спать голышом полезно для здоровья и психики

Отказ от домашней одежды на время ночного отдыха помогает нормализовать уровень гормона стресса, защищает от проблем кожи и укрепляет отношения.

21.06 / 19:54

прогноз самит reddit смарт-часы Психология и отношения Владельцы Garmin спорят о точности функции Race Time Prediction: прогнозы часов вызвали дискуссию

Владельцы смарт-часов Garmin активно обсуждают точность функции Race Time Prediction, которая прогнозирует результат спортсмена на различных дистанциях. Дискуссия развернулась после того, как один из пользователей заявил, что устройство существенно переоценило его возможности.

21.06 / 19:54

экономика СМИ деньги самит мода и стиль Chery Tiggo 7 HEV: гибрид для тех, кто не любит розетки

Китайский автопром продолжает свою экспансию, заполняя каждую возможную нишу между бензиновыми двигателями и полными электрокарами. На этот раз в объективы шпионов попал Chery Tiggo 7 в версии саморазрядного гибрида (HEV). Устройство заметили в Китае, но англоязычные шильдики и специфичный интерьер прямо намекают: модель готовят на экспорт.

21.06 / 19:44

технологии intel AMD мода и стиль Discover Релиз KDE Plasma 6.7

16 июня 2026 года состоялся релиз среды рабочего стола KDE Plasma 6.7. Предыдущая стабильная версия проекта вышла четыре месяца назад.

21.06 / 19:44

технологии политика Microsoft представила тестовую сборку Windows 11 с новым процессом обновления системы

Microsoft выпустила сборку Windows 11 Insider Preview Build 26300.8687, внедрив ряд улучшений, включая единый процесс обновления. Он призван сократить количество необходимых перезагрузок каждый месяц.

Лента новостей

На главную страницу