Об этом же в других СМИ

habr.com / 1 год назад

Netflix дебютирует со своим генеративным поисковым инструментом на базе ИИ

habr.com / 1 год назад

Новый инструмент на основе ИИ для биологических исследований

habr.com / 1 год назад

Большие языковые модели в медицине: результаты исследования Оксфорда

habr.com / 1 год назад

Meta* и её стратегия в сфере ИИ: вызов OpenAI и продвижение открытых моделей

habr.com / 1 год назад

Moonshot AI представляет Kimi-VL: мощную модель ИИ для обработки текста, изображений и видео

Больше по теме

25.04.2025 - 05:49 / habr.com

Модель ИИ VACE от Alibaba стремится стать универсальным инструментом для работы с видео

Учёные из Alibaba Group представили VACE — модель ИИ общего назначения, предназначенную для решения широкого спектра задач по созданию и редактированию видео в рамках единой системы.

Основой модели является усовершенствованная архитектура диффузионного трансформера, но главное здесь — новый формат входных данных: «Блок обработки видео» (VCU). VCU — это ответ Alibaba на извечную проблему, связанную с мультимодальными входными данными: он принимает всё — от текстовых подсказок до последовательностей эталонных изображений или видео, а также пространственных масок — и преобразует их в единое представление. Команда разработала специальные механизмы, чтобы эти разрозненные входные данные работали вместе, а не конфликтовали друг с другом.

Процесс начинается с масок, разделяющих изображение на «реактивные» области — цели для модификации — и «неактивные» зоны, которые остаются нетронутыми. Вся эта визуальная информация встраивается в общее пространство признаков и объединяется с соответствующим текстовым вводом.

Чтобы сгенерированное видео оставалось последовательным от кадра к кадру, VACE сопоставляет эти характеристики с латентным пространством, созданным в соответствии со структурой диффузионного преобразователя. Слои, встраивающие время, гарантируют, что понимание моделью последовательности не нарушается при переходе от одного кадра к другому. Механизм внимания объединяет характеристики из разных модальностей и временных отрезков, чтобы система могла обрабатывать всё как единое целое — независимо от того, создаётся ли новый видеоконтент или редактируются существующие кадры.

Набор инструментов VACE охватывает четыре основные задачи: создание видео на основе текстовых подсказок, синтез новых кадров на основе эталонных изображений

общество интересное google ByteDance mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Языковые модели ИИ тестируют на способность рассуждать в игре «Phoenix Wright: Ace Attorney» habr.com / 1 год назад

Новые модели Baidu Ernie конкурируют с Deepseek и OpenAI по сверхнизким ценам habr.com / 1 год назад

Adobe выпускает новые модели создания изображений Firefly и обновлённое веб-приложение Firefly habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 19:18

люди работа общество самит астрология Идеальные коллеги: какие знаки Зодиака лучше всего работают вместе

Совместимость важна не только в любви, но и работе, говорят астрологи.

14.07 / 19:18

люди здоровье общество модель Эксперт Стоит ли израильтянам повторять за Хейли Бибер – мнение дерматолога

Израильский дерматолог оценила популярные домашние рецепты красоты. Многие модные лайфхаки из интернета вредят здоровью кожи.

14.07 / 19:18

история общество курьез интересное дети и родители 843 языка в одной стране – разбор удивительного феномена

Ученые объясняют культурное богатство сложным горным рельефом местности. Изоляция общин помогла сберечь редкие наречия от вымирания.

14.07 / 19:14

доллар Casio выпустила новые часы Baby-G BG169CMB-8 с камуфляжным дизайном и защитой до 200 метров

В основе BG169CMB-8 лежит уже знакомый корпус BG-169 с круглой формой, изготовленный из полимерного материала. Дополнительную защиту обеспечивают металлические элементы вокруг циферблата.

14.07 / 19:14

связь Samsung технологии общество расследование Владельцы Samsung Galaxy S26 Ultra пожаловались на красное пятно в центре экрана

Samsung уже подтвердила, что знает о поступающих обращениях и проводит внутреннее расследование, чтобы установить причину возникновения дефекта.

14.07 / 18:38

люди ученые животные общество климат Пять коров 130 лет жили без людей — ученые были удивлены итогом

Животные не только выжили в полной изоляции, но и создали популяцию, численность которой достигла примерно двух тысяч особей.

14.07 / 18:07

здоровье семья женщина Здоровье и красота Эксперт Табу в косметологии – семь процедур, которые стоит отложить до осени

Чтобы сохранить здоровье кожи и избежать нежелательной пигментации, эксперты настоятельно рекомендуют отложить процедуры на осенне-зимний период.

14.07 / 18:07

здоровье общество интересное астрология Дом и интерьер Гороскоп на середину июля 2026 года для всех знаков Зодиака

Середина июля 2026 года станет периодом, когда многим захочется перейти от размышлений к более конкретным решениям.

14.07 / 17:58

происшествия самит Github скрыл форк zapret разработчика Flowseal

10 июля 2026 года репозиторий zapret-discord-youtube и аккаунт разработчика Flowseal на GitHub стали недоступны — страницы отдают ошибку 404. Вместе с основным проектом пропал доступ и ко всем остальным репозиториям, привязанным к этому аккаунту (в том числе tg-ws-proxy - прокси для Telegram).

14.07 / 17:57

Huawei самит AirPods мода и стиль Huawei представила FreeClip 2 S — элегантные наушники открытого типа с измененным зарядным кейсом и отличным звучанием

В дополнение к фотофлагманам Pura 90s Pro и Pura 90s Pro Max Huawei выпустила на глобальный рынок FreeClip 2S — продолжение своей знаковой линейки беспроводных наушников открытого типа. Новинка базируется на выпущенной в Китае в 2025 году модели FreeClip 2, но предлагает обновленный дизайн и измененный зарядный футляр.

Лента новостей

На главную страницу