Об этом же в других СМИ

habr.com / 1 год назад

Новая модель AI Tencent Hunyuan3D 2.0 превращает 2D-изображения в детализированные 3D-объекты

incrypted.com / 1 год назад

Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek

habr.com / 1 год назад

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

forbes.ua / 1 год назад

Доставщик рекламы. «Новая почта» начала продавать свои площадки под рекламные интеграции. Сколько она будет на этом зарабатывать

chudo.tech / 1 год назад

В Новой Зеландии анонсирован проект Whoosh — транспорт будущего с капсулами

Больше по теме

10.01.2025 - 09:11 / habr.com

Новая AI-модель от ByteDance оживляет статичные изображения с помощью звука

Материнская компания TikTok, ByteDance, разработала систему AI под названием INFP, которая способна заставлять статичные портретные фотографии говорить и реагировать на аудиовход.

Что отличает INFP (Interactive, Natural, Flash and Person-generic) от других, так это его способность создавать реалистичные видео разговоров между двумя людьми без необходимости вручного назначения ролей говорящего и слушающего. Система автоматически определяет эти роли по ходу разговора.

Система работает в два основных этапа. На первом этапе, который ByteDance называет "Motion-Based Head Imitation" (Имитация движений головы на основе движения), AI учится учитывать все мелкие детали того, как люди общаются — такие как мимика и движение головы во время разговоров. Он берет эти движения из видео и превращает их в данные, которые можно использовать позже. Эти данные о движении затем могут анимировать статическое фото, соответствуя движениям исходного человека.

На втором этапе, "audio-guided motion generation" (генерация движения с управлением по звуку), система определяет, как сопоставлять звуки с естественными движениями. Команда разработала то, что они называют "motion guider" (руководитель движения), который создает паттерны как для говорения, так и для слушания, анализируя аудио с обеих сторон разговора. Затем специальный компонент AI, называемый диффузионным трансформером, постепенно уточняет эти паттерны до плавных, реалистичных движений, соответствующих аудио.

Чтобы правильно обучить свою систему, команде пришлось создать нечто новое: коллекцию реальных разговоров, которую они назвали DyConv. Они собрали более 200 часов разговоров людей из видео в интернете.

Хотя существуют и другие базы данных разговоров, такие как ViCo и RealTalk, команда

технологии люди спорт общество tiktok ByteDance dilnaz04 Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

MatterGen: Microsoft представляет инструменты AI для создания и моделирования новых материалов habr.com / 1 год назад

Новая модель искусственного интеллекта «Тitans» от Google обеспечивает долговременную память языковых моделей habr.com / 1 год назад

Новая технология пространственного звука Eclipsa Audio от Samsung и Google появится в Android 16 gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

05.07 / 11:30

связь технологии Amazon шутеры Шоу бизнес Новая часть Wolfenstein получит тесную связь с сериалом от Amazon — шутер от MachineGames имеет важное значение для XBOX

Фанаты шутеров давно ждут официального анонса завершающей игры современной трилогии Wolfenstein от студии MachineGames. После успешного релиза Indiana Jones and the Great Circle команда практически напрямую подтвердила, что такая игра выйдет, после чего прошел слух о наличии в игре украинской девочки-сироты Софии, которую будет сопровождать и защищать бессменный Би Джей Бласковиц (“B.J.” Blazkowicz).

05.07 / 11:30

технологии экономика закон промышленность дефицит Технология будущего: этичная и эффективная энергосберегающая система от Torus

Пока индустрия дата-центров пытается не задохнуться от аппетитов графических процессоров и нестабильности возобновляемой энергии, американская компания Torus решила вспомнить основы — законы кинетической энергии. Вместо того чтобы снова «насиловать» химию литий-ионных ячеек, разработчики представили Nova Spin. Это модульная система накопления энергии на основе маховиков, которая выглядит как попытка усмирить хаос в современных электросетях и серверных залах.

05.07 / 11:20

экономика самит криптовалюта google Курс bitcoin Дейв Портной пообещал держать биткоин при обвале «даже до нуля» после неудачного входа в рынок

Основатель Barstool Sports Дейв Портной заявил, что больше не планирует продавать биткоин, даже если его цена упадет до нуля. Во время интервью FOX Business он признал, что купил актив вблизи $100 000, понес многомиллионные убытки и в очередной раз ошибся с выбором момента для входа на рынок. «Каждый раз покупаю на пике» Портной признал, что его последняя инвестиция оказалась неудачной. По его словам, он приобрел биткоин примерно по $100 000 и теперь жалеет об этом решении. По его словам, именно постоянные неудачные попытки «угадать рынок» заставили его отказаться от активной торговли и перейти

05.07 / 11:20

продукты человек техника От запахов в холодильнике избавит обычная вещь из ванной

Простой домашний способ с использованием двух доступных вещей поможет уменьшить неприятные запахи в холодильнике без специальных средств.

05.07 / 11:10

связь ученые животные общество биологи Тараканы оказались «родственниками» бактерий – новое исследование

Новое исследование показало, что геном тараканов содержит тысячи фрагментов ДНК древних бактерий-симбионтов.

05.07 / 11:10

продукты связь ученые здоровье общество Привычки, могут состарить организм раньше времени, назвали ученые

Исследования показали, что ускорить старение организма могут не только вредные привычки, но и менее очевидные факторы.

05.07 / 11:02

технологии деньги общество животный мир Во-первых, это красиво. Ученые впервые увидели, как формируются крылья бабочек (фото)

По словам ученых, полученные данные о структуре и расположении мелких чешуек на крыльях бабочек может помочь в создании новых полезных материалов.

05.07 / 11:02

самит викинги животный мир Не только Америку. Ученые выяснили, что викинги первыми открыли Азорские острова

С помощью останков животных ученые узнали, что древние скандинавские мореплаватели достигли островов на несколько столетий раньше, чем португальские путешественники.

05.07 / 10:33

технологии motorola Corning Moto G77 Power: Аккумулятор на 7000 мА·ч и военная защита для тех, кто забывает о зарядке

Motorola продолжает развивать свою линейку выносливых устройств, и новая модель серии G выглядит как прямой вызов всем, кто устал жить у розетки. Компания раскрыла характеристики Moto G77 Power перед официальным релизом в Индии, запланированным на 8 июля. Смартфон явно нацелен на пользователей, которым автономность и живучесть важнее ультратонкого корпуса или изогнутых экранов.

05.07 / 10:33

технологии Apple история самит планшеты Посетите интерактивный музей iPad — открыт сайт с подробной историей планшетов Apple

В июне команда энтузиастов из проекта The Data Drop представила интерактивный “музей” Inside Every iPhone, который позволяет во всех подробностях рассмотреть “внутренний мир” практически каждой модели смартфонов Apple, начиная с самого первого устройства 2007 года и до актуальных iPhone 17.

Лента новостей

На главную страницу