Об этом же в других СМИ

habr.com / 1 год назад

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

habr.com / 1 год назад

Возможное ограничение использования новой языковой модели OpenAI GPT-4.5 через API

habr.com / 1 год назад

Что думают эксперты и пользователи о выпуске модели GPT-4.5?

habr.com / 1 год назад

ElevenLabs представил автономную модель преобразования речи в текст Scribe

habr.com / 1 год назад

Новая модель ИИ Anthropic позволяет пользователям решать, насколько она обоснованна

Больше по теме

14.02.2025 - 06:52 / habr.com

Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров

Последние модели искусственного интеллекта китайской технологической компании могут генерировать реалистичные видеоролики, на которых люди взаимодействуют с продуктами, потенциально меняя подход компаний к созданию рекламного контента.

Согласно прилагаемой статье, ByteDance создала свои новые модели ИИ Goku, используя массив данных, состоящий примерно из 160 миллионов пар «изображение — текст» и 36 миллионов пар «видео — текст». Данные взяты из академических наборов данных, интернет-источников и партнёрских организаций.

В отличие от других видеомоделей, Goku может создавать как статичные изображения, так и видео на основе текстовых описаний. Система использует новую архитектуру трансформера с 2–8 миллиардами параметров, которая одновременно обрабатывает оба формата.

Система сжимает изображения и видео в единый формат с помощью общего кодировщика (VAE), аналогично сжатию данных. Затем пользовательский трансформер обрабатывает эти сжатые данные. Такая архитектура в сочетании со специализированным генеративным процессом под названием Rectified Flow, который заменяет часто используемый метод диффузии, помогает Goku создавать стабильные и высококачественные результаты.

Обучение происходит в несколько этапов: сначала система учится сопоставлять текст с изображениями, затем она обучается на изображениях и видео одновременно. На последнем этапе модель оптимизируется специально для вывода изображений или видео.

Чтобы справиться с этим сложным процессом обучения, ByteDance разработала специализированную инфраструктуру, которая позволяет эффективно использовать доступные вычислительные ресурсы за счёт распараллеливания. Система также может эффективно сохранять прогресс и быстро возобновлять работу, если что-то пойдёт не так, обеспечивая

реклама продукты люди общество самит ByteDance mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

DeepSeek возобновляет доступ к моделям ИИ на фоне обострения конкуренции с Китаем habr.com / 1 год назад

Anthropic протестировала модель Claude 3.7 Sonnet на игре Pokémon Red habr.com / 1 год назад

Как эффективно обучать крупные модели ИИ: руководство Hugging Face с открытым исходным кодом habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 12:40

технологии самит планшеты Дом и интерьер itel Zeno: компактные павербанки с встроенным кабелем и мощностью 45 Вт для зарядки ноутбуков

Компания itel решила, что хватит создавать множество сущностей и заставлять пользователей рыться в сумках в поисках провода. Новая линейка внешних аккумуляторов Zeno — это попытка сделать жизнь чуть проще для тех, кто постоянно забывает аксессуары дома или просто не хочет распутывать очередной узел. Серия включает две модели емкостью 10 000 мАч и 20 000 мАч, которые нацелены на сегмент доступных, но производительных решений.

17.07 / 12:40

спорт Call of Duty Block шутеры трейлеры Activision представила Kill Block — один из новых мультиплеерных режимов Call of Duty: Modern Warfare 4

Activision и студия Infinity Ward постепенно раскрывают важные подробности шутера Call of Duty: Modern Warfare 4 и представили тизер нового многопользовательского режима под названием Kill Block, который выглядит необычно, но может разочаровать тех, кто принципиально не любит использование процедурной генерации в важных элементах игр.

17.07 / 12:32

люди общество психология Психология и отношения Как правильно общаться с человеком, который провоцирует на грубость

Психологи подсказали несколько способов защитить себя и сохранить спокойствие при общении с грубиянами.

17.07 / 12:10

наука самит палеонтология 385 миллионов лет. В Китае нашли самый древний в мире янтарь

В Китае палеонтологи обнаружили в залежах угля сотни микроскопических фрагментов янтаря, датируемых средним девоном — период, который был 385 миллионов лет назад. Эти находки примерно на 65 миллионов старше предыдущего янтаря-рекордсмена и на 150 миллионов лет старше первых динозавров.

17.07 / 12:06

происшествия люди общество климат Солнце Солнце уничтожит Землю - сколько осталось человечеству

Исследования позволили определить примерную дату, когда Солнце уничтожит нашу планету, а вместе с ней и все живое.

17.07 / 12:06

здоровье общество интересное знаки зодиака Дом и интерьер Какие испытания ждут знаки Зодиака в середине июля 2026

Середина июля 2026 года станет периодом, когда многим знакам захочется ясности, спокойствия и более понятного движения вперед.

17.07 / 12:06

общество самит лечение врачи лекарства На какой руке правильно измерять давление - названо важное правило

Врачи рассказали, на какой руке следует производить измерения и какие показатели должны насторожить.

17.07 / 12:06

продукты продукты питания закон история Знаменитости От импотенции и морфия: тайны создания напитка Coca-Cola

Историки напомнили о необычном происхождении знаменитой темной газировки. Изначально этот продукт продавался исключительно в медицинских лавках.

17.07 / 12:04

технологии общество самит симптомы intel Microsoft признала ошибку в работе Capability Access Manager с потреблением дополнительных 500 ГБ памяти

В ходе тестирования специалисты Windows Latest обнаружили, что файл с именем «CapabilityAccessManager.db-wal» может занимать большую часть системного дискового пространства в Windows 11, потребляя сотни гигабайт. Microsoft подтвердила наличие проблемы.

17.07 / 12:04

технологии Вышел Blender 5.2 LTS

Blender Foundation выпустил Blender 5.2 LTS — крупное обновление бесплатного кроссплатформенного пакета программ для 3D-графики с открытым исходным кодом, предназначенного для GNU/Linux, macOS и Windows.

Лента новостей

На главную страницу