



Qwen Image Edit — новый шаг к умному и смысловому редактированию фото
Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования — теперь они охватывают как визуальные правки, так и семантические преобразования.
Qwen Image Edit создана на основе 20-миллиардной модели Qwen Image и сочетает две стратегии обработки: модуль Qwen2.5 VL отвечает за семантический контроль, а вариационный автоэнкодер (variational autoencoder, VAE) управляет визуальной стороной изображения. Подробности об архитектуре Alibaba пока не раскрывает.
По словам компании, система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.
На примере семантического редактирования Alibaba показала, как модель способна создавать новый контент с участием своего капибарного талисмана. Даже если меняется бо́льшая часть изображения, сам персонаж остаётся тем же самым.
Другие сценарии применения включают генерацию новых ракурсов с поворотами объектов на 90° или 180°, а также использование трансфера стиля для создания аватаров — например, превращение портретов в изображения в духе студии Ghibli.
Кроме того, Qwen Image Edit умеет добавлять таблички с естественными отражениями, удалять выбившиеся из причёски волосы, менять цвета букв, а также редактировать фон или одежду.
Одним из главных достоинств Qwen Image Edit является умение работать с текстом — как на китайском, так и на английском языках. Система может добавлять, удалять или менять надписи прямо в изображениях, сохраняя оригинальный шрифт, размер и стиль.
Пользова
Читать на habr.com