Alibaba выпустила Wan2.7-Image – ИИ для генерации и изменения картинок
Alibaba Cloud выпустила нейросеть Wan2.7-Image – новую унифицированную модель, предназначенную для генерации и редактирования изображений.
Одна из ключевых особенностей Wan2.7-Image – детальная проработка лиц. Как отмечают создатели, многие нейросети генерируют однотипные портреты. Новая модель даёт возможность управлять строением лица на гранулярном уровне: формой скул, разрезом глаз, контуром, макияжем и причёской, причём с учётом этнического разнообразия, возраста и телосложения.
Важным нововведением стала работа с цветом. Модель умеет автоматически извлекать цветовую палитру из загруженного референсного изображения. Для тех, кому нужна максимальная точность, предусмотрен ручной ввод с использованием до восьми HEX-кодов с указанием точных пропорций.
Отдельного внимания заслуживает рендеринг текста. Wan2.7-Image способна воспроизводить до 3000 токенов текста на 12 языках с качеством, сопоставимым с печатным. В заявленные сценарии входят академические работы со сложными формулами, финансовые отчёты с плотными таблицами, инфографика и длинные вертикальные скроллы. Разработчики подчёркивают, что в итоговом изображении не будет пропущенных символов, размытых надписей или нарушенной вёрстки.
Функционал интерактивного редактирования реализован через интуитивный интерфейс: пользователь выделяет область на изображении и текстовой командой описывает желаемое изменение. Модель поддерживает перемещение, изменение размера и поворот объектов, замену элементов, редактирование текста (шрифта, цвета, выравнивания), а также вставку новых деталей.
Wan2.7-Image также предлагает режим мультигенерации: один промпт может создать до 12 согласованных между собой изображений. Это пригодится для раскадровок, каталогов продуктов, детских книг, серий
Читать на habr.com