Об этом же в других СМИ

chudo.tech / 10 месяцев назад

IFA 2025: новая линейка «умных» холодильников Midea

incrypted.com / 10 месяцев назад

Виталик Бутерин анонсировал leanVM как новый шаг в масштабировании Ethereum

habr.com / 10 месяцев назад

DogRecon: ИИ превращает фото собаки в анимированного 3D-аватара

habr.com / 10 месяцев назад

Новый модуль Grammarly, AI Grader, использует открытые данные о преподавателе для предсказания оценки

habr.com / 10 месяцев назад

«Сначала покажи паспорт»: новые правила проверки возраста в западном интернете

Больше по теме

22.08.2025 - 10:40 / habr.com

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования — теперь они охватывают как визуальные правки, так и семантические преобразования.

Qwen Image Edit создана на основе 20-миллиардной модели Qwen Image и сочетает две стратегии обработки: модуль Qwen2.5 VL отвечает за семантический контроль, а вариационный автоэнкодер (variational autoencoder, VAE) управляет визуальной стороной изображения. Подробности об архитектуре Alibaba пока не раскрывает.

По словам компании, система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.

На примере семантического редактирования Alibaba показала, как модель способна создавать новый контент с участием своего капибарного талисмана. Даже если меняется бо́льшая часть изображения, сам персонаж остаётся тем же самым.

Другие сценарии применения включают генерацию новых ракурсов с поворотами объектов на 90° или 180°, а также использование трансфера стиля для создания аватаров — например, превращение портретов в изображения в духе студии Ghibli.

Кроме того, Qwen Image Edit умеет добавлять таблички с естественными отражениями, удалять выбившиеся из причёски волосы, менять цвета букв, а также редактировать фон или одежду.

Одним из главных достоинств Qwen Image Edit является умение работать с текстом — как на китайском, так и на английском языках. Система может добавлять, удалять или менять надписи прямо в изображениях, сохраняя оригинальный шрифт, размер и стиль.

Пользова

самит dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Япония инвестирует 750 млн $ в суперкомпьютер нового поколения FugakuNEXT habr.com / 10 месяцев назад

Стартап Halo X выпускает умные очки за 249 $ habr.com / 10 месяцев назад

Лучше, чем Ray-Ban✶? Meta✶ представит умные очки Hypernova✶ уже в сентябре habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 08:51

Volkswagen самит предприятия интересное мода и стиль Volkswagen пытается догнать Китай: автопилот 3-го уровня и искусственный интеллект

Немецкий автопром переживает не лучшие времена, особенно в Китае, где местные бренды штампуют «умные» автомобили быстрее, чем в Вольфсбурге успевают выпить кофе. Чтобы не превратиться в производителя железных коробок для чужого софта, Volkswagen Group решает окончательно закрепиться в Поднебесной. Компания усиливает сотрудничество с Horizon Robotics через совместное предприятие CARIZON. Цель амбициозная: научить машины думать самостоятельно, доведя их до 3-го и 4-го уровней автономности в рамках стратегии «В Китае для Китая».

24.07 / 08:51

экономика деньги SSD золото общество Asgard V7: быстрый PCIe 4.0 SSD с медным охлаждением за адекватные деньги

Рынок твердотельных накопителей сегодня напоминает большой восточный базар: пока одни гонятся за космическими скоростями PCIe 5.0, требующими активного охлаждения размером с кирпич, другие стараются найти золотую середину. Компания Asgard решила не изобретать велосипед, а просто выпустить добротное устройство, которое выжимает почти все возможное из предыдущего поколения интерфейса. Новый NVMe-накопитель Asgard V7 — это как раз тот случай, когда цифры в спецификациях выглядят приятнее, чем ценник в магазине.

24.07 / 08:51

google Теперь в Google-аккаунт можно войти с помощью селфи-видео: разработчик запускает новую ступень защиты от взлома

Google запустила новый способ входа в аккаунт — теперь это можно сделать при помощи селфи-видео. Пока эта возможность доступна не всем пользователям, разработчик начал ее развертывание, но вскоре она появится у всех.

24.07 / 08:46

технологии смартфоны семья бытовая техника животный мир «Умный» робот-пылесос Narwal с режимом для малышей и питомцев

Компания Narwal представила новый флагманский робот-пылесос Flow 2 White, который делает акцент не только на мощности уборки, но и на адаптации к повседневной жизни пользователей.

24.07 / 08:32

технологии люди книги самит мобильный телефон Как узнать, кто звонит с незнакомого номера: простой трюк

Звонки с незнакомых номеров могут поступать как от мошенников, так и от людей, которые просто сменили телефон. Один из самых простых способов проверить, кто пытается связаться, — воспользоваться возможностями Viber, который в некоторых случаях показывает имя абонента даже без сохранения номера в контактах.

24.07 / 08:21

Госдума закон общество рубль банк Госдума РФ приняла во втором и третьем чтении закон о регулировании цифровых валют

Госдума России приняла в третьем чтении закон «О цифровых валютах и цифровых правах». Документ задаёт правила оборота криптовалют в России и охватывает покупку через лицензированных посредников, биржевые торги, клиринг и работу цифровых депозитариев.

24.07 / 08:21

продукты технологии google Google переименовала NotebookLM в Gemini Notebook и расширила возможности сервиса

Google объявила о переименовании сервиса NotebookLM в Gemini Notebook. Компания заявила, что изменение названия отражает более тесную интеграцию продукта с экосистемой Gemini.

24.07 / 08:21

продукты технологии экономика Nvidia самит Китайская Z.ai построила ИИ-дата-центр мощностью 1 ГВт без ускорителей Nvidia

Китайская компания Z.ai завершила строительство крупного вычислительного центра для искусственного интеллекта, который полностью работает на китайских ускорителях и не использует чипы Nvidia. По данным Bloomberg, часть объекта уже введена в эксплуатацию. Инфраструктура предназначена для обучения и разработки следующих поколений моделей семейства GLM.

24.07 / 08:21

продукты технологии Telegram история пресс-служба В MAX запустили истории — как в Telegram

В мессенджере MAX появились пользовательские истории - временные фото и видео в формате, знакомом по Telegram и другим социальным платформам.

24.07 / 08:21

бизнес экономика закон политика вице-премьер Правительство РФ создаёт штаб по платформенной экономике перед вступлением в силу нового закона

Правительство РФ утвердило постановление о создании постоянной подкомиссии по вопросам развития цифровых платформ. Об этом сообщило издание «Интефакс» со ссылкой на аппарат вице-премьера Дмитрия Григоренко.

Лента новостей

На главную страницу