Уже не отличить от реальности: в ChatGPT добавили самый продвинутый генератор изображений
OpenAI представила свой новый генератор изображений для ChatGPT, который компания называет "самым продвинутым".
Главное отличие нового генератора - улучшенная точность и контроль над деталями. Исследователь Габриэль Го рассказал The Verge, что система гораздо лучше справляется с биндингом, корректным расположением объектов и их характеристик.
Ранее нейросети часто путали цвета, формы или забывали о деталях, но теперь ИИ может точно передавать свойства даже при сложных запросах с 15–20 объектами.
Важное улучшение - качественное отображение текста на изображениях. Раньше генераторы часто ломали слова и символы, превращая надписи в хаотичный набор букв.
В OpenAI признали, что добиться чёткости текста оказалось сложнее, чем ожидалось, но после месяцев работы они довели результат до стабильного качества.
В демонстрации OpenAI показала, как нейросеть может создавать научные схемы, комиксы с последовательными сценами и диалогами, афиши и плакаты с точными надписями, а также изображения с прозрачным фоном, наприрассказалмер, для стикеров и логотипов. Также в одном из примеров нейросеть последовательно сделала из кота пользователя главного героя компьютерной игры.
Функция доступна пользователям всех уровней подписки, включая бесплатный.
