
Функция генерации изображений ChatGPT получает обновление
Во время прямой трансляции генеральный директор OpenAI Сэм Альтман объявил о первом крупном обновлении возможностей генерации изображений ChatGPT за последний год. ChatGPT теперь может использовать модель GPT-4o компании для собственного создания и изменения изображений и фотографий. GPT-4o долгое время лежал в основе платформы чат-ботов на базе AI, но до сих пор эта модель могла генерировать и редактировать только текст, но не изображения.
Альтман сказал, что генерация собственных изображений GPT-4o уже доступна в ChatGPT и Sora, продукте OpenAI для генерации видео на основе AI, для подписчиков плана Pro стоимостью 200 долларов в месяц. OpenAI говорит, что эта функция скоро станет доступна пользователям Plus и бесплатной версии ChatGPT, а также разработчикам, использующим API-сервис компании.
GPT-4o с выводом изображения «думает» немного дольше, чем модель генерации изображений, которую она фактически заменяет, DALL-E 3, чтобы сделать то, что OpenAI описывает как более точные и подробные изображения. GPT-4o может редактировать существующие изображения, включая изображения с людьми на них — трансформируя их или «дорисовывая» детали, такие как объекты переднего плана и фона.
В интервью Wall Street Journal представители OpenAI сообщили, что для реализации новой функции обработки изображений они обучили GPT-4o на «общедоступных данных», а также на собственных данных, полученных в результате партнерских отношений с такими компаниями, как Shutterstock.
Многие поставщики генеративного AI рассматривают данные обучения как конкурентное преимущество, поэтому они держат их и любую связанную с ними информацию в тайне. Но данные обучения также являются потенциальным источником судебных исков, связанных с интеллектуальной собственностью,
Читать на habr.com