OpenAI позволяет создавать собственные изображения в ChatGPT
Компания OpenAI интегрировала возможности создания изображений непосредственно в ChatGPT, заменив предыдущую интеграцию с DALL-E. Новая система призвана обеспечивать более стабильные результаты и меньшее количество ограничений по контенту.
Компания OpenAI начала внедрять собственную функцию создания изображений, представленную вместе с GPT-4o в мае 2024 года. По словам компании, эта функция станет стандартным генератором изображений для всех пользователей ChatGPT, от бесплатного уровня до корпоративных клиентов. Доступ к API для разработчиков планируется предоставить в ближайшие недели. DALL-E по-прежнему будет доступен как отдельная опция через специальный GPT.
Новая система обрабатывает текст и изображения одновременно, что позволяет получать более точные результаты. По данным OpenAI, она может обрабатывать до 20 различных объектов одновременно, сохраняя правильные взаимосвязи между ними. Эта возможность делает её особенно эффективной при создании текста на изображениях, например, для инфографики или логотипов.
Система особенно хорошо справляется с нестандартными концепциями. Когда её просят сгенерировать «астронавта верхом на лошади», предыдущие модели обычно по умолчанию генерировали более распространённый сценарий, в котором астронавт едет верхом на лошади.
Однако GPT-4o точно создаёт необычную композицию, что говорит о более глубоком понимании пространственных отношений, а не просто о воспроизведении распространённых шаблонов из обучающих данных. Эта способность может значительно расширить творческие возможности ИИ при создании изображений.
Модель способна к «контекстному обучению», что позволяет ей анализировать загруженные изображения и использовать их детали в новых поколениях. Пользователи могут улучшать свои
Читать на habr.com