OpenAI выпустила GPT-5.5 и приблизилась к идее ИИ-супераппа
- Новая модель улучшила результаты в программировании, научных задачах и работе с инструментами.
- В компании считают релиз шагом к объединению ChatGPT, Codex и браузера в единый сервис.
- GPT-5.5 уже доступна подписчикам, а API обещают открыть в ближайшее время.
Компания OpenAI представила GPT-5.5, назвав ее самой умной и интуитивно понятной моделью в своей линейке. По словам разработчиков, новинка быстрее понимает, что хочет пользователь и требует меньше токенов для выполнения тех же задач.
Модель способна брать на себя больше работы на компьютере человека. От написания и отладки кода до анализа данных, создания документов и переключения между инструментами.
Президент компании Грег Брокман назвал релиз шагом к «более агентным и интуитивно понятным вычислениям».
По его словам, новая версия также приближает запуск «супераппа» — единого сервиса, который должен объединить ChatGPT, Codex и AI Browser. В OpenAI рассчитывают, что такая связка позволит закрывать все больше рабочих задач внутри одной экосистемы.
Ставка на кодинг и умную работу
В новой модели один из главных акцентов сделан на программировании.
В тестах Terminal-Bench 2.0 модель набрала 82,7%, в SWE-Bench Pro — 58,6%. В компании также заявили, что GPT-5.5 превзошла GPT-5.4 во внутреннем бенчмарке Expert-SWE для сложных инженерных задач с длительным горизонтом планирования.
При этом, как подчеркивают разработчики, улучшения достигнуты с меньшим расходом токенов.
Рост заметен и в других сценариях, по словам компании.
В бенчмарке GDPval, который оценивает выполнение интеллектуальной работы в 44 профессиях, модель набрала 84,9%. В OSWorld-Verified, где проверяется работа в реальной компьютерной среде, — 78,7%.
Результат прохождения Tau2-bench Telecom для сложных
Читать на incrypted.com
