Релиз OpenAI GPT-5.3-Codex – на 25% быстрее, новые достижения на SWE-Bench Pro и Terminal-Bench
OpenAI представила GPT-5.3-Codex – новую флагманскую модель, которая является самым мощным агентом для кодирования на сегодняшний день. Модель на 25% быстрее предыдущей версии, объединяет передовые возможности кодирования GPT-5.2-Codex с рассуждениями и профессиональными знаниями GPT-5.2, а также знаменует собой важный концептуальный сдвиг.
GPT-5.3-Codex – это первая модель OpenAI, которая активно участвовала в создании самой себя.
Как утверждается в блоге компании, команда Codex использовала ранние версии модели для отладки ее же обучения, управления развертыванием и диагностики результатов тестов. “Наша команда была потрясена тем, насколько Codex смог ускорить собственное развитие”, – пишут разработчики.
С технической точки зрения модель устанавливает новый state-of-the-art на SWE-Bench Pro (бенчмарк для кодинга) и Terminal-Bench 2.0, демонстрируя лидерство в терминальных навыках. При этом она достигает этих результатов, расходуя меньше токенов, чем предыдущие модели.
В сфере профессиональных знаний, измеряемой тестом GDPval, GPT-5.3-Codex соответствует уровню GPT-5.2.
Впечатляющий прогресс наблюдается в области десктопного использования: модель показывает значительный рост на OSWorld-Verified – бенчмарке, который оценивает выполнение задач в визуальной среде Ubuntu, Windows и macOS. Codex эволюционирует из агента, пишущего код, в агента, способного делать почти все то же, что разработчики и профессионалы делают на компьютере.
Одной из ключевых новых фич является интерактивность. GPT-5.3-Codex позиционируется не как “черный ящик”, который выдает готовый ответ, а как коллега в реальном времени. Модель может делиться прогрессом, объяснять свои решения и позволяя пользователю направлять ход мыслей в процессе работы, а не ждать
Читать на habr.com
