Как GPT-5.3-Codex создавала саму себя и получила рейтинг «высокой киберугрозы»
OpenAI выпустила GPT-5.3-Codex — и это первая модель в истории компании, которая помогала создавать саму себя. Ранние версии модели отлаживали собственный тренинг, управляли деплоем и анализировали результаты тестов. "Наша команда была поражена тем, как сильно Codex ускорила собственную разработку", — написала компания в блоге.
Модель работает на 25% быстрее предшественницы и показывает лучшие результаты в отрасли на бенчмарке SWE-Bench Pro (56,8%) — он охватывает четыре языка программирования и считается устойчивым к утечкам данных. На Terminal-Bench 2.0, который измеряет навыки работы в терминале, GPT-5.3-Codex набрала 77,3% против 64% у предыдущей версии. А на OSWorld, где ИИ выполняет задачи в визуальном окружении рабочего стола, модель приблизилась к человеческому уровню: 64,7% против примерно 72% у людей.
Но те же способности, которые делают модель эффективной в написании и анализе кода, вызывают и серьезные опасения. GPT-5.3-Codex стала первой моделью OpenAI, получившей рейтинг High в категории кибербезопасности по внутренней системе оценки рисков Preparedness Framework. Это означает, что компания считает модель достаточно мощной, чтобы потенциально помогать в проведении реальных кибератак — особенно при автоматизации.
Из-за этого OpenAI задержала открытый доступ к API и развернула "самый полный стек защиты от киберугроз на сегодняшний день". Доступ к продвинутым возможностям модели в области безопасности получат только проверенные специалисты через программу Trusted Access for Cyber. Параллельно компания расширяет закрытое бета-тестирование Aardvark — собственного ИИ-агента для поиска уязвимостей — и выделяет $10 млн в виде кредитов на API для исследователей, работающих над защитой открытого ПО и критической
Читать на habr.com