OpenAI обновляет модель Codex и добавляет программу для кибербезопасности
Новая модель ИИ GPT-5.2-Codex создана для решения сложных задач в качестве автономного программного агента. Поскольку технология также эффективна в поиске уязвимостей, OpenAI запускает эксклюзивную программу доступа, в рамках которой проверенные эксперты получают версию с ослабленными фильтрами безопасности.
С технической точки зрения, OpenAI использует расширенное сжатие контекста, или компактизацию. Этот метод помогает модели более эффективно обрабатывать длинные истории разговоров и обширный анализ кода. Система разработана для поддержания общего обзора даже в сложных проектах, опираясь непосредственно на возможности своего предшественника, GPT-5.1-Codex-Max , который уже был разработан для работы над задачами, занимающими более суток.
Компания OpenAI также оптимизировала обработку изображений, что позволяет GPT-5.2-Codex более точно интерпретировать технические схемы или скриншоты пользовательских интерфейсов. По данным компании, управление собственными средами Windows теперь работает надежнее, чем в предыдущей модели.
В стандартизированных тестах новая модель демонстрирует лишь незначительные улучшения по сравнению с базовой версией. В SWE-Bench Pro, где программное обеспечение имитирует решение реальных задач в репозиториях GitHub, GPT-5.2-Codex достигает показателя решения в 56,4%, по сравнению с 55,6% у стандартной версии.
В Terminal-Bench 2.0 точность немного повышается и составляет 64 процента. Этот тест проверяет, насколько хорошо агенты ИИ могут работать с инструментами командной строки, настраивать серверы или компилировать код.
Основное внимание в этом релизе уделяется кибербезопасности. Расширенные возможности анализа кода могут использоваться как для защиты, так и для нападения, и OpenAI приводит в качестве
Читать на habr.com

