Мощнее Mythos 5 и не запрещена: OpenAI выпустила GPT-5.5-Cyber для поиска уязвимостей
OpenAI расширила свою кибербез-программу Daybreak и выпустила полную версию модели GPT-5.5-Cyber. На бенчмарке CyberGym она набрала 85,6% — рекорд для одиночной модели. Но интрига в другом: на том же графике OpenAI второе место заняла Mythos 5 (83,8%) — та самая модель Anthropic, которую, вместе с публичной Fable 5, США неделей ранее экспортным запретом отрезали от всего мира.
Напомню фон. 12 июня Министерство торговли США выпустило экспортную директиву, запретившую Anthropic давать доступ к Fable 5 и Mythos 5 любым иностранцам — включая собственных сотрудников-неграждан. Компании пришлось отключить обе модели глобально. Причина — кибер-возможности: власти узнали о способе обойти защитные механизмы у Fable 5, которые как раз должны были закрывать доступ к потенциально опасным возможностям базовой Mythos.
Оговорюсь честно: "мощнее" здесь держится только на CyberGym и только на 1,8 пункта, а сам бенчмарк меряет воспроизведение уже известных уязвимостей. По автономному наступательному киберу Mythos, по заявлениям Anthropic, заметно сильнее. И GPT-5.5-Cyber тоже выдается не всем — только верифицированным защитникам. Разница в одном: ее никто не банил.
Стоит присмотреться и к самому "рекорду". CyberGym проверяет, может ли агент воспроизвести известную уязвимость в реальном окружении. Свой SOTA OpenAI считает относительно собственной же GPT-5.5 (81,8%) — а не относительно Mythos 5, которая по их графику стоит выше всех публичных моделей OpenAI и уступает только новой Cyber-версии. На двух других тестах разрыв с базовой GPT-5.5 нагляднее: 39,5% против 25,95% на ExploitGym (превращение уязвимости в рабочий эксплойт) и 69,8% против 63,1% на SEC-bench Pro.
В само расширение Daybreak вошло несколько частей. Главная новинка — Patch the
Читать на habr.com
