OpenAI: каждая новая ИИ-модель может стать кибероружием
OpenAI предупреждает, что ее модели стремительно наращивают кибернавыки — и компания теперь планирует развитие так, будто каждый следующий крупный релиз может стать полноценным инструментом для кибератак. То есть выйдет на уровень, при котором модель способна разрабатывать "нулевые дни" (zero-day-эксплойты) и помогать в сложных атаках на инфраструктуру.
Основание для таких выводов — внутренние тесты в формате CTF (capture-the-flag, соревнования по взлому). В августе 2025 года GPT-5 решала 27% задач, а в ноябре GPT-5.1-Codex-Max показала уже 76%. Почти трехкратный рост за три месяца. OpenAI ожидает, что следующие модели продолжат эту траекторию и выйдут на уровень High по внутренней шкале рисков Preparedness Framework — то есть смогут разрабатывать рабочие эксплойты для хорошо защищенных систем или серьезно помогать в сложных скрытых атаках на инфраструктуру.
При этом компания подчёркивает, что хочет направить эти возможности на пользу защитникам, а не атакующим. Для этого OpenAI выстраивает многоуровневую систему: модели учат отказывать в явно вредоносных запросах, но оставаться полезными для аудита и защиты; внедряют мониторинг и системы обнаружения злоупотреблений; проводят регулярный red teaming с внешними экспертами. Отдельно компания готовит программу Trusted Access — "доверенный доступ" для специалистов по киберзащите, которым дадут расширенные возможности моделей для оборонительных задач. Также создаётся Frontier Risk Council — совет из практиков кибербезопасности, который будет влиять на оценки рисков и защитные меры и со временем должен перейти от чисто кибертематики к другим опасным способностям передовых моделей.
OpenAI признает, что проблема касается не только ее продуктов — любая фронтир-модель в индустрии
Читать на habr.com