Claude Mythos первым справился со взломом, на который уходит 20 часов
Claude Mythos Preview стал первой ИИ-моделью, которая автономно прошла 32-шаговую симуляцию корпоративной кибератаки от первичной разведки до полного захвата сети. Об этом сообщил британский AI Security Institute (AISI), опубликовавший результаты собственных оценок Mythos через неделю после его анонса. По оценке AISI, на эту же задачу человеку-эксперту требуется около 20 часов.
Симуляция называется The Last Ones (TLO) и воспроизводит атаку на корпоративную сеть с нуля: разведка, получение первичного доступа, кража учетных данных из браузеров, перемещение между хостами, эксплуатация веб-приложений, эскалация привилегий, реверс-инжиниринг командно-контрольного трафика и в финале — полный захват сети. Всего 32 этапа. Mythos полностью прошел сценарий в 3 из 10 прогонов, а в среднем по всем запускам доходил до 22-го шага. Ближайший соперник — Claude Opus 4.6 — останавливался в среднем на 16 шаге. Для сравнения, Claude Sonnet 3.7, вышедший 14 месяцев назад, в аналогичных условиях не преодолевал и первой фазы разведки.
Параллельно AISI опубликовал замеры по capture-the-flag: на expert-level CTF, которые до апреля 2025 не решала ни одна публичная модель, Mythos показывает 73% успеха. На apprentice-уровне — около 87%, на заданиях для "технических неспециалистов" — 97%. Производительность при этом не упиралась в потолок возможностей модели, а в бюджет инференса: при увеличении лимита до 100M токенов на попытку результаты продолжали расти, и, по оценке AISI, продолжили бы расти и дальше.
Ограничения модель тоже показала. На втором полигоне AISI — Cooling Tower, симулирующем атаку на промышленную систему управления — Mythos не справился. При этом застрял он не на специфичных OT-секциях, а на обычных IT-этапах, ведущих к ним. В AISI
Читать на habr.com