Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic
Лауреат премии Тьюринга Йошуа Бенжио заявил, что Claude Mythos Preview ставит вопрос не только о кибербезопасности, но и о контроле над ИИ-инфраструктурой. В интервью Fortune он сформулировал проблему так: "Нет смысла в том, что частные лица решают судьбу инфраструктуры за всех остальных. А что насчет всех компаний и стран, которые не получили доступ?"
Поводом стала программа Anthropic Project Glasswing, представленная 7 апреля. В ее рамках доступ к Claude Mythos Preview получили стартовые партнеры Anthropic, среди них AWS, Apple, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Позже компания расширила доступ еще более чем на 40 организаций, которые создают или поддерживают критически важную программную инфраструктуру.
Партнеры Project Glasswing используют Mythos для задач в области кибербеза: поиска и исправления уязвимостей, анализа бинарных файлов, защиты конечных устройств и пентестов. Anthropic пишет, что не планирует делать Claude Mythos Preview общедоступной, пока не появятся более надежные способы блокировать самые опасные ответы модели. Компания также обещает в течение 90 дней рассказать, что удалось узнать в рамках проекта и какие исправленные уязвимости можно раскрыть.
Именно ограниченный доступ выглядит центральной проблемой для Бенжио. Если модель действительно помогает находить уязвимости быстрее людей, первые участники программы получают преимущество в защите своей инфраструктуры. Компании и страны за пределами списка Anthropic оказываются в худшем положении — и при этом не участвуют в решении, кому дать такой инструмент, а кому нет.
Серьезность повода подтверждает оценка британского AI Security Institute. В его тестах Claude Mythos Preview стала первой
Читать на habr.com
