Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели
Anthropic разрабатывает и уже тестирует с доверенными клиентами новую ИИ-модель, которую называет самой мощной в своей истории. О ее существовании стало известно из-за утечки данных: черновик блог-поста с описанием модели оказался в публично доступном хранилище, откуда его извлекли журналисты Fortune и независимые исследователи — Рой Паз из LayerX Security и Александр Повельс из Кембриджского университета.
Модель получила название Claude Mythos, а вместе с ней Anthropic вводит новый уровень — Capybara. По задумке компании, Capybara крупнее и мощнее Opus, который до сих пор был верхней планкой линейки Claude. В слитом черновике говорится, что модель значительно превосходит Claude Opus 4.6 в тестах на программирование, академические рассуждения и кибербезопасность. Представитель Anthropic подтвердил Fortune разработку модели и назвал ее "качественным скачком возможностей".
Главная интрига — кибербезопасность. Согласно черновику, Anthropic считает, что модель далеко опережает все существующие ИИ-системы по кибервозможностям и предвещает волну моделей, способных эксплуатировать уязвимости быстрее, чем защитники успевают их закрывать. Именно поэтому компания планирует начать с ограниченного доступа для организаций, занимающихся киберзащитой, — чтобы дать им фору.
Утечка произошла из-за ошибки конфигурации CMS — системы управления контентом для блога Anthropic. Создаваемые в ней материалы по умолчанию получали публичный URL, если пользователь не менял настройку приватности вручную. В результате наружу попали около 3000 ранее не публиковавшихся файлов: черновики постов, изображения, PDF-документы — включая информацию о закрытом саммите для европейских CEO с участием Дарио Амодеи. Anthropic признала проблему, назвав ее
Читать на habr.com