



Выкатили «запрещенку»: Anthropic открыл публичный доступ к Claude Fable 5
Помните весенние слухи про секретный ИИ, который якобы умеет вскрывать любые банковские системы? Это был Mythos. В апреле Anthropic испугалась отдавать его в паблик, назвав угрозой глобальной кибербезопасности. Но компромисс найден. На днях компания открыла доступ к Claude Fable 5. Это первая публичная модель принципиально нового класса, которая изначально вообще не должна была выйти в свет.
Защиту пришлось закрутить до упора. Модель снабдили каскадом жестких классификаторов. Если вы попытаетесь спросить ее про взлом софта, синтез веществ или создание вирусов, Fable 5 мгновенно заблокирует ответ. Вместо нее система автоматически перенаправляет запрос на модель послабее.
Хуже того — вокруг модели уже возник международный скандал. Как выяснило издание WIRED, Anthropic поймали на «тайном саботаже»: если система подозревала, что Fable 5 используют для ИИ-разработок или обучения моделей-конкурентов, она не выдавала ошибку, а скрытно ухудшала качество своих ответов.
Разработчики негодуют, заявив, что корпорация просто «выдергивает лестницу» у индустрии. Смысл в том, что Anthropic, которая сама обучила модель на открытых данных интернета, теперь скрытно мешает другим делать то же самое, используя ее продукт. Anthropic уже пришлось публично извиняться и экстренно менять стратегию.
Теперь скрытый саботаж заменят на видимые предупреждения. Правда, для конечного пользователя есть плохая новость: разработчики признались, что из-за этого им придется «раскинуть сеть фильтров шире», а значит, под раздачу и ложные блокировки теперь будет попадать еще больше безобидных запросов.
Анонс модели в сети вызвал легкое замешательство. Пользователи ждали релиза Mythos, а получили Fable 5. Позже Anthropic внесла ясность: Claude Fable 5 и Claude
Читать на habr.com