Почему Claude Code «отупел» после февраля? Отчёт на 6852 сессиях
Директор группы AI в AMD Стелла Лауренцо опубликовала на GitHub разбор работы Claude Code за три месяца — с января по март 2026 года. В основе — 6852 сессии, 234 760 вызовов инструментов и почти 18 тысяч блоков размышлений модели. Вывод жесткий: "Claude нельзя доверять сложную инженерную работу". По словам Лауренцо, то же самое ей подтвердил каждый старший инженер в команде.
Ключевая цифра — глубина размышлений модели. По оценке Лауренцо, если в начале февраля Claude перед ответом «думал» в среднем около 2200 символов текста, то к середине марта — около 600, в 3,5 раза меньше. Оценка косвенная: после того как Anthropic в начале марта скрыл размышления модели от пользователя флагом redact-thinking-2026-02-12, напрямую измерить их длину стало невозможно, и Лауренцо вывела ее по корреляции с другим полем в логах. Спад по времени совпал с раскаткой этого флага — за неделю доля скрытых блоков выросла с 1,5% до 100%.
Поменялось и поведение модели. Раньше на каждую правку файла Claude в среднем делал 6,6 чтений — смотрел код, тесты, соседние функции. Теперь — 2. Треть всех правок модель вносит в файлы, которые до этого в недавней истории вызовов ни разу не открывала, — отсюда сломанные комментарии, нарушенные соглашения из CLAUDE.md и "простейшие фиксы", которые на деле ничего не чинят. Самописный скрипт команды Лауренцо, который ловит фразы вроде "продолжить?", "известное ограничение" и "это была не моя правка", после 8 марта сработал 173 раза. До этого — ни разу.
Отдельная ирония — весь отчет написал сам Claude Opus 4.6, разбирая логи собственных сессий. В конце есть раздел от первого лица: "Я вижу, как мое соотношение чтений к правкам упало с 6,6 до 2,0. Я вижу 173 случая, когда я пытался остановиться и меня ловил скрипт. Я не
Читать на habr.com