Anthropic: как научить ИИ-агентов работать днями без потери прогресса
Команда Anthropic опубликовала подробное исследование о том, как научить ИИ-агентов работать часами и днями, не теряя прогресс после каждой сессии. Проблема старая: каждый запуск модели — это история без памяти о предыдущем контексте. В рамках Claude Agent SDK инженеры нашли способ заставить агентов продолжать работу так, будто они один непрерывный процесс.
Современные модели опираются на ограниченные контекстные окна. Когда задача выходит за их пределы — например, создание веб-приложения, — агент неизбежно теряет часть истории. Компакция контекста помогает, но не решает проблему полностью.
В экспериментах Claude допускал два типичных сбоя:
Пытался сделать всё сразу, начинал реализацию большой фичи, заканчивал окно токенов и передавал управление следующей сессии в полуразрушенном состоянии.
Преждевременно объявлял победу, видя часть готовых фич, и решал, что работа завершена.
Anthropic разложила задачу на две роли — и это сильно улучшило устойчивость:
Создаёт структуру проекта при первом запуске:
init.sh;
claude-progress.txt с логом работы;
первичный git-коммит;
файл-список всех требований к проекту (часто сотни фич), все помечены как не реализованные.
Каждая следующая сессия:
выбирает одну фичу;
делает инкрементальные изменения;
оставляет репозиторий в чистом, рабочем состоянии;
пишет git-коммит и обновляет claude-progress.txt.
Такой workflow позволяет следующему агенту «прийти на смену» и сразу понимать, что сделано, что сломано и что делать дальше.
Отдельное внимание уделили файлу с фичами в формате JSON. Агенту строго запрещено менять или удалять тесты: он может только переключать поле passes после успешной проверки. Такой подход оказался намного стабильнее использования Markdown — модель меньше ломает структуру.
Без жёсткого запроса
Читать на habr.com

