Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач
Компания Anthropic нашла простой способ улучшить способность своего помощника на основе искусственного интеллекта выполнять сложные многоэтапные задачи: позволить ему делать заметки по ходу работы. Компания утверждает, что добавление «блокнота», где Клод может записывать свои мысли, в сочетании с примерами подсказок значительно улучшает его способности решать задачи.
Система работает через команду "think", которая дает Клоду пространство для записи своих рассуждений, прежде чем двигаться дальше. Под капотом это просто команда JSON, которая отслеживает эти мысли:
Это отличается от недавно добавленной функции "расширенное мышление" Клода. В то время как расширенное мышление помогает Клоду рассуждать перед тем, как сгенерировать ответ, новый "инструмент мышления" работает во время самого процесса ответа, особенно когда Клоду нужно обработать новую информацию из других инструментов.
При тестировании сценариев обслуживания клиентов авиакомпаний в рамках Tau Bench Клод показал результаты на 54% лучше базового уровня с оптимизированной подсказкой. По данным Anthropic, эти улучшения в многошаговых задачах и лучшее соблюдение инструкций могут значительно улучшить агентские системы искусственного интеллекта, которые все еще испытывают трудности с надежностью. Тесты по программной инженерии показали более скромные результаты: на 1,6% улучшились баллы SWE-Bench.
Ключ не только в блокноте как таковом — он показывает Клоду, как эффективно его использовать. Anthropic предоставляет примеры подсказок, которые демонстрируют, как перечислять правила, проверять факты и планировать следующие шаги:
По словам Anthropic, команда «think» наиболее полезна для анализа выходных данных инструмента, соблюдения сложных правил и принятия пошаговых решений,
Читать на habr.com