Об этом же в других СМИ

habr.com / 1 год назад

Институт Аллена запускает OLMoTrace: инструмент для отслеживания источников ответов языковых моделей в обучающих данных

habr.com / 1 год назад

Canva расширяет возможности с новым AI-помощником и инструментами кодирования

habr.com / 1 год назад

YouTube запускает бесплатный инструмент для создания музыки на основе AI для авторов

habr.com / 1 год назад

Google поддержит стандарт Anthropic MCP для AI-моделей Gemini

habr.com / 1 год назад

Anthropic запускает подписку Claude стоимостью $200 в месяц

Больше по теме

26.03.2025 - 07:13 / habr.com

Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач

Компания Anthropic нашла простой способ улучшить способность своего помощника на основе искусственного интеллекта выполнять сложные многоэтапные задачи: позволить ему делать заметки по ходу работы. Компания утверждает, что добавление «блокнота», где Клод может записывать свои мысли, в сочетании с примерами подсказок значительно улучшает его способности решать задачи.

Система работает через команду "think", которая дает Клоду пространство для записи своих рассуждений, прежде чем двигаться дальше. Под капотом это просто команда JSON, которая отслеживает эти мысли:

Это отличается от недавно добавленной функции "расширенное мышление" Клода. В то время как расширенное мышление помогает Клоду рассуждать перед тем, как сгенерировать ответ, новый "инструмент мышления" работает во время самого процесса ответа, особенно когда Клоду нужно обработать новую информацию из других инструментов.

При тестировании сценариев обслуживания клиентов авиакомпаний в рамках Tau Bench Клод показал результаты на 54% лучше базового уровня с оптимизированной подсказкой. По данным Anthropic, эти улучшения в многошаговых задачах и лучшее соблюдение инструкций могут значительно улучшить агентские системы искусственного интеллекта, которые все еще испытывают трудности с надежностью. Тесты по программной инженерии показали более скромные результаты: на 1,6% улучшились баллы SWE-Bench.

Ключ не только в блокноте как таковом — он показывает Клоду, как эффективно его использовать. Anthropic предоставляет примеры подсказок, которые демонстрируют, как перечислять правила, проверять факты и планировать следующие шаги:

По словам Anthropic, команда «think» наиболее полезна для анализа выходных данных инструмента, соблюдения сложных правил и принятия пошаговых решений,

самит Дом и интерьер авиакомпания dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google внедряет Workspace Flows: новый AI-инструмент для автоматизации рабочих процессов в облачном пакете habr.com / 1 год назад

AI Mode от Google теперь позволяет пользователям задавать более сложные вопросы habr.com / 1 год назад

Исследование Anthropic: AI-модели скрывают свои настоящие мыслительные процессы даже при пошаговых объяснениях habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

08.07 / 00:14

Samsung технологии Samsung объявила дату Galaxy Unpacked: ожидается анонс новых складных смартфонов

Компания Samsung Electronics объявила, что презентация Galaxy Unpacked состоится 22 июля в Лондоне. Во время мероприятия компания представит новые устройства линейки Galaxy.

08.07 / 00:07

музыка YouTube самит tiktok Нейросеть находит поломку авто по звуку — обучение проходило на роликах из YouTube и TikTok

Разработчик Адам Сон выложил в открытый доступ cardiag — систему, которая по аудиозаписи определяет, есть ли у машины неисправность, и подсказывает, в какой части автомобиля искать проблему. Достаточно записать звук работающего мотора на телефон и загрузить файл в веб-приложение или консольную утилиту. Автор подчеркивает: это не замена механику, а помощник для первичной сортировки — он сужает круг возможных поломок, но не ставит окончательный диагноз.

07.07 / 23:50

бизнес технологии Anthropic запустила Claude Cowork для смартфонов и браузера: ИИ-агент может выполнять задачи, даже когда ПК выключен

Компания Anthropic объявила о запуске сервиса Claude Cowork на мобильных устройствах и в веб-версии. Доступ к новой возможности постепенно открывают в бета-режиме. Первыми её получат пользователи тарифа Max, а в течение ближайших недель поддержка появится и для других планов.

07.07 / 23:32

продукты здоровье общество человек врачи Продукты, которые незаметно разрушают зубы, назвали стоматологи

По словам врачей, опасность для зубов представляют не только сладости, но и продукты, которые многие считают безвредными.

07.07 / 23:31

реклама связь технологии закон политика ФАС РФ призвала операторов связи не препятствовать переходу абонентов к другим компаниям с сохранением номера

Федеральная антимонопольная служба (ФАС) России призвала операторов связи РФ привести свои бизнес-практики в соответствие с требованиями Закона о защите конкуренции. Ведомство настоятельно порекомендовало российским операторам связи не препятствовать переходу абонентов к другим компаниям с сохранением номера.

07.07 / 23:08

продукты выплаты доллар ios Платформа X запустила собственный видеоредактор для iOS с поддержкой субтитров на нескольких языках

Социальная сеть X запустила встроенный видеоредактор в приложении для iOS. Новый инструмент позволяет записывать и редактировать видео, а также создавать оригинальный контент без использования сторонних сервисов.

07.07 / 22:25

история общество самит археология Скелет без имени в Хорватии – почему пока не определили пол усопшего

Хорватские археологи обнаружили уникальный античный памятник в историческом квартале. Изделие оставалось запечатанным на протяжении веков.

07.07 / 22:25

технологии общество психология мозг сон Раскрыты секреты популярного правила сна 10-3-2-1-0

Новое правило объединяет пять понятных шагов для вечернего расслабления. Вам не понадобятся сложные гаджеты или подсчеты калорий.

07.07 / 22:25

медицина ученые общество женщина лечение Почему женщины острее чувствуют хроническую боль – врач

Современные исследования в области нейрохирургии доказывают, что хроническая боль у женщин — это не результат эмоциональности, а сложный процесс.

07.07 / 22:17

Facebook технологии общество Meta Meta представила ИИ-модель Muse Image для генерации и редактирования изображений

Компания Meta анонсировала модель искусственного интеллекта Muse Image для генерации и редактирования изображений. Это первая разработка подразделения Meta Superintelligence Labs в этом направлении. В настоящее время она доступна пользователям в США через приложение Meta AI, а также интегрирована в Instagram и WhatsApp. Одна из её функций — возможность использовать аккаунты Instagram как часть запроса для создания изображений.

Лента новостей

На главную страницу