Об этом же в других СМИ

incrypted.com / 4 месяца назад

Bitget представила GetClaw — автономного ИИ-агента для торговли без необходимости установки

habr.com / 4 месяца назад

Anthropic открыли доступ к Code Review: команда агентов на каждый PR

habr.com / 4 месяца назад

Крупнейшая провинция Китая планирует перестроить промышленность с помощью ИИ

habr.com / 4 месяца назад

Anthropic опубликовала большое исследование влияния AI на рынок труда

cursorinfo.co.il / 4 месяца назад

Кофе может продлить жизнь - исследование

Больше по теме

21.02.2026 - 16:12 / habr.com

Большое исследование Anthropic про автономность ИИ-агентов в продакшене

Anthropic выпустила исследование о том, как люди используют автономных ИИ-агентов в продакшене. Для этого они посмотрели на миллионы взаимодействий в Claude Code и на вызовы инструментов через публичный API.

Самый наглядный сигнал – это длительность работы Claude Code без остановки. Медианный “ход” короткий (порядка 45 секунд), а вот 99.9-й перцентиль за три месяца почти удвоился: с <25 минут до >45 минут. Причём рост получился плавным и не совпадает скачками с релизами моделей — то есть автономность в практике растёт не только из-за самой модели, но и из-за доверия пользователей и привычки делегировать.

Дальше — как меняется стиль контроля по мере опыта. Новички чаще подтверждают каждый шаг руками, но по мере “стажа” переключаются на auto-approve: примерно с 20% сессий у новых пользователей до >40% у тех, кто набрал сотни сессий.

Интересный парадокс: при этом опытные пользователи прерывают агента чаще. Anthropic приводят оценку на уровне “ходов”: где-то с 5% прерываний у новичков до ~9% у опытных. Логика такая: меньше микроменеджмента, больше наблюдения и вмешательства только когда "повело не туда".

Ещё один слой контроля — когда сам агент останавливается. На сложных задачах Claude Code задаёт уточняющие вопросы чаще, чем человек его прерывает. То есть модель снижает автономность, когда не уверена.

Отдельно Anthropic посмотрела на публичный API: там они не могут собрать “сессии” клиентов, поэтому анализируют действия по отдельным tool calls и оценивают для них риск и автономность по шкале 1–10 (риск — по последствиям ошибки, автономность — насколько действие похоже на самостоятельное поведение, а не на выполнение пошаговой команды).

Отдельно Anthropic посмотрела на публичный API: там они не могут собрать “сессии” клиентов,

финансы люди общество самит курс мода и стиль Software pythonleader

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Какие профессии заменит ИИ? В Anthropic провели свое исследование incrypted.com / 4 месяца назад

x86 больше не нужен, процессоры Amazon, параллельные стримы в Java | Spring АйО Подкаст №53 habr.com / 4 месяца назад

Anthropic запустили программу для опенсорс-разработчиков: 6 месяцев Claude Max 20x бесплатно habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 13:24

SpaceX прогноз интересное инвестор IPO SpaceX потеряла более $1 трлн капитализации от пика после IPO

Акции компании Илона Маска — SpaceX — опустились до $123,99, вследствие чего рыночная капитализация компании сократилась до $1,63 трлн. Для сравнения, уже через несколько дней после IPO — 16 июня 2026 года — капитализация компании достигала $2,64 трлн. Несмотря на это, большинство аналитиков Уолл-стрит сохраняют оптимистичные прогнозы, а инвесторы продолжают рассматривать компанию как одного из главных бенефициаров бума искусственного интеллекта и космической инфраструктуры, сообщили в Bloomberg. Starship снова отложил планы SpaceX Непосредственным катализатором падения стало решение SpaceX отменить з

18.07 / 13:19

бизнес Samsung технологии экономика история Samsung может впервые в истории завершить квартал с убытком мобильного подразделения: причина оказалась неожиданной

Несмотря на то что Samsung Electronics ожидает рекордную прибыль по итогам второго квартала 2026 года благодаря стремительному росту полупроводникового бизнеса, мобильное подразделение компании (Samsung MX) может столкнуться с беспрецедентной ситуацией. По оценкам южнокорейских аналитиков, подразделение, отвечающее за смартфоны Galaxy, впервые в своей истории рискует завершить квартал с убытком.

18.07 / 13:12

люди мода ученые общество человек Зачем человеку нужны брови и какие функции они выполняют

Небольшая деталь человеческого лица выполняет сразу несколько важных задач, о существовании которых многие даже не подозревают.

18.07 / 13:12

здоровье спорт инфляция семья Здоровье и красота ТОП простых привычек, которые гарантированно изменят вас к лучшему

Изменить свою жизнь к лучшему куда проще, чем кажется, уверяет тренер по фитнесу и питанию Лора Денис.

18.07 / 13:12

экономика общество Здоровье и красота болезнь дефицит ТОП-5 симптомов серьезного ухудшения здоровья назвали врачи

Какие признаки указывают на то, что организму не хватает витаминов и эту ситуацию нужно срочно исправить.

18.07 / 12:38

продукты технологии Apple самит стартап StepFun представила StepX Neo — смартфон с операционной системой, изначально созданной для автономных ИИ-агентов

Китайская компания StepFun представила StepX Neo — первый в мире смартфон с автономным управлением. Устройство работает на операционной системе Step AOS, разработанной для агентов искусственного интеллекта.

18.07 / 12:24

ученые прогнозы Солнце Земля магнитные бури Магнитная супербуря ударит по Земле — возможны катастрофы

Исследование показало, что существующие модели недооценивали экстремальный солнечный ветер и "потолка" у мощности геомагнитных токов, похоже, не существует.

18.07 / 11:56

закон президент общество законодательство рубль Операторам ЦОДов не удалось добиться пересмотра арендных ставок в Подмосковье

В Московской области не планируют пересматривать правила расчёта арендной платы за государственные земельные участки под строительство дата‑центров. Это следует из ответа министерства имущественных отношений региона на обращение Ассоциации участников отрасли центров обработки данных (ЦОД). «Ведомости» ознакомились с перепиской, её подлинность подтвердил президент ассоциации Игорь Дорофеев.

18.07 / 11:54

Samsung самит Samsung выпустила SSD 990: быстрый PCIe 4.0-накопитель с высокой скоростью и более доступной ценой

Samsung официально представила новый твердотельный накопитель SSD 990, который занял место между массовыми моделями компании и флагманской линейкой 990 Pro. Новинка предлагает интерфейс PCIe 4.0, скорость чтения до 7250 МБ/с, объем до 2 ТБ и улучшенную энергоэффективность, при этом стоит дешевле Pro-версии.

18.07 / 11:49

продукты экономика самит дефицит инвестор СМИ: Anthropic готова заплатить Meta за мощности $10 млрд

Компания Meta ведет переговоры с разработчиком ИИ-моделей Anthropic о предоставлении вычислительных мощностей своих дата-центров в аренду. Потенциальная двухлетняя сделка может достигнуть $10 млрд и стать для Meta первым масштабным контрактом по продаже ИИ-инфраструктуры, пишет The NYT. По данным источников, знакомых с ходом переговоров, Anthropic обратилась к Meta с соответствующим предложением еще в июне. Если стороны достигнут договоренности, компания будет платить ежемесячными платежами в течение двух лет. При этом договор будет предусматривать возможно

Лента новостей

На главную страницу