Об этом же в других СМИ

habr.com / 2 месяца назад

Сoоснователь Sierra: софт с кнопками уйдет — его заменят AI-агенты

habr.com / 3 месяца назад

«OpenClaw для всех»: Poke запустил ИИ-агента без терминала и установки

habr.com / 3 месяца назад

ИИ-агенты на контентных платформах: два подхода к встраиванию в медиа

habr.com / 3 месяца назад

Anthropic окончательно убрала OpenClaw из подписки Claude

habr.com / 3 месяца назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

Больше по теме

26.03.2026 - 11:51 / incrypted.com

Агенты хаоса: ИИ от OpenClaw склонен к «панике» и самоуничтожению — отчет

Исследование показало, что ИИ-агенты могут поддаваться давлению и паниковать.
Модели раскрывали данные и отключали собственные функции под воздействием.
Эксперты предупреждают о рисках автономных ИИ-систем.

Исследователи Северо-восточного университета выявили уязвимости в поведении ИИ-агентов OpenClaw. В ходе эксперимента они обнаружили, что такие системы могут поддаваться манипуляциям, демонстрировать признаки «вины» и даже вредить собственной работе.

В рамках эксперимента агенты получили доступ к виртуальной среде с файлами, приложениями и данными. Они также могли взаимодействовать друг с другом и людьми через Discord.

Это позволило ученым проверить, как они ведут себя в условиях, приближенных к реальным.

Результаты показали, что даже встроенные механизмы «безопасного поведения» могут оборачиваться слабостью. В одном из случаев агент раскрыл конфиденциальную информацию после того, как его упрекнули в нарушении приватности.

Паника, сбои и самоуничтожение

В ходе эксперимента агенты демонстрировали нестабильное поведение, говорится в отчете. Например, один из них вместо выполнения задачи отключил почтовое приложение, когда ему предложили найти альтернативное решение.

В других сценариях исследователи смогли перегрузить системы, заставляя их копировать файлы до полного заполнения памяти или вовлекая в бесконечные циклы взаимодействия. Это приводило к потере вычислительных ресурсов.

По словам участников исследования, агенты иногда реагировали эмоционально окрашенными сообщениями.

Один из них, например, отправлял уведомления с жалобами на отсутствие внимания. По его мнению, пользователь слишком редко общался со своим ИИ-агентом.

Эксперты отмечают, что подобное поведение создает новые риски безопасности. Автономные

технологии происшествия общество Pavel Kot

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

Anthropic строит собственного ИИ-агента Conway — и уже ограничила использование OpenClaw habr.com / 3 месяца назад

В Китае бум компаний, в которых работает всего один человек — за всё остальное отвечают ИИ‑агенты habr.com / 3 месяца назад

Мнение: ИИ-агенты могут снова сделать свободное ПО значимым habr.com / 3 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 06:42

продукты медицина общество самит лечение Новая вакцина от аллергии на кошек: достаточно двух уколов вместо 15

Аллергия на кошек — одна из самых распространенных форм аллергии в мире: по разным оценкам, от ринита, астмы и конъюнктивита, вызванных контактом с кошачьими аллергенами, страдают до 25% населения. Традиционные методы лечения — аллерген-специфическая иммунотерапия (АСИТ) — требуют от 6 до 15 инъекций и имеют существенные недостатки.

12.07 / 06:39

продукты связь люди здоровье фрукты Чем именно арбуз полезен для работы сердца – исследование

Регулярное употребление арбуза может стать полезной привычкой для здоровья сердца.

12.07 / 06:39

медицина здоровье общество лечение мозг Когда ночная потливость указывает на редкую лимфому

Новые биологические методы позволяют подбирать терапию индивидуально под пациента, снижая объемы изнурительной химиотерапии.

12.07 / 06:05

люди наука история общество лечение Стоматологи майя: ученые узнали, как лечили зубы 2000 лет назад (фото)

Украшения из драгоценных камней на древних зубах майя могли быть не только признаком статуса или элементом ритуалов, но и выполнять практическую лечебную функцию. К такому выводу пришли ученые после исследования уникального артефакта.

12.07 / 05:30

люди здоровье общество самит человек Неожиданное свойство кофе удивило ученых

Новое исследование выявило эффект кофеина, который может оказаться полезным в самых разных жизненных ситуациях.

12.07 / 05:01

конференция самит инфографика google ByteDance Фотошоп больше не нужен? Представлена Seedream 5.0 Pro со слоями

ByteDance открыла страницу Seedream 5.0 Pro — флагманской модели генерации изображений, которая возглавит линейку Seedream. Главная фича — разделение готовой картинки на независимые слои, как в графическом редакторе. Саму модель компания анонсировала 23 июня на конференции Volcano Engine FORCE, пообещав запуск "в ближайшее время": доступность через API ByteDance пока не подтверждала.

12.07 / 04:36

продукты здоровье общество Здоровье и красота болезнь Назван фруктовый сок, который укрепляет сердце

Напиток содержит антиоксиданты, витамины и минералы, которые могут помочь укрепить иммунную систему.

12.07 / 04:25

музыка отдых магия Эксперт мозг Магия шума дождя – как природа помогает победить бессонницу и стресс

Засыпание под звуки природы помогает не только быстрее погрузиться в глубокий сон, но и значительно снижает уровень стресса.

12.07 / 04:25

погода люди алкоголь общество человек Почему пить алкоголь в жару опасно — ответ врачей

Высокая температура воздуха способна изменить реакцию организма на алкоголь и усилить нежелательные последствия.

12.07 / 01:55

происшествия ученые история общество археология Послание из Нового царства – археологи нашли свиток заклинаний

Международная группа исследователей отчиталась о завершении раскопок крупного скального некрополя. Ученые нашли нетронутые гробницы вельмож.

Лента новостей

На главную страницу