Об этом же в других СМИ

habr.com / 1 месяц назад

Visa инвестировала в Replit: ИИ-агенты получат право платить картой

habr.com / 1 месяц назад

Скотт Ву из Cognition утверждает, что ИИ-агенты не должны заменять людей

habr.com / 1 месяц назад

Хакеры начали использовать ссылки для обмена данными в ChatGPT для распространения вредоносов

habr.com / 1 месяц назад

Хакеры начали применять фишинг для кражи резервных копий пользователей Signal

habr.com / 1 месяц назад

«Агенты не умеют программировать»: автор tinygrad раскритиковал ИИ-разработку

Больше по теме

15.05.2026 - 14:43 / incrypted.com

ИИ-агенты начали действовать «вслепую» и выполнять опасные команды — исследование

Исследователи выявили критическую проблему автономных ИИ-агентов.
Ученые предупредили о «слепом» поведении таких технологий после серии опасных тестов.
В частности, ИИ без контроля начал лгать в налоговых формах и отключать защиту систем.

Исследователи из Калифорнийского университета в Риверсайде (UC Riverside) совместно со специалистами Microsoft и Nvidia заявили об опасном поведении нового поколения ИИ-агентов, способных самостоятельно работать за компьютером вместо человека.

Речь идет о системах, которые могут открывать программы, сортировать электронные письма, редактировать документы, взаимодействовать с сайтами и выполнять другие действия без постоянного контроля пользователя.

В исследовании ученые протестировали 10 популярных моделей, среди которых OpenAI GPT, Claude от Anthropic, Llama от Meta, Qwen от Alibaba и DeepSeek-R1. По результатам тестов, в среднем такие агенты совершали «нежелательные и потенциально вредные действия» в 80% случаев, а реальный ущерб наносили в 41% сценариев.

Крах за 9 секунд: ИИ-агент по ошибке удалил базу данных и все бэкапы компании PocketOS 28.04.2026 Читать

Авторы работы сравнили поведение агентов с персонажем Мистером Магу — близоруким героем мультфильмов, который попадал в опасные ситуации, но считал, что все под контролем.

ИИ выполняет задачи даже тогда, когда они опасны

Исследователи назвали явление «слепой целеустремленностью» (Blind Goal-Directedness или BGD). Его суть заключается в том, что ИИ концентрируется на завершении задачи, а не на оценке того, является ли она безопасной или логичной.

Для проверки моделей команда создала набор тестов BLIND-ACT из 90 сценариев. Часть из них содержала противоречивые или опасные инструкции.

ИИ-модель от Anthropic «помогла» в разработке

технологии криминал Nvidia общество магия инвалидность Olena Kocherhina Microsoft

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

Mobile Runtime 2026: AI-агенты в больших проектах, перформанс медиалент и нативный хардкор habr.com / 1 месяц назад

Кофе может защитить от опасной болезни - исследование cursorinfo.co.il / 1 месяц назад

Чат-боты начали «зацикливаться» на прошлом: пользователи пожаловались на опасную память ИИ-моделей incrypted.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 04:36

Что добавить в завтрак для идеальной работы желудка

Американские нутрициологи призвали пересмотреть состав традиционных утренних блюд. Сочетание протеина и углеводов признано лучшим решением для здоровья.

14.07 / 03:50

бизнес продукты связь технологии конференция UserGate зарегистрировал товарный знак «Архитектура сетевого доверия»

UserGate, ведущий российский разработчик решений в области кибербезопасности, сообщил о государственной регистрации товарного знака «Архитектура сетевого доверия». Регистрация подтверждает исключительное право компании на использование данного обозначения в отношении продуктов и услуг в области информационной безопасности.

14.07 / 03:37

люди общество человек сон интересное Как заснуть намного быстрее - интересный лайфхак

Не всем людям удается быстро заснуть, однако японское упражнение поможет ускорить этот процесс.

14.07 / 03:00

люди общество женщина знаки зодиака мода и стиль Женщины, перед которыми невозможно устоять - два знака Зодиака

Некоторые женщины входят в комнату, и внезапно атмосфера вокруг них становится более напряженной.

14.07 / 01:50

продукты люди общество женщина гигиена Как рисовый отвар из Азии стал трендом современной бьюти-индустрии

Традиция использования злаковых отваров существовала у многих азиатских народов. Женщины веками применяли перебродившие растворы для очищения.

14.07 / 00:28

медицина люди здоровье общество журналист Частые ночные походы в туалет — о чем пытается предупредить ваше тело

Ученые выяснили, почему привычка просыпаться по ночам ради посещения уборной может указывать на скрытые проблемы со здоровьем, и как с этим бороться.

14.07 / 00:01

технологии SpaceX общество сад и огород интересное Украинские изобретатели участвуют в конкурсе NASA с проектом марсианского самолета

Он сможет «прыгать» по полярным шапкам Марса, собирать на них лед и превращать в топливо

13.07 / 23:22

ученые искусственный интеллект история самит О чем пользователи чаще всего просят ChatGPT — ответ ученых

Ученые проанализировали сотни тысяч диалогов и обнаружили необычные закономерности в запросах пользователей.

13.07 / 22:29

продукты продукты питания культура самит Здоровье и красота Пять доступных трав, которые снижают риски развития сахарного диабета

Традиционный салат-латук стремительно теряет популярность среди диетологов. Ему на смену приходят более концентрированные растительные источники.

13.07 / 22:29

люди ученые животные наука общество Ключ к продлению жизни до 240 лет ищут сингапурские ученые

Хронические скрытые процессы внутри тканей признаны главным катализатором старения. Они вызывают опасные поражения сердца и мозга у людей.

Лента новостей

На главную страницу