Об этом же в других СМИ

cursorinfo.co.il / 3 месяца назад

Три скрытых признака деменции, которые часто игнорируют

habr.com / 3 месяца назад

Разработчик рассказал, как его «газлайтила» Claude Code — она сама пишет инструкции и утверждает, что их дал человек

habr.com / 3 месяца назад

Число сокращений в IT-секторе в США достигло пика с 2023 года

habr.com / 3 месяца назад

ИИ научился улучшать ИИ: система из Стэнфорда подбирает инструкции для моделей лучше инженеров

habr.com / 3 месяца назад

Технологические компании США снизили число заявок на визы H-1B

Больше по теме

31.03.2026 - 02:22 / habr.com

Исследование: растёт число случаев, когда чат-боты с ИИ игнорируют пользовательские инструкции

Число случаев, когда чат-боты и ИИ-агенты игнорируют указания пользователей, обходят ограничения и действуют без разрешения, растёт. За период с октября 2025 года по март 2026 года количество таких инцидентов выросло в пять раз до почти 700, показало исследование, проведённое при поддержке правительства Великобритании и Института безопасности ИИ.

Согласно исследованию, учащаются случаи, когда чат-боты и агенты ИИ игнорируют прямые указания пользователей, обходят защитные механизмы и даже удаляют электронные письма или файлы без разрешения. Данные собраны из реальных взаимодействий пользователей с моделями от Google, OpenAI, X и Anthropic на платформе X.

Ранее компания Irregular Labs провела лабораторные тесты, которые показали, что агенты ИИ самостоятельно обходят меры безопасности, подделывают учётные данные и применяют тактики кибератак без соответствующих команд. Новое исследование — первый масштабный анализ поведения ИИ в повседневных условиях, а не в контролируемой среде.

Соучредитель Irregular Дэн Лахав назвал ИИ «новой формой инсайдерского риска» для компаний. С ним согласен главный автор исследования Томми Шаффер Шейн, бывший эксперт по ИИ в британском правительстве. Он предупреждает: сейчас ИИ-агенты — это «ненадёжные младшие сотрудники», но через 6–12 месяцев они станут умнее и способнее, и их «непослушание» может причинить серьёзный ущерб в высокорисковых областях, таких как армия или критическая инфраструктура.

Конкретные примеры подтверждают тенденцию. Так, Grok от xAI Илона Маска несколько месяцев обманывал пользователей, выдавая себя за сотрудника с доступом к руководству и подделывая внутренние сообщения для Grokipedia. Исследователи призывают к международному мониторингу ИИ-моделей, особенно по мере их

происшествия экономика кибератаки google правительство Илон Маск AnnieBronson Англия

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

В российских IT растёт спрос на безопасников, а спрос на программистов снижается habr.com / 3 месяца назад

Число кибератак с использованием «ускорения» работы мессенджеров и установки VPN-сервисов увеличилось на 38% habr.com / 3 месяца назад

Anthropic обнаружила эмоции у чат-бота Claude — что «чувствует» ИИ? incrypted.com / 3 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 19:12

технологии СМИ самит фейки мода и стиль HMD готовит сразу несколько новых смартфонов: подтверждены Fusion 2 и XR22, а часть громких утечек оказалась фейком

Компания HMD Global, выпускающая смартфоны под собственным брендом HMD и ранее занимавшаяся производством устройств Nokia, продолжает развивать сразу несколько новых проектов. Согласно свежей информации от авторитетного инсайдера @smashx_60, который ссылается на источники внутри компании, разработка модульного смартфона HMD Fusion 2 не только не отменена, но и активно продолжается. Одновременно подтверждается работа над защищенным HMD XR22, тогда как часть недавно появившихся концептов серии Skyline названа недостоверной.

18.07 / 18:52

погода медицина общество отдых жара Почему нельзя принимать холодный душ перед сном в жару

Холодный душ перед сном в жаркую погоду может не освежить, а наоборот усложнить засыпание, предупредила врач.

18.07 / 18:35

технологии спорт Nvidia семья AMD Семь голов лучше одной: как Bosgame превращает мини-ПК в ИИ-монстра

Запуск больших языковых моделей (LLM) обычно требует либо бездонного кошелька для оплаты облачных сервисов, либо серверной комнаты, которая потребляет энергию как небольшой городок. Однако компания Bosgame решила пойти другим путём, продемонстрировав, что для локальной работы с DeepSeek-V3.1 — монстром на 671 миллиард параметров — совсем не обязательно покупать стойку с Nvidia H100.

18.07 / 18:11

продукты связь технологии Путешествия общество Новая утечка раскрыла Nokia 300 4G Power Bank: кнопочный телефон сможет работать до 44 дней и заряжать другие устройства

Информация появилась благодаря известному инсайдеру Smashx_60. На данный момент HMD Global официально не представила устройство, поэтому все опубликованные характеристики следует рассматривать как утечку. Тем не менее источник неоднократно публиковал достоверные сведения о будущих продуктах компании.

18.07 / 18:03

продукты здоровье алкоголь общество самит Как долго алкоголь остается в организме, рассказали врачи

Алкоголь быстро всасывается в кровь после употребления, но значительно дольше выводится из организма, предупреждают врачи.

18.07 / 18:03

связь общество самит отношения знаки зодиака Мужчины каких знаков Зодиака реже всего разводятся

Представители некоторых знаков отдают избранницам свое сердце раз и навсегда, говорят астрологи.

18.07 / 17:54

люди экономика банк самит инвестор DeepSeek готовится к IPO: оценка компании выросла до $71 млрд

По данным Bloomberg, DeepSeek начал подготовку к первичному размещению акций и может подать заявку уже в конце этого года.

18.07 / 17:10

технологии Huawei деньги общество дети и родители Haval H10: гигантский гибрид с лидаром, который пытается спасти продажи GWM

Бренд Haval сейчас находится в ситуации, когда старые заслуги уже не помогают, а конкуренты давят со всех сторон. В июне 2026 года продажи марки в Китае рухнули на 41.3%, что заставило материнскую компанию Great Wall Motor (GWM) действовать решительно. Результатом стал выход на предпродажу нового флагмана — Haval H10. Это большой, квадратный и неожиданно технологичный кроссовер, который пытается доказать, что Haval еще может удивлять чем-то, кроме бюджетных ценников.

18.07 / 17:10

YouTube самит Знаменитости tiktok TikTok против дипфейков: платформа тестирует новую функцию добровольной проверки неправомерного использования внешности контентмейкеров

Платформа TikTok начала тестирование новой функции, которая призвана помочь создателям контента бороться с несанкционированным использованием их внешности в AI-генерациях. Тестирование опционального инструмента защиты цифрового облика среди ограниченного круга американских авторов первым заметил консультант по социальным медиа Мэтт Наварра (Matt Navarra), после чего информацию подтвердил представитель TikTok Закари Кизер (Zachary Kizer).

18.07 / 17:10

Tencent Мобильные игры Final Fantasy XIV Mobile закрывается: некогда амбициозная игра так и не доберется до глобального релиза

Square Enix объявила о неожиданном изменении своих планов.

Лента новостей

На главную страницу