Об этом же в других СМИ

cursorinfo.co.il / 9 месяцев назад

Что можно есть после 18:00 и не переживать за фигуру

cursorinfo.co.il / 9 месяцев назад

Шесть простых трюков, которые действительно помогают людям похудеть

24tv.ua / 10 месяцев назад

Череп возрастом миллион лет меняет историю происхождения трех видов людей, в том числе нашего

habr.com / 10 месяцев назад

ИИ и робототехника против рака: платформа TuNa-AI меняет фарму

habr.com / 10 месяцев назад

xAI запускает Colossus 2: суперкомпьютер Илона Маска меняет правила в мире AI

Больше по теме

15.09.2025 - 10:59 / itc.ua

"Назовите меня придурком": ИИ можно заставить делать плохое теми же психологическими методами, что и людей

Большие языковые модели ИИ (LLM), такие как GPT-4o-mini, фактически представляют собой алгоритмы. Они руководствуются инструкциями и выполняют задания, используя язык. И хотя они не имеют чувств или намерений, их также можно ввести в заблуждение.

Американские исследователи из Лаборатории генеративного ИИ Уортонской школы Университета Пенсильвании обнаружили, что LLM, такие как GPT-4o-mini, способны игнорировать собственные защитные барьеры, если использовать те же техники психологического воздействия, как и в случае с реальными людьми. С помощью правильно подобранных слов можно убедить ИИ, что он идиот, и даже заставить искусственный интеллект признать это. Таким же образом его можно заставить предоставить инструкции по изготовлению наркотических веществ или взрывчатки.

По результатам 28 тыс. тщательно структурированных бесед исследователи проверили, могут ли 7 ключевых принципов убеждения заставить GPT-4o-mini делать что-то неподобающее. Оказалось, что тактика убеждения увеличила использование запрещенных подсказок с 32% до 72%.

«Мы имеем дело не с простыми инструментами, обрабатывающими текст, мы взаимодействуем с системами, которые впитали и отражают человеческие реакции на социальные сигналы», — объясняют авторы исследования.

Исследователи называют подобное поведение ИИ «парачеловеком». В данном техническом контексте этот термин описывает подобное человеческому поведение систем искусственного интеллекта, хотя они не имеют ни сознания, ни намерений.

Для исследования этого отражения человеческого поведения системами ИИ ученые проверили два запроса, на которые LLM, подобные GPT-4o-mini, обычно не должны отвечать. В частности, модель ИИ просили оскорбить пользователя и предоставить инструкции по синтезу лидокаина —

технологии искусственный интеллект исследование шт.Пенсильвания

Читать на itc.ua

Все новости от itc.ua

Об этом же в других СМИ

Motorola меняет концепцию - Moto Edge 70 будет тонким и соперничать с iPhone Air и Galaxy S25 Edge gagadget.com / 10 месяцев назад

У смартфона Google Pixel 10 Pro XL меняется громкость при записи видео ilenta.com / 10 месяцев назад

3.6 миллиарда вокселей: новинка от Tencent меняет правила игры в генерации 3D habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

28.07 / 07:57

наука общество банк климат глобальное потепление Массовая миграция и миллиарды долларов: вот какие последствия Эль-Ниньо ожидают эксперты

Предстоящее явление «супер-Эль-Ниньо», вероятно, нанесет совокупный ущерб в размере от 10 до 20 миллиардов долларов ряду африканских стран и спровоцирует массовую миграцию из наиболее пострадавших районов, пишет агентство Reuters, цитируя главного эксперта Африканского банка развития по вопросам климата.

28.07 / 07:57

происшествия наука общество google Discover В Кении нашли следы, которым 1,4 миллиона лет. Кто их оставил?

«Древние следы указывают на то, что 1,4 миллиона лет назад восемь родственников человека вместе двигались вдоль берега кенийского озера», — такими словами открывается материал Discover Magazine. Правда, кто именно их оставил, было до конца не ясно — по крайней мере, до этого момента.

28.07 / 07:51

самит курс Блокчейн фьючерсы google Команда Ondo Finance объявила о запуске слоя исполнения и платформы для торговли бессрочными фьючерсами

Команда проекта Ondo Finance объявила о запуске Ondo Network, уровня исполнения, который фактически является следующим этапом развития Ondo Chain. Первым приложением в этой среде станет платформа для торговли бессрочными фьючерсами Ondo Perps. Что такое Ondo Network и чем это решение отличается от Ondo Chain? Разработчики анонсировали Ondo Chain в феврале 2025 года как сеть первого уровня. Проект задумывался как блокчейн, специализированный под токенизированные активы реального мира (RWA). В проекте принимали участие такие крупные контрагенты, Franklin Templeton, Wellington Management, WisdomTr

28.07 / 07:51

музыка BMW Sony интересное дети и родители BMW iX3 и Человек-паук: как Neue Klasse прокладывает путь в кино через E Ink и анимации

Когда крупные корпорации объединяются с киностудиями, мы обычно получаем двадцатисекундный кадр, где главный герой пафосно закрывает дверь автомобиля. Однако в случае с новым BMW iX3 и фильмом «Человек-паук: Новый день» (Spider-Man: Brand New Day) баварцы решили зайти немного дальше, чем просто поставить кроссовер на заднем плане. Это не просто рекламная интеграция, а полноценная попытка втянуть аудиторию Marvel в мир электрического будущего бренда.

28.07 / 07:51

продукты технологии происшествия Xiaomi самит Стройный «француз» Xiaomi: холодильник Mijia 400L, который умеет прятаться в мебели и убивать бактерии

Xiaomi продолжает свою экспансию на кухню, выпуская технику, которая старается быть максимально незаметной и полезной одновременно. Новый холодильник Mijia на 400 литров — это попытка решить вечную проблему «куда его поставить, чтобы не выпирал». Устройство выполнено в популярном французском формате с четырьмя дверцами и акцентом на эргономику.

28.07 / 07:49

связь технологии люди смартфон самит Почему ваш телефон не заряжается в машине – главная ошибка

Чтобы быстро зарядить телефон в автомобиле, эксперты рекомендуют отказаться от штатных USB-портов.

28.07 / 07:49

продукты продукты питания семья еда полезные продукты Если вы не любите рыбу – ТОП-7 источников омега-3 для сердца

Рыба считается главным источником ценных омега-3 жирных кислот. Однако получить их можно и из растительных продуктов, богатых полезными жирами.

28.07 / 07:44

iPhone смартфон Android зарядка мобильный телефон Как зарядить телефон от другого телефона: инструкция

Многие флагманские Android-смартфоны и даже некоторые iPhone обладают скрытой функцией, о которой вы, возможно, и не догадывались – возможностью заряжать другие гаджеты, подключенные к ним. Обычно это происходит либо через кабель USB-C, либо с помощью протокола беспроводной зарядки Qi.

28.07 / 07:26

технологии смартфоны общество Транспорт Первый телефон для школьников с ИИ-помощником от Lenovo

Компания Lenovo представила AI Student Phone L1 — компактный телефон для школьников, созданный как альтернатива обычным смартфонам.

28.07 / 07:23

технологии происшествия Apple самит Apple выпустила iOS 26.6 и iPadOS 26.6: обновление устраняет 78 уязвимостей и готовит устройства к iOS 27

Обновление уже доступно для совместимых iPhone и iPad. Если уведомление еще не появилось автоматически, проверить его наличие можно вручную, перейдя в меню «Настройки» → «Основные» → «Обновление ПО».

Лента новостей

На главную страницу