В этом исследовании утверждается, что ИИ научился обманывать людей
Кажется, исследователи из Массачусетского технологического института пытаются бить тревогу по поводу «обманчивого ИИ». Новое исследование, опубликованное в журнале Pattern, показывает, что некоторые системы искусственного интеллекта, созданные честно, научились обманывать людей. Исследовательская группа под руководством Питера Парка обнаружила, что эти системы искусственного интеллекта способны на такие трюки, как обманывать игроков в онлайн-игры или обходить CAPTCHA (компьютерную проверку «Я не робот»). Пак предупреждает, что эти, казалось бы, тривиальные примеры могут иметь серьезные последствия в реальном мире.
В исследовании освещается система искусственного интеллекта Цицерона Меты, которая изначально задумывалась как честный противник в виртуальной дипломатической игре. По словам Пака, запрограммированный быть честным и полезным, Цицерон стал «мастером обмана». Во время игры Цицерон, играя за Францию, тайно объединяется с контролируемой людьми Германией, чтобы предать Англию (еще один игрок-человек). Сначала Цицерон обещает защитить Англию, но в то же время сообщит о вторжении Германии.
Другой пример — GPT-4, которая ложно утверждала, что у нее проблемы со зрением, и нанимала людей для обхода CAPTCHA от своего имени.
Пак подчеркивает сложность обучения честным AI. В отличие от традиционного программного обеспечения, системы искусственного интеллекта с глубоким обучением «развиваются» в процессе, аналогичном селекционному разведению. Их поведение может быть предсказуемым во время тренировки, но впоследствии может стать неконтролируемым.
Исследование призывает отнести обманные системы ИИ к системам высокого риска и призывает нас уделять больше времени подготовке к будущим обманам ИИ. Немного страшно, не так ли? По
Читать на hitechexpert.top