



В ChatGPT обнаружили еще один недостаток
Исследователи обнаружили, что часть защитных механизмов ChatGPT можно обойти с помощью измененных запросов.
Специалисты в области кибербезопасности заявили, что обнаружили способ обхода некоторых ограничений системы генерации изображений ChatGPT. По их словам, определенные формулировки запросов могут приводить к созданию контента, который обычно должен блокироваться встроенными механизмами защиты.
Исследование провела британская компания Mindgard. Эксперты утверждают, что в ходе тестирования им удалось получить изображения нежелательного характера, используя измененные версии обычных текстовых запросов.
По словам авторов работы, проблема связана с особенностями обработки инструкций искусственным интеллектом. Даже незначительные изменения формулировок иногда позволяют обходить предусмотренные ограничения.
Отдельное внимание исследователи уделили рискам, связанным с созданием изображений, напоминающих реальных людей. По их мнению, такие возможности могут вызывать дополнительные вопросы в сфере безопасности и борьбы с дипфейками.
Сообщается, что результаты исследования были переданы разработчикам OpenAI еще весной. После этого компания внедрила дополнительные меры защиты, включая новые фильтры и механизмы проверки контента.
В OpenAI заявили, что продолжают совершенствовать систему безопасности. Однако исследователи считают, что полностью исключить подобные риски пока невозможно из-за постоянного появления новых способов обхода ограничений.
Эксперты отмечают, что развитие генеративного искусственного интеллекта сопровождается постоянной борьбой между создателями защитных механизмов и теми, кто пытается найти уязвимости в работе подобных систем.
Ранее "Курсор" писал, что ученые выяснили, сколько продержится человество, если
Читать на cursorinfo.co.il