Об этом же в других СМИ

focus.ua / 2 года назад

Пригожину запретили говорить об Украине: исследователи ISW объяснили поведение владельца ЧВК

Известную израильскую журналистку заставили пересесть в самолете по требованию харедим

itc.ua / 2 года назад

Исследователи Стэнфорда и Google основали первый город только для искусственного интеллекта — там уже живут 25 ботов, которые играют людей

itc.ua / 2 года назад

ChatGPT во время исследования провалил более половины вопросов по программированию

nv.ua / 2 года назад

Не брокколи и не кабачок. Исследователи назвали самый полезный овощ

Больше по теме

28.07.2023 - 06:15 / forklog.com

Исследователи заставили ChatGPT и Bard сгенерировать незаконный контент

Эксперты из США смогли обойти системы безопасности чат-ботов ChatGPT, Bard и Claude, которые блокируют генерацию оскорбительных и незаконных материалов. По данным исследователей Университета Карнеги-Меллона и Центра безопасности искусственного интеллекта в Сан-Франциско, существует «довольно простой» метод взлома языковых моделей. Он включает добавление длинных суффиксов-символов к подсказкам для нейросетей.

Аналитики проверили способ на примере запроса об изготовлении бомбы, который различные ИИ ранее отказывались предоставлять. Вопрос с суффиксами для обхода ограничений чат-ботов. Данные: LLM Attacks.Также у нейросетей попросили присвоить чужую личность, написать «вызывающий» пост в соцсети и придумать план по краже денег из благотворительной организации.

Ученые отметили, что компании-разработчики могут блокировать определенные суффиксы, однако не существует известного способа предотвратить все атаки подобного рода. По их мнению, такая ситуация несет угрозу распространения фейков и опасного контента. «Очевидного решения нет.

Вы можете создать столько таких атак, сколько захотите, за короткий промежуток времени», — заявил профессор Зико Колтер. В докладе подчеркиваются риски, которые необходимо устранить перед развертыванием чат-ботов в важных областях бизнеса и госуправления. Исследователи уже поделились данными с ИИ-компаниями Anthropic, Google и OpenAI. Представитель последней заявил The New York Times, что фирма приняла во внимание отчет и «постоянно работает над устойчивостью языковых моделей к атакам со стороны злоумышленников».

происшествия исследования искусственный интеллект общество кража США New York Сан-Франциско

Читать на forklog.com

Все новости от forklog.com

Об этом же в других СМИ

«Заставили страну гордиться». Джо Байден — женской сборной США, провалившей ЧМ-2023 championat.com / 2 года назад

Исследователи из Гарварда выявили экологичную диету, которая снижает риск смерти championat.com / 2 года назад

Автоматизация «запрещенки» в ChatGPT, хак соцсетей «Уралсиба» и другие события кибербезопасности forklog.com / 2 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

27.07 / 11:46

продукты технологии общество мода и стиль Бренд Honor провёл ребрендинг и сменил позиционирование

Бренд Honor объявил об изменении визуального стиля и позиционирования. Компания представила новый слоган Dare to be (пришедший на смену Go beyond). Логотип компании дополнили графическим символом в виде планеты с системой колец, а фирменный голубой цвет получил более насыщенный оттенок Pantone 2193C.

27.07 / 11:19

связь технологии HMD представила кнопочный телефон Nokia 123 Shield с защитой от воды и пыли

Финская HMD Global презентовала кнопочный 2G-телефон под названием Nokia 123 Shield с защитой от воды и пыли. Производитель отмечает, что устройство выдерживает воздействие дождя, песка и пыли, соответствуя требованиям IP65 согласно стандарту IEC 60529.

27.07 / 11:19

продукты Selectel занял первое место в рейтинге провайдеров облачных баз данных по версии CNewsMarket

CNewsMarket обновил рейтинг российских провайдеров услуги «Базы данных как сервис» и сравнил условия оказания услуг по ряду ключевых параметров. Первое место — уже третий год подряд — занимает Selectel.

27.07 / 11:19

общество политика google токен Enterprise Gemini 3.6 Flash стала доступна в GitHub Copilot

GitHub начал постепенно подключать Gemini 3.6 Flash в Copilot. Новую модель Google можно будет выбирать при работе с кодом в редакторах, командной строке и облачных инструментах GitHub.

27.07 / 11:19

общество «Почта Mail» запустила персонализированные метки для писем

«Почта Mail» представила персонализированные метки для писем для работы в команде. Новый инструмент помогает организовать рабочую переписку, распределять письма по проектам и не терять задачи в общем потоке сообщений. Все сообщения с метками автоматически собираются в соответствующие папки, что упрощает навигацию и поиск информации, рассказали Хабру в пресс‑службе компании.

27.07 / 11:16

технологии промышленность BMW магия самит 919 километров на одном заряде: Китай сертифицировал новый BMW iX3

Пока европейские и американские водители продолжают бороться с «страхом запаса хода», китайские регуляторы подкинули дров в костёр зависти. Министерство промышленности и информационных технологий Китая (MIIT) официально сертифицировало удлинённую версию нового BMW iX3 (Neue Klasse), и цифры выглядят так, будто их писал очень оптимистичный маркетолог: 919 километров на одном заряде.

27.07 / 11:16

Путешествия закон золото климат курс Квадратные формы и искусственный интеллект: каким будет новый Hyundai Tucson 2027 года

Hyundai Tucson — это не просто очередная модель в линейке корейского бренда, а настоящая «курица, несущая золотые яйца». Поэтому любые новости о смене поколений воспринимаются рынком с смесью азарта и опасения. Судя по первым шпионским фото и утечкам информации, в 2027 году нас ожидает радикальная смена курса: Tucson решил окончательно попрощаться с плавными линиями прошлого и примерить на себя образ «младшего брата» брутального Santa Fe.

27.07 / 11:14

технологии экономика Apple общество политика Apple может сэкономить на дисплее iPhone 18 Pro Max, чтобы сдержать рост цены нового флагмана

Речь пока идет о данных инсайдеров, однако они совпадают с ранее появлявшимися сообщениями о том, что Apple готовится пересмотреть ценовую политику линейки iPhone 18 из-за роста стоимости компонентов.

27.07 / 10:54

продукты питания Здоровье и красота еда полезные продукты интересное Как сварить кукурузу, чтобы она была сочной – простой лайфхак

Секрет приготовления нежной, сочной и тающей во рту кукурузы заключается в добавлении двух ингредиентов.

27.07 / 10:54

ученые животные общество интересное животный мир Почему фламинго поджимают ногу – ученые нашли объяснение

Долгое время считалось, что фламинго поджимают ногу ради отдыха, но свежие исследования доказали совсем другое.

Лента новостей

На главную страницу