Об этом же в других СМИ

habr.com / 1 год назад

Cloudflare упрощает отслеживание подлинных изображений в Интернете

habr.com / 1 год назад

Конкуренция между ChatGPT и Deepseek: кто лидирует на рынке чат-ботов с искусственным интеллектом?

habr.com / 1 год назад

Microsoft формирует новое подразделение для изучения влияния искусственного интеллекта

habr.com / 1 год назад

Microsoft расследует сбой с доступом к службам Microsoft 365

hitechexpert.top / 1 год назад

VPN в Microsoft Defender будет отключен в конце февраля

Больше по теме

18.01.2025 - 11:45 / habr.com

Microsoft исследует безопасность AI: выявление уязвимостей и этических вызовов в генеративных системах

С 2021 года команда Microsoft по безопасности AI протестировала свыше 100 продуктов с генеративным AI для выявления уязвимостей и этических вопросов. Их выводы ставят под сомнение некоторые устоявшиеся представления о безопасности AI и подчёркивают важность человеческого участия.

Оказалось, что наиболее эффективные атаки не всегда самые сложные. «Настоящие хакеры не вычисляют градиенты, они используют социальную инженерию», — говорится в исследовании, на которое Microsoft ссылается в своём отчёте, сравнивая исследования в области безопасности AI с реальной практикой. В одном из тестов команда обошла защиту генератора изображений, спрятав вредоносные инструкции в текстовом описании изображения, без сложных математических расчётов.

Хотя Microsoft разработала PyRIT, инструмент с открытым исходным кодом для автоматизации тестирования безопасности, команда подчёркивает, что человеческое суждение незаменимо. В ходе тестирования стало ясно, насколько эффективно чат-боты могут решать сложные задачи, особенно когда речь идёт о взаимодействии с людьми, которые находятся в уязвимом эмоциональном состоянии. Оценка таких сценариев требует как знаний психологии, так и понимания потенциальных последствий для психического здоровья.

При изучении предвзятости AI команда также опиралась на человеческую интуицию. В одном из случаев они исследовали гендерную предвзятость в генераторе изображений, создавая изображения профессий без указания пола.

Внедрение AI в повседневные приложения выявило новые уязвимости. В одном из тестов команда заставила языковую модель создавать реалистичные сценарии мошенничества. В сочетании с технологией преобразования текста в речь это позволило создать систему, способную взаимодействовать с людьми пугающе

продукты технологии культура самит профессия Психология и отношения mefdayy Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Microsoft: устаревшие серверы Exchange не могут автоматически устранять ошибки безопасности habr.com / 1 год назад

Напряжённость в отношениях между OpenAI и Microsoft: что стоит за разрывом партнёрства habr.com / 1 год назад

Билл Гейтс: «Это одна из самых важных книг об искусственном интеллекте, когда-либо написанных» habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 03:26

происшествия ученые автомобиль мода и стиль Как быстро выехать из пробки на авто - ответ ученых удивит

Исследователи назвали эффективный способ, благодаря которому можно быстро покинуть пробку без агрессивного вождения автомобиля.

16.07 / 03:26

люди здоровье общество банк болезнь Какое количество кофе может повысить риск сердечного приступа

В больших количествах кофеин создает нагрузку на сердце и может навредить сосудам.

16.07 / 03:20

Facebook технологии Apple общество reddit Владельцы iPhone пожаловались на проблемы с автономностью и перегревом устройств после установки обновления iOS 26.5.2

Владельцы iPhone столкнулись с быстрой разрядкой аккумулятора и перегревом устройств после установки обновления iOS 26.5.2. Apple выпустила 29 июня 2026 года апдейт, который исправил более 25 уязвимостей, в том числе в ядре и других важных областях операционной системы, связанных с открытым браузерным движком WebKit.

16.07 / 01:17

происшествия люди ученые наука общество Сколько людей на самом деле может прокормить Земля – ученые

Эксперты заявили о начале опасной фазы для всего человечества. Ресурсы планеты больше не могут покрывать нужды растущего населения Земли.

16.07 / 00:45

Apple Nvidia самит google Broadcom Apple ведет переговоры о приобретении производителей чипов для искусственного интеллекта

Apple рассматривает возможность приобретения компаний, занимающихся разработкой полупроводников для искусственного интеллекта. По данным The Information, компания уже ведет переговоры с производителями чипов и финансовыми консультантами о возможных сделках.

16.07 / 00:45

Facebook Samsung технологии LinkedIn Amazon Amazon Music станет стандартным приложением на новых устройствах Samsung Galaxy: что изменится для пользователей

Компания Samsung объявила о расширении списка приложений, которые будут предварительно установлены на смартфонах и планшетах Galaxy. В скором времени к нему присоединится сервис Amazon Music, который автоматически появится на новых устройствах производителя.

16.07 / 00:42

связь медицина люди здоровье общество Все начинается со стула: одна распространенная привычка приближает рак

Новое масштабное исследование с участием почти 100 тысяч человек подтвердило связь между непрерывным сидячим образом жизни и риском развития рака.

15.07 / 23:46

технологии смартфон самит гаджет Почему смартфон заряжается медленно: дело может быть не в кабеле

При покупке кабеля для смартфона специалисты советуют учитывать не только его длину, но и качество изготовления.

15.07 / 22:13

экономика общество семья самит психология Простая вещь, которую мужчины не могут понять о зрелых женщинах

Писательница Ким Петерсен объяснила, почему кризис среднего возраста у женщин — это не капризы или менопауза, а глубокая перестройка всей жизни.

15.07 / 22:10

Samsung технологии здоровье история общество В сеть утекли официальные изображения всех новинок Samsung перед Galaxy Unpacked

Если информация подтвердится, уже 22 июля на мероприятии в Лондоне компания представит сразу несколько флагманских устройств нового поколения: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, Galaxy Watch9 и Galaxy Watch Ultra 2. На данный момент речь идет об утечке, однако опубликованные изображения выглядят как официальные маркетинговые рендеры и совпадают с более ранними инсайдерскими данными.

Лента новостей

На главную страницу