Об этом же в других СМИ

habr.com / 2 года назад

Microsoft выпустит предварительную версию Copilot в Intune 1 апреля

habr.com / 2 года назад

Microsoft прекратила рекламировать Edge в Windows 11 и 10 при изменении настроек по умолчанию

habr.com / 2 года назад

Microsoft начала блокировать промпты, которые позволяют создавать запрещённые изображения

habr.com / 2 года назад

Microsoft переименовала проект своего дистрибутива Linux под названием CBL-Mariner в Azure Linux

habr.com / 2 года назад

Microsoft анонсировала рекламное API с сохранением конфиденциальности для Edge

Больше по теме

28.02.2024 - 15:33 / habr.com

Microsoft представила проект PyRIT для генерации вредоносных запросов при тестировании ИИ-моделей и оценке их реакций

Microsoft выпустила набор инструментов Python Risk Identification Toolkit для генеративного искусственного интеллекта (PyRIT). Этот инструмент использует команда AI Red Team для проверки рисков в системах искусственного интеллекта, включая Copilot.

PyRIT может генерировать тысячи вредоносных запросов для тестирования модели искусственного интеллекта нового поколения и оценивать её реакцию.

В 2023 году Microsoft объединила более 60 высокоценных систем искусственного интеллекта, благодаря чему стало ясно, что этот процесс сильно отличается от классической разработки софта или ИИ. Так, помимо обычных рисков безопасности процесс должен гарантировать, что модель не генерирует вредоносный контент или дезинформацию.

Кроме того, модели искусственного интеллекта сильно различаются по архитектуре, и на основе одних и тех же обучающих данных можно получить разные результаты. Это затрудняет поиск единого оптимизированного процесса, подходящего для всех моделей.

Ручная проверка всех рисков оказывается трудоёмким и медленным процессом. Microsoft утверждает, что автоматизация поможет командам выявлять рискованные области, требующие большего внимания.

Набор инструментов отправляет вредоносный запрос в генеративную систему искусственного интеллекта, а при получении ответа агент выставляет модели оценку. Она используется для отправки нового запроса.

PyRIT поддерживает различные формулировки целей генеративного ИИ, а также текстовый ввод и может быть расширен и для других модальностей. Набор предлагает интеграцию с моделями из службы Microsoft Azure OpenAI и Hugging Face.

Используя наборы данных, специалисты по безопасности кодируют то, что они хотят проверить в системе. Это может быть либо статический набор вредоносных запросов, либо

искусственный интеллект модели оценка maybeelf Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Вышел PowerToys 0.79 habr.com / 2 года назад

В Microsoft Copilot добавили плагины для Suno, Adobe Express и Spotify habr.com / 2 года назад

Microsoft представила новый нейронный голосовой инструмент для людей с нарушениями речи на саммите Abili gagadget.com / 2 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 12:05

технологии самит техника гаджет Dell Красная лампочка на веб-камере: когда стоит насторожиться

Специалисты рассказали, какие сигналы веб-камеры нельзя игнорировать и что стоит проверить в первую очередь.

14.07 / 12:05

погода технологии смартфон общество гаджет Перегрев смартфона скрывает опасность, о которой знают не все

Даже привычные действия в жаркую погоду способны ускорить износ смартфона и привести к неприятным последствиям.

14.07 / 12:01

общество курс Disney звезда интересное Большой успех маленькой Мыши: продажи шутера MOUSE: P.I. For Hire превысили 1 миллион копий

С момента анонса нестандартного нуарного шутера MOUSE: P.I. For Hire он вызывал большой интерес публики — очень уж интересно выглядела стилизация игры под классические мультфильмы Disney 30-х годов, при этом она дополнена мрачным ироничным сюжетом, динамичным геймплеем и нестандартным сочетанием 2D и 3D-графики.

14.07 / 11:57

технологии Apple СМИ закон Telegram Проект Telega завершил возврат средств за подписку «Телега Плюс»

Администрация альтернативного клиента Telegram под названием Telega сообщила, что завершён процесс автоматического возврата средств пользователям за подписку «Телега Плюс». Тем пользователям, кто оформил подписку на Telega после 27 мая 2026 года, должны были вернуть полную стоимость. Если подписку купили до 27 мая на три месяца, сумму возврата рассчитали с учётом вычета оплаты за услуги за предыдущий месяц.

14.07 / 11:57

закон законодательство банк правосудие пресс-служба Верховный суд: ФССП обязана исключить ошибки при идентификации должников

Судебная коллегия по административным делам Верховного суда России при рассмотрении конкретного дела указала, что Федеральная служба судебных приставов (ФССП) обязана обеспечивать достоверность размещаемых данных и осуществлять надлежащий контроль, чтобы в информационные системы не попадали сведения о гражданах, ошибочно принятых за должников по исполнительному производству. Об этом пишет «Российская газета».

14.07 / 11:50

технологии происшествия общество самит протестующие В Сан-Франциско прошел масштабный протест против ИИ-гонки

11 июля 2026 года в Сан-Франциско состоялся протест, организованный участниками движения Stop the AI Race. В нем приняли участие около 200 человек, которые прошли маршем у офисов компаний OpenAI, Anthropic и Google DeepMind, сообщает San Francisko Chronicle. Участники этого движения выступают за прекращение гонки в сфере ИИ, которую они считают безрассудной и откровенно опасной. Ранее они организовали несколько похожих акций, призванных привлечь внимание к проблеме бесконтрольного роста этого сектора. Протестующие выразили обеспокоенность рядом

14.07 / 11:50

деньги закон криминал общество самит В Китае предложили схему преследования за отмывание денег через криптовалюту

В официальной газете высшего прокурорского органа Китая опубликована статья, в которой изложена систематическая схема уголовного преследования за отмывание денег с использованием виртуальных валют. В статье отмечается, что техническая логика виртуальных валют — децентрализация, анонимность и трансграничный оборот — в определенной мере не согласуется с действующей правовой базой, из-за чего возникает «тройная дилемма»: квалификация преступления, получение доказательств и возврат похищенных средств. Журналисты Decryp

14.07 / 11:28

технологии музыка происшествие google gemini Waze получил новые ИИ-функции с Gemini и режим для мотоциклистов

Пользователи смогут сообщать об изменениях на дорогах обычной речью, быстрее искать нужные места и пользоваться новыми режимами навигации. Часть функций уже начала распространяться на Android и iOS.

14.07 / 11:27

экономика роды интересное нейросети инвестор Grok 4.5: Илон Маск наконец научил свой ИИ пользоваться терминалом лучше конкурентов

Пока индустрия искусственного интеллекта продолжает соревноваться в умении писать стихи и рисовать странных кошек, Илон Маск (Elon Musk) решил напомнить, что его компания xAI строит инструменты для более серьёзной работы. Согласно последним данным за июль 2026 года, новая языковая модель Grok 4.5 заняла первое место в престижном рейтинге Long-Horizon Terminal-Bench (LHTB), продемонстрировав результаты, которые заставляют конкурентов нервно проверять свои дата-центры.

14.07 / 11:27

технологии самит интересное мода и стиль Компактный экран, топовый Snapdragon и два сенсора на 200 Мп: инсайдер раскрыл характеристики Honor Robot Phone

Смартфон Honor Robot Phone с автономной подвижной камерой привлек к себе внимание еще в прошлом году, а в марте на выставке MWC 2026 разработчик представил его первые подробности. Позже глава Honor Ли Цзянь (Li Jian) сообщил, что Robot Phone поступит в продажу в третьем квартале 2026 года. Пока этого не произошло, но китайский инсайдер Digital Chat Station поделился первыми техническими характеристиками новинки и уточнил, что амбициозный гаджет выйдет уже в августе.

Лента новостей

На главную страницу