Об этом же в других СМИ

habr.com / 3 недели назад

Microsoft Authenticator блокирует рутирование на Android и джейлбрейки iOS

habr.com / 3 недели назад

Proton представила новую версию ИИ‑ассистента Lumo 2.0

habr.com / 3 недели назад

В Microsoft объяснили ситуацию с давней ошибкой блокировки файлов в Windows

habr.com / 3 недели назад

Microsoft раскритиковали за создание суперкомпьютера для OpenAI

habr.com / 3 недели назад

Microsoft расширила программу интеллектуального развёртывания Windows 11 25H2

Больше по теме

13.06.2026 - 14:33 / habr.com

Новый инструмент Microsoft позволит разработчикам запускать тесты поведения ИИ с помощью текстов

Microsoft представила ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing, адаптивная оценка на основе спецификаций для оценочного и регрессионного тестирования). Эта открытая платформа упрощает оценку поведения ИИ в конкретных приложениях, используя технологию для преобразования высокоуровневых описаний целей, политик или предполагаемого поведения на естественном языке в оцениваемые тесты, которые можно исследовать.

ASSERT берёт описания ожидаемого поведения и политик модели ИИ на простом языке, преобразует их в структурированный набор допустимых и недопустимых вариантов поведения, генерирует проблемные сценарии и тестовые примеры, запускает их на целевой системе и оценивает результаты. Он также может записывать пути, по которым движется система ИИ, включая промежуточные действия и вызовы инструментов, чтобы разработчики могли анализировать, где происходят сбои.

Разработчики также могут предоставлять контекст системы, инструменты и ограничения, если хотят дополнительно настроить то, что охватывают оценки.

Например, можно указать, что агент ИИ для поиска документов не должен отправлять электронные письма людям за пределами компании, предоставлять краткие резюме с учетом предыдущего контекста, а конфиденциальная информация должна быть доступна только руководителям высшего звена. ASSERT будет использовать эти правила для генерации тестовых случаев, которые проверяют, следует ли система им на постоянной основе. По словам представителей Microsoft, эта структура заполняет пробел, который не могут заполнить более широкие, общие оценки, когда модели ИИ должны вести себя в соответствии с контекстом, политиками и инструментами приложения или продукта.

«Оценки абсолютно необходимы для принятия правильных

продукты технологии люди общество политика maybeelf Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Microsoft случайно сломала функцию ответа на электронное письмо в Outlook habr.com / 3 недели назад

В Neowin напомнили о некогда культовой функции WordArt в Microsoft Office habr.com / 1 месяц назад

Chevron заключила 20-летнее соглашение с Microsoft о поставке электроэнергии для ЦОД habr.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 15:13

технологии закон история самит расследование Секретный идентификатор Windows помог вычислить хакера: что известно о скрытом механизме Microsoft

После того как материалы дела «Соединенные Штаты против Питера Стоукса» были частично рассекречены федеральным судом США, корпорация впервые официально подтвердила наличие такого механизма. До этого упоминания о GDID встречались лишь в крайне ограниченной технической документации Microsoft, не объяснявшей принцип его работы.

26.07 / 15:13

культура история природа засуха интересное Как почти век назад Америка спаслась от катастрофы – интересный факт

Спустя 90 лет лесополосы, созданные для борьбы с пылевыми бурями, продолжают защищать урожай, снижать эрозию почвы и поддерживать биоразнообразие.

26.07 / 15:13

продукты продукты питания вода кулинария организм Почему эксперты не рекомендуют мыть лосось перед готовкой

Чтобы безопасно и вкусно приготовить лосось, выберите сочный кусок с приятным запахом.

26.07 / 14:44

происшествия люди здоровье искусственный интеллект скандал Обвинения в смертях – OpenAI оказалась в центре крупного скандала

Компания OpenAI столкнулась с волной судебных исков из-за того, что ChatGPT усугублял психический кризис пользователей.

26.07 / 14:44

животные закон криминал история суд Свинья на скамье подсудимых: абсурдные законы в Средневековье

Зимой 1457 года во Франции прошел один из самых известных судебных процессов. Свинью и ее поросят обвинили в гибели пятилетнего ребенка.

26.07 / 14:44

продукты здоровье полезные продукты Эксперт мозг Как грецкие орехи влияют на мозг, сердце и настроение

Благодаря высокому содержанию полезных жиров и полифенолов грецкие орехи способны снижать стресс.

26.07 / 14:33

продукты технологии люди Apple общество Созданные с помощью вайбкодинга приложения заполонили App Store, но пользователи этому не рады

Развитие генеративного искусственного интеллекта и инструментов для вайбкодинга привело к резкому росту числа новых приложений в App Store. Однако пользователи всё чаще жалуются на засилье однотипных программ, созданных с помощью ИИ, а разработчики — на то, что привлечь внимание к своему продукту становится всё сложнее, сообщает The New York Times.

26.07 / 13:45

закон прогноз самит google Трейдерам Kalshi обвинила Netflix в клевете из-за трейлера документального фильма о рынках прогнозов

Платформа рынков прогнозов Kalshi направила Netflix официальное письмо с требованием прекратить распространение трейлера документального фильма Instadocs: The Prediction Games, пишет CNN. Компания заявила, что ролик содержит «клеветнические», «сфабрикованные» и вводящие в заблуждение материалы, которые могут создать впечатление, будто пользователи торговали спортивными контрактами в штате Невада вопреки судебному запрету. Kalshi требует убрать трейлер Netflix опубликовал трейлер документального фильма Instadocs: The Prediction Games, премьера которого запланирована на 27 июля. В нем показаны трейдеры на вечеринке в Лас-Вегасе во время финала чемпионата мира по футболу, которые демонс

26.07 / 13:14

бизнес технологии спорт конференция общество Специалисты «Сбер» и ЦСКА научили ИИ следить за футболистами по видео с одной камеры

Исследователи из Sber AI и ПФК ЦСКА создали технологию, позволяющую отслеживать действия каждого футболиста на протяжении всего матча с помощью видео только с одной камеры. Разработка делает профессиональную спортивную аналитику дешевле и доступнее для футбольных академий и любительских клубов. Научная статья была представлена на международной конференции CVPR 2026 в американском Денвере и вошла в число лучших работ в номинации Best Paper Award.

26.07 / 13:14

Реестр доменов .RU/.РФ перестал показывать инфу об администраторах-юрлицах

22 июля пользователь Хабра @ifap (то есть я) обнаружил, что в Реестре доменных имен .RU/.РФ перестали отображаться сведения об администраторах доменов – юридических лицах. Вместо наименования и ИНН юрлица отображается только «Организация» (хотя в случае с КДПЫ мы-то знаем, что это ФСО России).

Лента новостей

На главную страницу