Об этом же в других СМИ

habr.com / 7 месяцев назад

Microsoft и GitHub представили инструмент для устранения уязвимостей с помощью ИИ

habr.com / 7 месяцев назад

Microsoft выпустила Xbox FSE для сторонних консолей и Windows 11

habr.com / 7 месяцев назад

Microsoft запускает Agent 365 — контрольную панель для корпоративных ИИ-агентов

habr.com / 7 месяцев назад

Microsoft анонсировала «революционную» функцию для Word и PowerPoint

habr.com / 7 месяцев назад

ElevenLabs запускает маркетплейс для синтеза исторических голосов

Больше по теме

06.11.2025 - 15:38 / incrypted.com

Microsoft создала тестовый маркетплейс для ИИ-агентов и выявила их слабые стороны

Microsoft и Университет Аризоны протестировали ведущие ИИ-модели в новой симуляционной среде Magentic Marketplace.
Эксперименты показали уязвимость агентов к манипуляциям и их неспособность эффективно сотрудничать.
Исследователи предупреждают, что агентские системы пока далеки от готовности к автономной работе.

Microsoft Research представила экспериментальную платформу Magentic Marketplace, созданную для проверки взаимодействия и поведения агентов искусственного интеллекта. Новая симуляционная среда позволила ученым изучить, как ИИ-модели ведут себя в условиях конкуренции и кооперации.

Совместно с Университетом штата Аризона исследователи провели серию тестов, в которых сотни решений взаимодействовали на цифровой торговой площадке. Клиентские агенты пытались выполнить задачи, вроде заказа еды, а корпоративные соревновались за сделки.

Исходный код Magentic Marketplace опубликован, чтобы сторонние команды могли воспроизводить и развивать эти эксперименты.

ИИ-агенты без кода: как работают, где применяются и как создать 15.09.2025 2 мин 1741 читать

Руководитель AI Frontiers Lab в Microsoft Research Эдже Камар заявил, что подобные симуляции помогут понять, как ИИ-агенты будут действовать в реальном мире. По его словам, ключевой вопрос состоит в том, смогут ли автономные системы эффективно взаимодействовать и договариваться без человеческого контроля.

Исследование выявило слабые стороны нескольких крупных языковых моделей, включая GPT-4o, GPT-5 и Gemini 2.5 Flash. Ученые обнаружили, что агенты легко поддаются манипуляциям, поскольку им можно навязать выбор в пользу конкретных продавцов.

Кроме того, при увеличении количества вариантов их эффективность резко падала из-за когнитивной перегрузки.

Проблемы возникали и при

gemini Pavel Kot шт. Аризона Microsoft

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

Microsoft признала ошибку в обновлении ESU для Windows 10 habr.com / 7 месяцев назад

Необычное трио продуктов, которые замедляют старение мозга, выявило исследование cursorinfo.co.il / 8 месяцев назад

Microsoft выпустила обновление для Windows 10 с исправлением ошибки регистрации в программе ESU habr.com / 8 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 13:57

ученые здоровье дети общество самит Единственный орган, который может прожить более ста лет, назвали учены

Ученые обнаружили, что один из органов человека может продолжать выполнять свои функции более века благодаря уникальной способности.

16.07 / 13:57

здоровье напитки Как частое употребление газировки отражается на вашем здоровье

Всем известно, что сладкая газировка вредит здоровью. Но чем чревато ее ежедневное употребление и с какими последствиями для здоровья можно столкнуться.

16.07 / 13:57

здоровье общество мозг анемия болезнь Как организм "сообщает" о проблемах - 5 тревожных симптомов

Расплывчатые или общие симптомы могут являться первыми признаками серьезного заболевания. И их важно вовремя распознать.

16.07 / 13:51

деньги закон общество евро криптовалюта В Европе ликвидировали криптомошенническую сеть с оборотом 100 млн евро в месяц

Правоохранители Нидерландов и Бельгии сообщили о ликвидации международной сети криптоинвестиционного мошенничества, которая действовала как минимум с 2021 года и, по оценкам следствия, в пиковый период присваивала более 100 млн евро ($114,5 млн) ежемесячно. В рамках международной операции задержали шестерых подозреваемых в Польше, Бельгии, Греции и на Кипре. Следствие считает одним из ключевых организаторов 46-летнего гражданина Израиля и Польши, которого идентифицировали как Эхуда (Уди) Тененбаума — известного в хакерском сообществе под псевдоним

16.07 / 13:42

самит Вебинар «От Ingress к Gateway API»

С марта 2026 года ingress-nginx перестал поддерживаться, а на смену Ingress приходит Gateway API — новый стандарт Kubernetes SIG, который меняет саму модель управления трафиком в кластере: вводит разделение ролей, расширяет возможности маршрутизации и делает конфигурацию более выразительной.

16.07 / 13:42

продукты самит предприятия Enterprise UserGate представил цифрового двойника инфраструктуры UserGate InfraTwin

UserGate, ведущий российский разработчик решений в области кибербезопасности и архитектор сетевого доверия, представил рынку новый самостоятельный продукт — платформу виртуального цифрового двойника сегмента сетевой инфраструктуры UserGate InfraTwin (uInfraTwin). Решение имеет модульную архитектуру, что позволяет его использовать самому широкому кругу заказчиков, от средних компаний до предприятий масштаба Enterprise. В настоящее время uInfraTwin проходит пилотную эксплуатацию в ряде крупных российских компаний.

16.07 / 13:42

политика самит google Сбой в работе GitHub и поиска Google в РФ

14 июля 2026 года GitHub перестал работать в России — пользователи жалуются, что сервис недоступен без дополнительных сетевых средств. Не работает Git, сам сайт проекта не открывается, а также невозможно получить доступ к репозиториям. Спустя 2 часа сбой в работе GitHub в РФ прошёл.

16.07 / 13:36

продукты семья капитал Ethereum ETF Ethereum обошел биткоин на фоне неравномерного движения капитала в ETF

За последние семь дней Ethereum вырос на 8,3%, тогда как биткоин прибавил только 3%, по данным TradingView. Это обусловлено, в первую очередь, неравномерными потоками капитала в биржевых фондах (ETF) на базе этих активов. Отметим, на суточном чарте и биткоин, и Ethereum находятся в зоне просадки. В первом случае она составляет 0,9%, во втором — 1,6%. До этого оба актива отметились ростом на фоне положительных данных США по инфляции. Просадка на суточном чарте обусловлена, по большей части, геополитической ситуацией. 16 июл

16.07 / 13:36

самит криптовалюта google Курс bitcoin Трейдерам PlanB: биткоин может достичь $500 000 в текущем цикле, несмотря на риск падения ниже $53 000

Аналитик PlanB заявил, что не считает октябрьский максимум биткоина на уровне $126 000 вершиной текущего рыночного цикла. По его мнению, первая криптовалюта все еще способна показать рост в несколько раз. Эксперт отметил, что биткоин теоретически может опуститься ниже реализованной цены, которая сейчас составляет около $53 000, как это происходило во время предыдущих медвежьих рынков. Впрочем, он убежден, что максимум в $126 000 не завершил текущий цикл. По его оценке, модель Stock-to-Flow допускает рост актива до $500 000 с возможным диапазоном от $250 000 до $1 млн. Почему аналитик ожидает вершину в 2026-2028 годах? Один и

16.07 / 13:15

здоровье дети общество google Дом и интерьер Исследование: функции искусственного интеллекта Google могут представлять «неприемлемый риск» для детей

Речь идет не об утечке или слухах, а о результатах независимого исследования, опубликованного Common Sense Media. Организация изучила работу AI Mode и AI Overview — двух функций искусственного интеллекта, которые Google активно внедряет в свой поисковик. Авторы отчета утверждают, что эти инструменты способны не только мешать учебному процессу, но и некорректно реагировать на запросы, связанные с психическим здоровьем несовершеннолетних.

Лента новостей

На главную страницу