Microsoft создала тестовый маркетплейс для ИИ-агентов и выявила их слабые стороны
- Microsoft и Университет Аризоны протестировали ведущие ИИ-модели в новой симуляционной среде Magentic Marketplace.
- Эксперименты показали уязвимость агентов к манипуляциям и их неспособность эффективно сотрудничать.
- Исследователи предупреждают, что агентские системы пока далеки от готовности к автономной работе.
Microsoft Research представила экспериментальную платформу Magentic Marketplace, созданную для проверки взаимодействия и поведения агентов искусственного интеллекта. Новая симуляционная среда позволила ученым изучить, как ИИ-модели ведут себя в условиях конкуренции и кооперации.
Совместно с Университетом штата Аризона исследователи провели серию тестов, в которых сотни решений взаимодействовали на цифровой торговой площадке. Клиентские агенты пытались выполнить задачи, вроде заказа еды, а корпоративные соревновались за сделки.
Исходный код Magentic Marketplace опубликован, чтобы сторонние команды могли воспроизводить и развивать эти эксперименты.
ИИ-агенты без кода: как работают, где применяются и как создать 15.09.2025 2 мин 1741 читатьРуководитель AI Frontiers Lab в Microsoft Research Эдже Камар заявил, что подобные симуляции помогут понять, как ИИ-агенты будут действовать в реальном мире. По его словам, ключевой вопрос состоит в том, смогут ли автономные системы эффективно взаимодействовать и договариваться без человеческого контроля.
Исследование выявило слабые стороны нескольких крупных языковых моделей, включая GPT-4o, GPT-5 и Gemini 2.5 Flash. Ученые обнаружили, что агенты легко поддаются манипуляциям, поскольку им можно навязать выбор в пользу конкретных продавцов.
Кроме того, при увеличении количества вариантов их эффективность резко падала из-за когнитивной перегрузки.
Проблемы возникали и при
Читать на incrypted.com