



Новое исследование Google и MIT показало, что много ИИ-агентов не всегда означает лучшее качество
Исследование, проведенное Google Research, Google Deepmind и MIT, ставит под сомнение идею о том, что большее количество ИИ-агентов означает лучшие результаты. Исследователи точно определили, когда многоагентные системы помогают, а когда ухудшают ситуацию.
Если один ИИ-агент работает хорошо, то команда специализированных агентов должна работать еще лучше. Именно на этом основывалась прошлогодняя статья «Достаточно больше агентов». Но новое исследование Google и MIT рассказывает другую историю. Производительность многоагентных систем резко колебалась в зависимости от задачи - от повышения на 81 процент до снижения на 70 процентов.
Команда провела 180 контролируемых экспериментов с использованием пяти типов архитектур и трех семейств моделей: GPT от OpenAI, Gemini от Google и Claude от Anthropic. Они сохраняли неизменными подсказки, инструменты и бюджеты токенов, изменяя только структуру координации и возможности модели.
Благодаря централизованной координации работы нескольких агентов, объем задач финансового анализа, разбитых на независимые части, увеличился на 80,9 процента. Разные агенты параллельно анализировали тенденции продаж, структуру затрат и рыночные данные, а затем объединяли результаты.
В Minecraft задачи планирования показали совершенно противоположную картину. Каждая многоагентная конфигурация снижала производительность на 39-70 процентов. Проблема в том, что каждое действие крафта изменяет состояние инвентаря, от которого зависят последующие действия. Эти последовательные зависимости плохо распределяются между агентами.
Когда каждый шаг в задаче изменяет состояние, необходимое для последующих шагов, многоагентные системы, как правило, испытывают трудности. Это происходит потому, что важный контекст может быть
Читать на habr.com