Об этом же в других СМИ

habr.com / 6 месяцев назад

Google перевела Deep Research на Gemini 3 Pro — агент меньше галлюцинирует и лучше ищет в интернете

chudo.tech / 6 месяцев назад

Планшет ugee Trio Pad UT3: один экран — три режима работы

cursorinfo.co.il / 6 месяцев назад

Экс-агент ЦРУ раскрыл, как спецслужбы могут «стереть» человека

habr.com / 7 месяцев назад

Свой AI-агент: как настроить LLM под ваши задачи

habr.com / 7 месяцев назад

Только один ИИ заработал на бирже — им оказался секретный Grok 4.20

Больше по теме

26.11.2025 - 14:36 / habr.com

Один агент управляет, другие делают работу: новая эпоха кооперативного обучения ИИ?

Исследователи из Имперского колледжа Лондона и Ant Group предложили новую архитектуру мульти-агентного обучения, в которой несколько ИИ-агентов совместно решают сложные, многошаговые задачи благодаря разделению ролей и координации.

Один агент выступает в роли менеджера проекта, контролируя ход работы, а остальные специализируются на отдельных задачах, например, поиск в интернете или анализ данных. Такой подход обеспечивает более надёжное выполнение, чем попытки одного агента делать всё сам.

Главная инновация - это алгоритм M-GRPO (Multi-Agent Group Relative Policy Optimization). Он расширяет GRPO и позволяет тренировать менеджера и суб-агентов одновременно, даже если они запускаются на разных серверах или выполняют разные задачи. Каждый агент обучается отдельно, но синхронизируется через общую базу данных.

Кроме того, агенты сохраняют свои роли. Менеджер оценивается по качеству итогового решения, а суб-агенты - по своей части работы и вкладу в общий результат. Это помогает построить устойчивое и скоординированное поведение.

Чтобы справляться с различной частотой действий агентов, M-GRPO предлагает механизм выравнивания, который регулирует, как часто суб-агенты будут вызываться. Это позволяет поддерживать стабильность в обучении, даже если один агент работает постоянно, а другой - реже.

Эксперименты показали, что при тестировании на трёх бенчмарках - GAIA, XBench-DeepSearch и WebWalkerQA - мульти-агентная система показала более стабильное поведение и потребовала меньше тренировочных данных, чем одни агенты или мульти-агенты без обучения суб-агентов.

В реальных сценариях система проявила себя уверенно. Например, в логической задаче с кубиком Рубика главный агент выбрал правильную стратегию для математических шагов, а в

технологии общество самит крипто cognitronn Лондон

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Необычная кража: в Новой Зеландии проглотили яйцо Фаберже (ФОТО) cursorinfo.co.il / 7 месяцев назад

Новый режим поиска Google объединяет AI Overviews и AI Mode в один клик habr.com / 7 месяцев назад

3D-печать роговицы: новая эпоха трансплантации chudo.tech / 7 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

12.07 / 16:33

люди ученые общество кофе питание Чашка в день снижает риск смерти – напиток посоветовали эксперты

Международные исследователи доказали, что ежедневная привычка пить кофе и зеленый чай способна снизить риск преждевременной смерти более чем на четверть.

12.07 / 16:25

связь технологии деньги интересное мода и стиль Nokia 102 4G (2026): возвращение к истокам без лишнего «интеллекта»

Пока мир сходит с ума от нейросетей в каждом утюге, бренд Nokia решил пойти против течения. В сеть попали детали о новой итерации Nokia 102 4G образца 2026 года — и это тот случай, когда «меньше» значит «лучше». Устройство напоминает нам о временах, когда телефон был инструментом для связи, а не центром поглощения цифрового контента.

12.07 / 16:14

технологии экономика самит Рассекречен бюджетный смартфон HMD Asha 305: дизайн в стиле iPhone и Android 14 Go

Информацией поделился известный инсайдер SmashX_60. По его данным, в Таиланде новинка будет стоить 2390 бат, что соответствует примерно 75 долларам.

12.07 / 15:38

деньги закон общество суд курьез Итальянка нашла огромную сумму денег – финал оказался неожиданным

Городские чиновники пытались забрать себе найденную в общественном транспорте валюту, аргументируя это тем, что женщина сделала находку в рабочее время.

12.07 / 15:20

технологии авиация закон общество самит Gulfstream G700 летает на «масле»: как бизнес-джеты пытаются спасти планету

Пока экоактивисты подсчитывают углеродный след частных перелетов, компания Gulfstream Aerospace решила доказать, что их самолеты могут быть чище старого дизельного пикапа. Производитель завершил серию масштабных испытаний, в рамках которых флагманский бизнес-джет G700 поднялся в небо, заправленный исключительно экологическим топливом (SAF). Без ни капли традиционного авиационного керосина.

12.07 / 15:14

Samsung технологии здоровье история политика Samsung начала запрашивать согласие на использование данных о здоровье для обучения ИИ

При этом отказ от согласия может привести к серьезным последствиям. Если пользователь не примет новые условия, он не сможет синхронизировать данные Samsung Health со своей учетной записью Samsung. Более того, уже сохраненная информация будет удалена, если компания не обязана хранить ее в соответствии с законодательством.

12.07 / 15:06

технологии деньги отпуск интересное мода и стиль Timex Deepwater Meridian 300 Titanium: когда бренд решил сыграть во «взрослого» дайвера

Компания Timex, которую мы привыкли любить за неубиваемые и бюджетные кварцевые модели, решила, что пора выйти с детской площадки и зайти на территорию серьёзных инструментов. Новинка под названием Deepwater Meridian 300 Titanium HEV Automatic — это попытка доказать, что бренд может создавать вещи, которые не стыдно взять на борт исследовательского судна или, по крайней мере, надеть на пафосную вечеринку у бассейна.

12.07 / 14:50

политика самит Блокчейн google майнер Биткоин приближается к дедлайну BIP-110 — поддержка обновления практически нулевая

Предложение BIP-110 (Reduced Data Temporary Soft Fork), которое предусматривает временное ограничение публикации произвольных данных в сети биткоина, практически не имеет поддержки майнеров накануне дедлайна в начале августа. По данным мониторинга сигнализации BIP-110, поддержка среди майнинговых пулов остается ниже 1% на протяжении всего периода, а сейчас составляет 0%, при этом ни один крупный пул не присоединился к инициативе. Спор вокруг BIP-110 BIP-110 предлагает на один год ужесточить правила размещения произвольных данных в блокчейне биткоин

12.07 / 14:40

люди общество жизнь человек Солнце Как первые люди спасались от палящего солнца - ответ ученых

Исследователи выяснили, как люди защищали кожу от солнца десятки тысяч лет назад при отсутствии специальных кремов.

12.07 / 14:05

экономика пенсия самит автомобили интересное Китайская Weichai Power сертифицировала 600-сильный водородный двигатель: дизелю на пенсию?

Пока мир ведёт ожесточённые споры о весе аккумуляторов для магистральных грузовиков и целесообразности полной электрификации, китайцы из Weichai Power решили пойти по пути наименьшего сопротивления. Они взяли привычную архитектуру двигателя внутреннего сгорания и научили её работать на водороде. Их новый агрегат WP15 только что прошёл сертификацию по экологическому стандарту China VI, став первым в мире тяжёлым водородным ДВС, официально допущенным к коммерческой эксплуатации.

Лента новостей

На главную страницу