Об этом же в других СМИ

habr.com / 1 год назад

Облачный дайджест: создать ИИ-агента, запустить ИИ в помощь тестировщику и посчитать выгоду от миграции

fokus-vnimaniya.com / 1 год назад

Как ускорить метаболизм и перестать накапливать жир - ФОКУС ВНИМАНИЯ

cursorinfo.co.il / 1 год назад

Какое мясо лучше есть для похудения - врачи предложили четыре варианта

gagadget.com / 1 год назад

Xiaomi SU7 с системой помощи водителю попал в аварию, трое погибших

Больше по теме

18.03.2025 - 09:47 / habr.com

Как научить ИИ-агентов лучше планировать задачи с помощью мета-плана?

Языковые модели (LLM) уже умеют решать сложные задачи, но их способность к планированию остается несовершенной. Исследователи из Пекинского университета представили новый метод MPO (Meta Plan Optimization), который помогает LLM-агентам эффективнее выполнять многошаговые задачи.

MPO — это подход, который улучшает планирование действий ИИ-агентов за счет использования мета-планов. Эти планы представляют собой высокоуровневые стратегии выполнения задач, которые абстрагированы от конкретных деталей среды. Например, для задачи "посмотреть на книгу под лампой" мета-план может выглядеть так:

Перейдите туда, где может находиться книга;

Возьмите книгу;

Перейдите к лампе;

Включите лампу и осмотрите книгу.

Главное преимущество MPO заключается в том, что он работает как универсальное решение, которое можно внедрить в уже существующие системы без необходимости пересматривать всю архитектуру модели. Это делает его удобным инструментом для разработчиков.

Кроме того, MPO позволяет агентам адаптироваться к новым условиям. Например, если задача требует найти предмет в комнате, мета-план может быть абстрактным: "Начните проверку с первого возможного места". Такая стратегия позволяет агенту действовать гибко, даже если он сталкивается с незнакомой ситуацией.

Процесс работы MPO можно разделить на несколько этапов:

Генерация начальных планов
На начальном этапе система учится создавать мета-планы с помощью обучения на примерах. Однако в существующих данных есть только готовые решения задач, но нет самих мета-планов. Чтобы решить эту проблему, исследователи использовали GPT-4o для автоматического создания базового набора планов. Модель получала описание задачи и пример успешного выполнения, после чего создавала обобщенный план решения. Эти планы затем

бизнес книги самит интересное Пекин

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Какие кошки лучше всех уживаются с собаками - названо 7 пород cursorinfo.co.il / 1 год назад

В какое время лучше завтракать и почему, рассказали ученые cursorinfo.co.il / 1 год назад

3D-моделирование – тренд 2025 года. Почему это перспективная профессия, какой может быть доход и как начать itc.ua / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 15:00

продукты люди здоровье продукты питания банк Тунец против гипертонии – как популярная рыба влияет на давление

Чтобы тунец действительно укреплял сосуды и снижал давление, выбирайте консервы с низким содержанием соли.

24.07 / 15:00

закон общество психология погоня стресс Формула счастья от гарвардского ученого – зачем нужен обратный список

Современное общество учит нас ставить амбициозные цели и постоянно стремиться к успеху. Однако гарвардский ученый считает, что такая гонка не приносит счастье.

24.07 / 15:00

продукты люди самит Здоровье и красота овощи Какие салатные овощи наиболее полезны для пищеварения

Листовая зелень при регулярном употреблении может улучшить работу пищеварительной системы и поддержать кишечный микробиом.

24.07 / 14:59

закон общество законопроект сенат Блокчейн У Сената США осталось меньше двух недель на принятие CLARITY Act — Grayscale

У Сената США меньше чем две недели, чтобы принять законопроект CLARITY до начала августовского перерыва Конгресса. 22 июля 2026 года республиканцы впервые обнародовали полный текст документа, который должен установить комплексные правила для криптовалютного рынка. В Grayscale подчеркнули, что если документ не будет одобрен до августовского перерыва, его дальнейшее рассмотрение может осложниться из-за политической борьбы накануне промежуточных выборов в США. CLARITY Act приблизился к решающему этапу В компании отметили, что законопроект

24.07 / 14:49

связь экономика общество АТО самит Атомная автономия: Канада готовит ядерные микрореакторы для покорения Арктики

Пока мир ведёт бесконечные дискуссии о «зеленом» переходе и эффективности ветровых электростанций, Канада решила пойти проверенным путём — укротить атом для самых суровых условий планеты. Канадская компания Canadian Strategic Missions Corporation или CSMC получила 4.5 млн CAD (около 135 000 000 грн) от Федерального агентства экономического развития Южного Онтарио (FedDev Ontario). Эти средства — не просто благотворительность, а целевая инвестиция в разработку ядерного микрореактора, который должен стать энергетическим сердцем Арктики к 2030 году. /

24.07 / 14:45

закон история общество звезда интересное Астрономы установили, что экзопланеты вокруг звезды Барнарда абсолютно непригодны для жизни

Звезда Барнарда — относительно маломассивная звезда типа M (красный карлик), расположенная менее чем в 6 световых годах от Земли, — является ближайшим соседом Солнечной системы после Альфа Центавра. В последние годы эта система оказалась настоящей сокровищницей для открытий экзопланет: с августа 2024 года по март 2025 года было подтверждено существование четырёх экзопланет. Эти планеты относятся к типу, не встречающемуся нигде в Солнечной системе, и по массе занимают промежуточное положение между Землёй и Марсом. К сожалению, новое исследование Кембриджского университета подтвердило, что эти планеты, скорее всего, непригодны для жизни.

24.07 / 14:45

связь закон Прокурор AT&T AT&T проиграла суд в попытке прекратить предоставление базовых услуг телефонной связи в Калифорнии

Суд обязал телекоммуникационную компанию AT&T продолжить предоставлять базовые услуги традиционной телефонной связи по медным проводам новым клиентам в Калифорнии. У AT&T есть возможность обжаловать это решение в Апелляционном суде.

24.07 / 14:15

санкции политика Евросоюз google крипто ЕС включил криптобиржу HTX в новый санкционный пакет против РФ

Европейский Союз включил криптовалютную биржу HTX в новый пакет санкций против России, объявленный 24 июля 2026 года, пишет Reuters. Платформа вошла в перечень из 18 компаний, которые, по мнению Брюсселя, предоставляли криптовалютные услуги для обхода санкций российскими пользователями. ЕС согласовал 21-й пакет санкций против РФ — крупнейший за четыре года 23.07.2026 Читать HTX, ранее известная как Huobi, является одной из крупнейших криптовалютных бирж в мире. Компанию основали в Китае в 2013 году, а контрольный пакет в 2022 году приобрел гонконгский миллиардер Дж

24.07 / 13:51

здоровье семья психология стресс Эксперт Семь необычных методов защиты от стресса, которые работают

Хронический стресс подтачивает здоровье и разрушает нервную систему. Ученые предлагают неожиданные методы профилактики эмоционального выгорания.

24.07 / 13:51

продукты люди здоровье продукты питания самит Шок для потребителей – как нас обманывают производители продуктов

Статистика показала провальные результаты для многих категорий еды. Например, все протестированные заправки оказались фальсификатом без авокадо.

Лента новостей

На главную страницу