Об этом же в других СМИ

habr.com / 1 год назад

Meta* теперь может использовать общедоступные данные Facebook и Instagram для обучения ИИ

habr.com / 1 год назад

Новая модель ИИ от Anthropic переходит к шантажу, когда инженеры пытаются отключить её

habr.com / 1 год назад

Как модель ИИ Anthropic Claude Opus 4 выражает себя через эмодзи

habr.com / 1 год назад

OpenAI обновляет модель искусственного интеллекта, на которой работает агент Operator

habr.com / 1 год назад

OpenAI и Джони Айв объединились для создания нового устройства с ИИ: что это?

Больше по теме

16.05.2025 - 08:16 / habr.com

Новый подход к обучению ИИ-агентов: совершенствование через анализ успешных примеров

Новое исследование Стэнфордского университета показало, что агенты с искусственным интеллектом могут гораздо лучше справляться со сложными задачами, просто учась на собственном успешном опыте.

До сих пор создание эффективных ИИ-агентов часто требовало больших усилий: тщательно продуманных подсказок, тщательно отобранных наборов примеров или специализированных пространств для действий. Эти методы работают, но они требуют много времени и их сложно масштабировать. Команда из Стэнфорда предлагает гораздо более простую альтернативу: позволить агентам совершенствоваться, учась на том, что сработало в прошлом.

Их метод основан на архитектуре ReAct, в которой языковая модель создаёт план для каждой задачи, а затем наблюдает, рассуждает и действует. Разница в том, что на каждом этапе агент извлекает примеры из базы данных, заполненной не выбранными вручную образцами, а успешными траекториями из предыдущих задач, которые система собирает автоматически. В данном контексте траектория — это полная последовательность шагов, которые агент ИИ предпринимает для решения задачи.

Даже упрощённая версия этого подхода, называемая Traj-Bootstrap, значительно повышает процент успешных результатов в трёх тестах. В ALFWorld точность повышается с 73% до 89%. В Wordcraft — с 55% до 64%, а в InterCode-SQL — с 75% до 79%.

Это улучшение достигается за счёт цикла положительной обратной связи. Успешные примеры помогают в решении новых задач, которые затем приводят к появлению ещё более успешных примеров. Система учится сама у себя и продолжает совершенствоваться, не требуя дополнительных обучающих данных или настройки модели.

Не каждая собранная траектория помогает, а некоторые могут даже ухудшить ситуацию. Чтобы исправить это, исследователи разработали две

связь технологии общество самит крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI обновил API Responses с помощью удалённых серверов MCP и новых инструментов habr.com / 1 год назад

Mistral представляет Devstral Small 24B — новую языковую модель с открытым исходным кодом для программирования habr.com / 1 год назад

Как изменится поиск: новые функции Google на базе искусственного интеллекта habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 04:59

Volkswagen евро самит электромобиль интересное VW ID. Polo за 25 000 евро: наконец-то «народный» электромобиль или очередной компромисс?

Volkswagen (Фольксваген) наконец сдержал слово, хотя и заставил нас ждать. Новый ID. Polo теперь можно заказать за стартовые 24 995 EUR (1 100 000 грн). Это именно та психологическая отметка, которую маркетологи из Вольфсбурга эксплуатировали годами, чтобы мы поверили в светлое и относительно доступное электрическое будущее. До этого момента в конфигураторе были доступны лишь версии за 33 795 EUR (1 487 000 грн), что как-то не очень вязалось с концепцией бюджетного хэтчбека.

17.07 / 04:46

продукты медицина здоровье общество Здоровье и красота Завтрак для долголетия: что стоит есть по утрам, рассказали врачи

С каких продуктов нужно начинать свой день, чтобы дольше жить и меньше болеть, рассказали специалисты.

17.07 / 04:32

происшествия пожар электроэнергия кинотеатр Эксперт Названы бытовые приборы, которые опасно оставлять включенными на ночь

Некоторые бытовые приборы могут перегреваться ночью и повышать риск пожара, если оставить их включенными без присмотра.

17.07 / 04:15

BMW общество самит роды полюс Range Rover Sport Electric: британская тишина с фальшивым голосом V8

Пока автопромышленность медленно, но уверенно переходит на «диету» без ископаемого топлива, британцы из Гейдона решили, что их аристократическое спокойствие тоже нуждается в розетке. После того, как прототипы Range Rover Electric размяли мышцы на прошлогоднем Goodwood Festival of Speed, стало ясно: эпоха бесшумных внедорожников для тех, кто никуда не спешит (но может), уже здесь. В 2026 году компания планирует вывести на рынок не только флагманскую электрическую модель, но и её «младшего», более агрессивного брата — Range Rover Sport Electric.

17.07 / 03:37

технологии экономика Госдума Huawei закон Производители и дистрибьюторы бытовой техники выступили против расширенного толкования ИИ-технологий

Ассоциация РАТЭК (объединяет Huawei, DNS, Fplus, «М.Видео», «Ситилинк» и других) направила в ФАС письмо с критикой проекта поправок к закону об иностранных инвестициях (57-ФЗ). Проект, разработанный ФАС, предлагает отнести к стратегическим видам деятельности «деятельность, связанную с разработкой, созданием, внедрением, реализацией или оборотом технологий искусственного интеллекта». В ассоциации считают, что такая широкая формулировка создаёт системные риски для всего рынка бытовой и компьютерной техники, пишет «Ъ».

17.07 / 03:37

общество ЕГЭ телевидение интересное Шоу бизнес Филологи нашли слово-рекордсмен по числу значений

Государственный институт русского языка им. А. С. Пушкина назвал слово, имеющее наибольшее количество значений — это глагол «идти». В Большом универсальном словаре русского языка у этой лексемы зафиксировано 56 значений.

17.07 / 02:46

люди здоровье Здоровье и красота лечение питание Какие крупы помогают "чистить" кровь от токсинов и вредных веществ

Какие каши нужно включить в рацион, чтобы укрепить здоровье и улучшить самочувствие.

17.07 / 01:24

продукты google Google переименовала NotebookLM в Gemini Notebook: что изменилось после ребрендинга

Google официально переименовала свой сервис для исследований и работы с документами NotebookLM в Gemini Notebook. Компания объясняет, что новое название должно объединить продукт с остальной экосистемой Gemini, хотя сервис и дальше будет функционировать как отдельное приложение.

17.07 / 01:24

история общество netflix стриминг Шоу бизнес Netflix выпустил первый сезон "Очень странных дел" в формате VHS: сериал можно посмотреть в стиле 80-х

Netflix представил специальную VHS-версию первого сезона сериала "Очень странные дела" (Stranger Things). Несмотря на окончание истории, стриминговый сервис сделал ставку на ностальгию и предложил зрителям просмотр в духе домашних видеокассет 1980-х годов.

17.07 / 01:20

технологии экономика ученые культура наука Как читать мысли растений – новый сенсор изменит фермерство

Американские инженеры создали уникальные нательные сенсоры для агрокультур. Новая технология способна предупредить фермеров о болезнях растений.

Лента новостей

На главную страницу