Об этом же в других СМИ

habr.com / 5 месяцев назад

The Assistant Axis. Почему LLM съезжают с катушек и как Anthropic предлагает это чинить

habr.com / 5 месяцев назад

Overworld открыла Waypoint-1. Реалтайм-модель мира для игр и симуляций

habr.com / 5 месяцев назад

GenRobot обновила RealOmni OpenData. Один из самых богатых датасетов для Embodied AI стал еще сложнее

habr.com / 5 месяцев назад

Nvidia пыталась получить книги у пиратов для обучения ИИ

habr.com / 5 месяцев назад

Cloudflare купил Human Native и строит рынок данных для обучения ИИ

Больше по теме

08.01.2026 - 05:53 / habr.com

Новое исследование: LLM используются для обучения и оценки автономных агентов

Новые результаты исследований указывают на то, что большие языковые модели (LLM) способны выступать в роли мировых моделей - абстрактных репрезентаций среды, которые могут использоваться для обучения и оценки ИИ-агентов. В традиционной робототехнике и обучении с подкреплением мировые модели создаются вручную или путем симуляции, чтобы агенты могли мысленно планировать действия. Но LLM, по мнению авторов исследования, могут выполнять аналогичную функцию на основе текстовых описаний, логических взаимосвязей и причинно-следственных закономерностей, которые они уже усвоили в процессе предобучения.

Идея мировых моделей заключается в создании внутреннего представления среды, которое позволяет агенту предсказывать последствия своих действий и строить планы без непосредственного взаимодействия с реальным миром. По мнению исследователей, LLM уже содержат такую структурированную информацию о мире, поскольку они моделируют вероятности последовательностей слов и сценариев, отражающих причинно-следственные связи, выявленные в огромных обучающих данных. Таким образом, язык становится не только коммуникационным инструментом, но и универсальным средством моделирования ситуаций.

В экспериментальных условиях модели использовались для имитации среды, в которой агент получает описания текущего состояния, выбирает действия и получает текстовый отклик о последствиях. Это позволяет LLM выполнять задачи, которые традиционно решаются симуляторами с реальными физическими моделями. Такой подход уже демонстрирует способность к многослойному планированию, последовательному рассуждению и адаптации к динамичному контексту - качествам, важным для автономных агентов в робототехнике, играх и сложных симуляциях.

Авторы отмечают, что LLM как мировая модель

связь технологии общество крипто cognitronn

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

ElevenLabs готовится к новому раунду при оценке $11 млрд habr.com / 5 месяцев назад

Google представила TranslateGemma, открытую модель для перевода на десятки языков habr.com / 5 месяцев назад

ASUS показал мини-ПК с отдельной кнопкой для запуска Copilot habr.com / 5 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

03.07 / 10:27

история общество самит мода и стиль google Proton представила новую версию ИИ‑ассистента Lumo 2.0

Компания Proton анонсировала версию 2.0 голосового помощника Lumo AI. Она предлагает «новую архитектуру» и такие функции, как логическое мышление, многомодальная обработка изображений и улучшенный веб-поиск.

03.07 / 10:27

бизнес технологии политика SafeMobile и SafeTech Lab упростили управление доступом сотрудников к корпоративным сервисам через мобильные устройства

SafeMobile объявил об интеграции с корпоративным центром сертификации SafeTech CA. Решение позволяет компаниям автоматизировать выпуск и обновление цифровых сертификатов для мобильных устройств — без ручных операций со стороны ИТ-служб.

03.07 / 10:23

Samsung СМИ Nvidia google Broadcom СМИ: Anthropic объединится с Samsung для производства AI-чипов и снижения зависимости от NVIDIA

Крупнейшие AI-гиганты осознали свою зависимость от производителей чипов, в первую очередь от NVIDIA, и активно работают над ее уменьшением.

03.07 / 10:03

люди здоровье общество кофе Эксперт Идеальное время для чашки кофе назвали эксперты

Популярный утренний ритуал может принести организму как пользу, так и вред. Эксперты рекомендуют привязать употребление кофе к вашим биоритмам.

03.07 / 10:03

дети общество самит пляж врачи Какие солнцезащитные очки могут навредить глазам

Главное назначение солнцезащитных очков — быть надежным щитом для зрения, а не просто стильным дополнением к образу.

03.07 / 10:03

искусственный интеллект общество политика самит лечение ИИ определил, почему пациенты прекращают принимать лекарства

Искусственный интеллект прочитал заметки врачей и определил, по каким причинам пациенты чаще всего нарушают протоколы лечения.

03.07 / 10:00

Facebook продукты технологии Telegram общество Пользователи WhatsApp** теперь могут зарезервировать юзернеймы, чтобы не раскрывать номер телефона

WhatsApp** анонсировал долгожданную функцию: возможность использовать юзернеймы, что позволит пользователям делиться своими профилями, не раскрывая номер телефона. Однако для создания учётной записи в WhatsApp** он по-прежнему потребуется.

03.07 / 10:00

технологии закон дети политика законопроект Азербайджан запретил соцсети для детей до 16 лет

Парламент Азербайджана принял законопроект о запрете на использование социальных сетей детьми младше 16 лет. Об этом сообщает агентство APA.

03.07 / 10:00

технологии происшествия Apple общество самит В Microsoft объяснили ситуацию с давней ошибкой блокировки файлов в Windows

В Microsoft объяснили, почему пользователи Windows годами видят одно и то же предупреждение «Действие не может быть выполнено, поскольку файл открыт в другой программе». Оно появляется, когда Windows блокирует пользователям возможность удаления или переименования файла.

03.07 / 10:00

экономика Nvidia бюджет мода и стиль крипто Компании стали внедрять стиль речи «пещерного человека» в чат-боты для экономии токенов

Разработчики обратились к специализированному инструменту Caveman, который заставляет ИИ генерировать максимально краткие ответы с имитацией стиля речи «пещерного человека». Таким образом компании реагируют на стремительный рост расходов на токены.

Лента новостей

На главную страницу