Об этом же в других СМИ

habr.com / 1 год назад

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

habr.com / 1 год назад

Исследование: ИИ-модели стали чаще советовать ничего не делать и говорить «нет»

gagadget.com / 1 год назад

Авторы Marvel Rivals показали способности Феникс в новом геймплейном трейлере

itc.ua / 1 год назад

Языковые модели ИИ научились распознавать эмоции и скрытый смысл лучше некоторых людей

habr.com / 1 год назад

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Больше по теме

20.06.2025 - 09:05 / habr.com

Исследование способности языковых моделей к логическим рассуждениям — тест RELIC

Исследователи из Нью-Йоркского университета представили RELIC (Recognition of Languages In-Context) — новый тест, разработанный для проверки того, насколько хорошо большие языковые модели могут понимать и выполнять сложные многоэтапные инструкции. Команда получила результаты, аналогичные тем, что были представлены в недавней статье Apple, но отметила, что есть ещё над чем поработать.

Тест RELIC работает следующим образом: ИИ получает формальную грамматику — по сути, точный набор правил, определяющих искусственный язык, — а также строку символов. Затем модель должна определить, является ли строка допустимой в соответствии с правилами грамматики.

Например, «предложение» (обозначается как S) определяется как «часть A», за которой следует «часть B» (S → A B). «Часть A» сама по себе состоит из «символа C» и «символа D» (A → C D), и так далее до таких правил, как «символ C становится 't43'» (C → 't43'). ИИ должен определить, может ли строка «t43 t51 t66 t72» быть сгенерирована с помощью этих правил. Важно отметить, что модель не получает примеров правильных или неправильных строк и не проходит предварительную подготовку по конкретной грамматике — она должна применять правила «с нуля», полагаясь только на описание, данное в контексте.

Чтобы добиться успеха, модель должна распознавать и правильно применять множество правил в правильном непостоянном порядке — иногда многократно и во вложенных комбинациях. По словам исследователей, это похоже на проверку правильности написания компьютерной программы или грамматической правильности предложения. Существует два типа правил грамматики: те, которые разбивают абстрактные заполнители (нетерминалы, такие как S, A, B) на другие заполнители (например, S → A B), и те, которые заменяют

связь Apple самит роды google крипто mefdayy Нью-Йорк

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследователи DeepSeek выпустили nano-vLLM — компактный движок для запуска языковых моделей habr.com / 1 год назад

Новый эксперимент с Othello подтверждает гипотезу о модели мира для больших языковых моделей habr.com / 1 год назад

Microsoft представила встроенную в Windows 11 локальную языковую модель Mu habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 03:50

бизнес продукты связь технологии конференция UserGate зарегистрировал товарный знак «Архитектура сетевого доверия»

UserGate, ведущий российский разработчик решений в области кибербезопасности, сообщил о государственной регистрации товарного знака «Архитектура сетевого доверия». Регистрация подтверждает исключительное право компании на использование данного обозначения в отношении продуктов и услуг в области информационной безопасности.

14.07 / 03:37

люди общество человек сон интересное Как заснуть намного быстрее - интересный лайфхак

Не всем людям удается быстро заснуть, однако японское упражнение поможет ускорить этот процесс.

14.07 / 03:00

люди общество женщина знаки зодиака мода и стиль Женщины, перед которыми невозможно устоять - два знака Зодиака

Некоторые женщины входят в комнату, и внезапно атмосфера вокруг них становится более напряженной.

14.07 / 01:50

продукты люди общество женщина гигиена Как рисовый отвар из Азии стал трендом современной бьюти-индустрии

Традиция использования злаковых отваров существовала у многих азиатских народов. Женщины веками применяли перебродившие растворы для очищения.

14.07 / 00:28

медицина люди здоровье общество журналист Частые ночные походы в туалет — о чем пытается предупредить ваше тело

Ученые выяснили, почему привычка просыпаться по ночам ради посещения уборной может указывать на скрытые проблемы со здоровьем, и как с этим бороться.

14.07 / 00:01

технологии SpaceX общество сад и огород интересное Украинские изобретатели участвуют в конкурсе NASA с проектом марсианского самолета

Он сможет «прыгать» по полярным шапкам Марса, собирать на них лед и превращать в топливо

13.07 / 23:22

ученые искусственный интеллект история самит О чем пользователи чаще всего просят ChatGPT — ответ ученых

Ученые проанализировали сотни тысяч диалогов и обнаружили необычные закономерности в запросах пользователей.

13.07 / 22:29

продукты продукты питания культура самит Здоровье и красота Пять доступных трав, которые снижают риски развития сахарного диабета

Традиционный салат-латук стремительно теряет популярность среди диетологов. Ему на смену приходят более концентрированные растительные источники.

13.07 / 22:29

люди ученые животные наука общество Ключ к продлению жизни до 240 лет ищут сингапурские ученые

Хронические скрытые процессы внутри тканей признаны главным катализатором старения. Они вызывают опасные поражения сердца и мозга у людей.

13.07 / 22:03

Samsung технологии экономика прогноз самит Samsung готовит к выпуску новый бюджетный смартфон Galaxy A07s

Пока компания официально не анонсировала устройство, однако обнаруженная прошивка подтверждает, что работа над смартфоном уже идет.

Лента новостей

На главную страницу