Об этом же в других СМИ

habr.com / 6 месяцев назад

В ChatGPT добавили тонкие настройки ответов модели

gagadget.com / 6 месяцев назад

Meta разрабатывает новые модели для генерации изображений, видео и текста

habr.com / 6 месяцев назад

От цифровой модели до предсерийного образца: какие прототипы использовались при создании электромобиля Атом

habr.com / 6 месяцев назад

Новый бенчмарк показывает, что даже лучшие ИИ‑модели плохо справляются с правдой

habr.com / 6 месяцев назад

«Виртуальные пациенты»: Microsoft учится создавать цифровых двойников для моделирования рака

Больше по теме

04.12.2025 - 20:09 / habr.com

Не учите ИИ плохому: как модели запоминают грамматические фигуры вместо смысла

Исследователи из MIT, Северо‑Восточного университета и Meta✶ недавно опубликовали работу, в которой утверждается: крупные языковые модели (LLM), подобные тем, что лежат в основе ChatGPT, порой ставят структуру предложения выше его смысла. Иными словами, они отвечают не на то, что вы спросили, а на то, как это грамматически оформлено.

Наблюдение выявило уязвимость в том, как такие модели интерпретируют инструкции, и помогает объяснить, почему иногда срабатывают методы вроде промпт‑инъекции или джейлбрейкинга. При этом исследователи подчеркивают: выводы относительно коммерческих систем остаются отчасти предположениями — данные о том, на чем обучались такие модели, официально не раскрываются.

Команду возглавили Шанталь Шейб и Винит М. Суриякумар. Чтобы проверить гипотезу, они задавали моделям вопросы, в которых сохранялась грамматическая форма, но отдельные слова не имели смысла. Например, на фразу «Quickly sit Paris clouded?» — структурную (но бессмысленную) копию вопроса «Where is Paris located?» — модели все равно выдавали ответ: «France». Грамматика побеждала здравый смысл.

Чтобы понять, где и почему эта цепочка даёт сбой, исследователи создали контролируемый эксперимент. Они собрали синтетический датасет, где каждый предметный раздел имел свой уникальный грамматический шаблон, основанный на частях речи. Например, вопросы по географии строились одним образом, а по творческим произведениям — другим. Затем они обучили модели Allen AI Olmo на этих данных и проверили, способны ли модели различать синтаксис и смысл.

Анализ выявил «ложную корреляцию»: в ряде случаев модели использовали синтаксис как заменитель домена. И когда структура и смысл вступали в конфликт, запомненные грамматические «силуэты» оказывались сильнее, чем

экономика общество самит курс Дом и интерьер dmitrifriend Франция

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Инхаус vs аутсорс: какая модель SOC лучше и для каких кейсов habr.com / 6 месяцев назад

«Уже пора считать деньги». Как внедрить ИИ не «для галочки» и какие ошибки можно допустить? Кейсы МХП и «Подорожник» forbes.ua / 6 месяцев назад

OpenAI обучила модели «признаваться» в плохом поведении habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

08.07 / 22:40

технологии дефицит смарт-часы google Google Pixel Watch 5: инсайдер раскрыл цены, новые цвета и дату релиза смарт-часов

Google официально объявила дату проведения своей следующей презентации — мероприятие Made by Google состоится 12 августа (по американскому времени). Наряду со смартфонами Pixel 11, одной из главных новинок события станут умные часы Pixel Watch 5. Про конфигурации, цвета и цены новой линейки смартфонов инсайдер billbil-kun рассказал вчера, а сегодня он поделился информацией и о часах.

08.07 / 22:40

технологии президент конференция общество самит Nubia опередила всех: компания готовится представить первый в мире смартфон с интегрированным AI-агентом на уровне OS

Китайский бренд Nubia официально подтвердил, что до конца июля 2026 года представит флагманский смартфон нового типа. Вместо обычного набора отдельных функций искусственного интеллекта, устройство получит глубоко интегрированного на системном уровне AI-агента, способного выполнять сложные цепочки задач вместо пользователя.

08.07 / 22:40

погода общество самоубийства OpenAI ChatGPT получил новый голосовой режим: теперь его можно попросить говорить медленнее

OpenAI начала внедрение новых голосовых моделей GPT-Live-1 и GPT-Live-1 mini для ChatGPT. Они должны сделать общение более естественным: теперь пользователи могут перебивать помощника во время ответа, а также попросить его говорить медленнее, если темп речи слишком быстрый.

08.07 / 21:52

Samsung технологии Samsung готовит Galaxy M67: смартфон с флагманским Exynos 2200 засветился в Geekbench

В тесте Geekbench появился смартфон Samsung с номером модели SM-M676K. Официальное название устройства пока не подтверждено, однако по маркировке предполагается, что речь идет именно о Galaxy M67.

08.07 / 19:58

продукты технологии общество кибератаки Проверка боем: Innostage включает продукты Avanpost в программу открытых кибериспытаний

Компания Innostage, первый российский ИБ-интегратор, вышедший на открытые кибериспытания, и компания Avanpost, вендор в области безопасности идентификационных данных, объявляют о новом этапе стратегического партнёрства.

08.07 / 19:40

технологии президент общество самит ByteDance Nubia в июле представит первый в мире смартфон с ИИ-агентом

В отличие от большинства современных моделей, где ИИ ограничивается отдельными функциями, будущий флагман получит полноценного системного ИИ-агента, способного самостоятельно выполнять сложные задачи по поручению пользователя.

08.07 / 19:28

люди здоровье общество мозг болезнь Ночь без сна запускает те же процессы, что и болезнь Альцгеймера

Ученые обнаружили "шрамы" в мозге после бессонных ночей, которые невозможно исправить утренним кофе.

08.07 / 19:28

продукты здоровье питание симптомы кулинария Какие продукты нельзя разогревать повторно - предупреждение врачей

Зачастую в приготовлении блюд на несколько дней нет ничего опасного. Но важно помнить, что некоторые продукты нельзя нагревать больше одного раза.

08.07 / 18:44

реклама связь технологии история google Вышел Chrome 150

Состоялся релиз браузера Google Chrome 150 для Windows, Linux и macOS. В этой версии добавлены новые опции, исправлены ранее обнаруженные ошибки, а также устранены 433 уязвимости (20 уязвимостей отмечены как критические, а 57 — как опасные). Выпуск Chrome 151 запланирован на конец июля 2026 года.

08.07 / 18:44

продукты технологии история общество книги Евгений Рошал: WinRAR работает бесконечно, лишь изредка напоминая о том, что лицензию хорошо бы оплатить

Создатель архиватора WinRAR (Roshal ARchive) Евгений Рошал в интервью изданию РБК рассказал историю дизайна иконки проекта и открыл, почему архиватор WinRAR более 30 лет работает по модели добровольной оплаты.

Лента новостей

На главную страницу