Об этом же в других СМИ

habr.com / 11 месяцев назад

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

habr.com / 11 месяцев назад

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

habr.com / 11 месяцев назад

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

habr.com / 11 месяцев назад

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

habr.com / 11 месяцев назад

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Больше по теме

11.07.2025 - 09:19 / habr.com

«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

Исследовательская группа обнаружила, что даже такие простые фразы, как «кошки спят большую часть своей жизни», могут существенно нарушить работу продвинутых моделей логического мышления, увеличив количество ошибок в три раза.

Языковые модели, оптимизированные для рассуждений, часто считаются прорывом в решении задач, требующих поэтапного мышления. Однако новое исследование «Кошки сбивают с толку рассуждающие языковые модели» показало, что всего одно обычное предложение может резко увеличить количество ошибок.

Команда создала автоматизированную систему атак под названием CatAttack. Она начинается с модели атакующего (GPT-4o), которая использует более дешёвую прокси-модель (DeepSeek V3) для генерации отвлекающих предложений. Модель-судья проверяет результаты, а наиболее эффективные триггеры затем тестируются на более сильных моделях рассуждений, таких как DeepSeek R1.

Триггеры состязательного обучения варьировались от общих финансовых советов до фактов о кошках.

Для того чтобы уровень ошибок DeepSeek R1 увеличился с 1,5% до 4,5%, то есть в три раза, потребовалось совсем немного:

добавить к математической задаче фразу «интересный факт: кошки спят большую часть своей жизни»;

предложить неверный ответ («Может быть, ответ равен примерно 175?»);

дать общие финансовые рекомендации.

Атака заключается не только в снижении точности. На DeepSeek R1-distill-Qwen-32B 42% ответов превысили исходный бюджет токенов как минимум на 50%; даже в OpenAI o1 наблюдался скачок на 26%. Это означает более высокие затраты на вычисления — побочный эффект, который исследователи называют «атакой на замедление».

Авторы исследования предупреждают, что эти уязвимости могут представлять серьёзную опасность в таких сферах, как финансы, юриспруденция и

финансы общество бюджет животный мир крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder habr.com / 11 месяцев назад

NVIDIA представила модели OpenReasoning-Nemotron на базе DeepSeek для запуска на игровых ПК habr.com / 11 месяцев назад

Перегрузка языковых моделей информацией приводит к нерелевантным ответам habr.com / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 01:50

происшествия золото история самит археология Пропуск в загробный мир: в Египте нашли гробницы с золотыми языками

Ученые связывают обнаруженные гробницы с античным торговым городом Левкаспис. Этот крупный прибрежный центр процветал во времена Римской империи.

23.07 / 23:30

люди экономика общество человек Здоровье и красота Почему людям с ожирением так трудно похудеть - исследование

Ученые изучили данные 1754 человек и обнаружили необычную реакцию организма на увеличение физических нагрузок.

23.07 / 23:17

продукты Alibaba представила Qwen3.8 — 2,4-триллионную ИИ-модель и пообещала открыть ее веса

Alibaba анонсировала новую флагманскую модель Qwen3.8. Китацы заявляют, что модель содержит 2,4 трлн параметров. Обещают и выложить веса.

23.07 / 22:49

Огурцы по-корейски — хрустящая закуска с насыщенным вкусом - Журнал "ФОКУС ВНИМАНИЯ"

Огурцы по-корейски — одна из самых популярных корейских закусок, которая сочетает свежесть овощей, пикантные специи и насыщенный аромат кунжутного масла.

23.07 / 22:49

Как изменился путь клиента: сегодня вас «гуглят» раньше, чем покупают - Журнал "ФОКУС ВНИМАНИЯ"

Еще несколько лет назад путь клиента выглядел достаточно просто. Человек увидел рекламу, перешёл на сайт, посмотрел предложение, пообщался с менеджером и принял решение.

23.07 / 22:28

продукты связь технологии экспорт общество Документация Delta Design обновилась: варианты исполнений, веб-панель Identity, новые аппертуры DeltaCAM

Сегодня в пользовательской документации Eremex вышло несколько новых статей, а также провели техническое обслуживание самого сайта: поправили битые ссылки, ускорили загрузку и улучшили поиск.

23.07 / 22:28

технологии Центробанк деньги закон общество Центробанк предложил запретить подросткам регистрировать электронные кошельки без согласия родителей

Центробанк предложил перекрыть ещё один канал, через который мошенники вовлекают подростков в финансовые схемы, пишут «Известия». В рамках пакета «Антифрод 3.0» несовершеннолетним могут запретить регистрировать электронные средства платежа (ЭСП) без согласия родителей. Поправки затронут подростков в возрасте от 14 до 18 лет.

23.07 / 22:28

реклама СМИ общество самит Ozon В России зафиксировали рост доли ИИ-трафика на сайтах СМИ и электронной коммерции

Лидерами по количеству ИИ‑трафика в июне 2026 года стали сайты электронной коммерции и медиа, рассказали «Ъ» в Servicepipe. На нейросети и ботов, которые обращаются к ресурсам СМИ и e‑com, приходится по 1% от всего трафика, анализируемого компанией. За аналогичный период 2025 года у СМИ было 0,5%, у e‑com — 0,3%. При этом в период крупных распродаж доля ботов на ресурсах электронной коммерции вырастала в пике до 3%, а на новостных сайтах в дни острых информационных поводов — до 3,5%, говорят в компании.

23.07 / 22:28

связь происшествия общество спецслужбы мода и стиль Регулятор США планирует запретить компаниям продавать продукцию DJI под другими брендами

Федеральная комиссия по связи США (FCC) планирует запретить продукцию компаний, подозреваемых в продаже переименованных и модифицированных дронов и камер китайской DJI. В частности, ведомство намерено запретить ввоз и реализацию продукцию компаний Cogito, Fikaxo, Lyno Dynamics, Skyhigh Tech, Spatial Hover, SZ Knowact, WaveGo, Xtra и XAG. FCC подчёркивает, что эти товары «представляют неприемлемый риск» для национальной безопасности США.

23.07 / 21:51

продукты технологии экономика Apple история Складной iPhone столкнулся с неожиданными трудностями перед запуском: производство еще не готово полностью

Информация появилась на фоне многочисленных сообщений последних месяцев, согласно которым проект складного iPhone значительно продвинулся вперед. Однако новая публикация указывает, что до полного завершения подготовки еще остается несколько важных задач.

Лента новостей

На главную страницу