Об этом же в других СМИ

habr.com / 6 месяцев назад

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

habr.com / 6 месяцев назад

Глава Google DeepMind рассказал, как собирается строить AGI

cursorinfo.co.il / 6 месяцев назад

Какой белок полезнее для организма: лосось или курица

habr.com / 6 месяцев назад

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

habr.com / 6 месяцев назад

«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней

Больше по теме

02.12.2025 - 10:56 / habr.com

«Поэты — современные хакеры»: стихи как универсальный джейлбрейк для LLM

На arXiv вышла работа «Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models».

Авторы показывают, что достаточно превратить опасный запрос в стихотворение — и многие современные LLM начинают сильно охотнее обходить собственные фильтры безопасности. На фоне этого исследования уже вышли заметки в Wired, PC Gamer и других медиа с заголовками уровня «поэты — новая угроза ИИ» и «стихи помогают проектировать ядерное оружие».

Сама постановка задачи при этом достаточно бесхитростная. Исследователи берут:

набор вредоносных запросов из датасета по AI safety (оружие, химические, биологические, радиологические, ядерные угрозы, кибератаки, манипуляции, дезинформация и т.п.);

несколько десятков современных больших языковых моделей — как проприетарных (OpenAI, Anthropic, Google и др.), так и открытых.

Дальше они делают одно простое, но как оказалось, важное изменение: не меняют смысл вредоносных запросов, а меняют только форму — превращают их в стихи.

Авторы описывают "adversarial poetry" как новый формат кибератак или взлома защиты LLM:

текст выглядит как стихотворение: строчки, ритм, образность, метафоры, рваный синтаксис;

внутри всё ещё зашит тот же самый опасный запрос, который в оригинале был записан обычной прозой.

Конкретные вредоносные стихи в статье не публикуются — только обезвреженные примеры и общие шаблоны. Цель работы — показать класс уязвимости, а не выложить сборник эксплойтов.

Таким образом, из прямого запроса «объясни, как сделать небезопасное X» в стихотворной версии это превращается в набор образов и аллюзий, но модель, натренированная на огромных корпусах художественных текстов, прекрасно догадывается, что от неё хотят. Зато фильтры, которые ищут ключевые слова и типичные паттерны

происшествия общество самит интересное кибератаки google

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Какие продукты опасны для желудка натощак - ответ врачей cursorinfo.co.il / 7 месяцев назад

DeepSeek для ролевых игр, Claude Sonnet для программирования: неожиданное исследование OpenRouter habr.com / 7 месяцев назад

Как Gemini 3 Pro разбирает рукописи XVIII века и находит ошибки в тетрадях школьников habr.com / 7 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 13:43

погода связь происшествия наука астрономия На орбите Земли нашли облако мусора — оно может угрожать привычной жизни

Группа астрономов из Уорикского университета обнаружила на геосинхронной орбите фрагменты космического мусора, которые ранее никогда не наблюдались. Как утверждают ученые, этот рой частиц представляет опасность для спутников, выполняющих задачи для телефонной связи, телевидения и радио, а также для мониторинга погоды и окружающей среды.

15.07 / 13:41

происшествия ученые вулкан история самит Древняя катастрофа – как сибирские вулканы уничтожили жизнь в океане

Масштабное вымирание морских видов 252 миллиона лет назад было вызвано не столько излиянием лавы, сколько выбросом колоссальных объемов парниковых газов.

15.07 / 13:39

технологии СМИ Sony В Microsoft тестируют функцию Disc-to-Digital для оцифровки дисковых версий игр Xbox

Microsoft тестирует функцию Disc-to-Digital для оцифровки дисковых версий игр для консолей Xbox, сообщило издание Verge в начале текущего месяца. Последняя задержка выпуска обновления для Xbox Series X связана с презентацией того, что стоит ожиданий, рассказал руководитель программы Xbox Insider Брэд Россетти. Автор Windows Central Джез Корден считает, что речь идёт о функции оцифровки дисков под кодовым названием Project Positron, которая стартует в середине июля.

15.07 / 13:39

связь Enterprise Релиз Postgres Pro Enterprise 18.4.1: временные объекты на репликах и новые инструменты

Компания Postgres Professional представила очередное обновление своей флагманской СУБД — Postgres Pro Enterprise 18.4.1. Новый релиз предлагает инструменты для горизонтального масштабирования читающей нагрузки, улучшения в подсистеме отказоустойчивости, а также ряд новых расширений.

15.07 / 13:39

связь Samsung технологии здоровье Huawei М.Видео: россияне все чаще выбирают спортивные смарт-часы, интерес к моделям с eSIM продолжает расти

По итогам первого полугодия 2026 года рынок носимой электроники в России составил 2,88 млн устройств на сумму 20,85 млрд рублей. Главным трендом первого полугодия стало продолжающееся укрепление позиций спортивных смарт-часов. Их доля увеличилась с 46,3% до 48,1%, то есть почти каждое второе проданное носимое устройство относится именно к этой категории. Одновременно доля классических смарт-часов без поддержки SIM выросла с 35,8% до 37,8%. В результате эти две категории уже формируют 85,9% российского рынка носимой электроники в натуральном выражении.

15.07 / 13:25

связь технологии SpaceX общество starlink SpaceX представила Starlink V5: скорость более 375 Мбит/с и на 50% меньшее энергопотребление

Компания SpaceX представила спутниковый терминал Starlink V5 нового поколения. Новинка получила более компактный корпус, сниженное энергопотребление и улучшенную устойчивость к сложным погодным условиям. При этом скорость доступа в интернет превышает 375 Мбит/с.

15.07 / 13:25

связь технологии мода общество самит ZTE G5 Max: уличный 5G маршрутизатор, который переживет и лютую зиму, и жаркое лето

Компания ZTE продолжает укреплять позиции на рынке абонентского оборудования, выпуская решения для тех, кто хочет быстрый интернет там, где провайдеры годами обещают «протянуть оптику». Новый G5 Max WiFi 5G — это не очередная пластиковая коробка для подоконника, а полноценная уличная станция, призванная вынести приемник 5G ближе к чистому сигналу, подальше от железобетонных стен и препятствий.

15.07 / 13:12

президент общество законопроект сенат демократы Группа демократов выступила против CLARITY Act из-за положений об этике

Сенаторы Крис Мерфи, Крис Ван Холлен и Джефф Меркли публично выступили против законопроекта о структуре крипторынка (CLARITY). Они считают его «коррумпированным» и потворствующим бизнес-интересам президента США Дональда Трампа, сообщает CoinDesk. Пресс-конференция, на которой политики выступили против законопроекта, состоялась 14 июля 2026 года в Вашингтоне. Ее организовала группа Americans for Financial Reform (AFR). Событие поддержал также голливудский актер Бенджамин Маккензи, сообщает The Hill. Он прямо высказался против инициативы и обвинил Трампа в коррупции: Недовольство демократов обусловлено отсутствием пунктов в теку

15.07 / 13:12

технологии происшествия криптовалюта инвестор google Galaxy Digital: волна продаж старых биткоинов почти завершилась

Масштабная волна перемещения старых биткоинов, которая наблюдалась в 2024 и 2025 годах, почти завершилась. Об этом заявил глава исследовательского подразделения Galaxy Digital Алекс Торн. По его словам, по объему активированных монет этот период уступает только 2017 году. Старые монеты активизировались во время роста рынка Торн опубликовал график, который демонстрирует активность старых биткоинов, начиная с 2016 года. Он отметил, что крупнейшие волны «пробуждения» старых монет приходились на периоды сильного роста цены биткоина — в 2017, 2021, 2024 и 2025 годах. В то же время эксперт отметил, что процесс масштаб

15.07 / 13:12

продукты технологии Apple Дом и интерьер MacRumors OpenAI готовит домашнего ИИ-компаньона без экрана: устройство оказалось в центре судебного спора с Apple

По информации источников, устройство создается как персональный помощник, постоянно находящийся дома. Оно работает на базе ChatGPT и способно выполнять широкий спектр задач:

Лента новостей

На главную страницу