

«Не галлюцинируй»: реддитор достал из macOS 15.1 Beta 1 системные промпты Apple Intelligence
Пользователь Reddit обнаружил системные промпты Apple Intelligence в бета-версии операционной системы macOS 15.1. В промптах даны текстовые инструкции, как большая языковая модель должна выполнять различные умные функции.
Большие языковые модели (БЯМ) получают на входе кодируемый в виде токенов текстовый промпт, в ответ на который выдают последовательность токенов ответа. Ввод также называют контекстным окном. Это не значит, что БЯМ получает на входе в API от приложения только данные для обработки. Первыми абзацами приходят задающие поведение модели инструкции, называемые системным промптом.
Если ознакомиться с системными промптами веб-сервисов ChatGPT или Claude, то может показаться, что особой трактовки не требуется. Системный промпт таких ботов выглядит как описание роли, которую БЯМ должна исполнять, некоторые указания по формату ответа и сегодняшнюю дату.
На деле системный промпт лаконичен, не содержит ничего лишнего и написан по результатам экспериментов. Формулировка инструкций выверена и чем-то обоснована. К примеру, о роли каждого пункта системного промпта веб-чата Claude рассказывала специалист по этике в Anthropic Аманда Аскелл. Четвёртый абзац системного промпта этого чат-бота пытается сделать его политические взгляды нейтральными, шестой — убирает вызванные четвёртым абзацем артефакты «обе стороны в чём-то правы» в аргументации, последний — снижает избыточную цитируемость системного промпта и так далее.
Не все следуют примеру Anthropic. Часть компаний намеренно пытается скрыть системный промпт. Чтобы всё же «достать» его из недр приложения, иногда нужны джейлбрейки и запутывание, чтобы БЯМ нарушила собственные правила. Поэтому системные промпты популярных чат-ботов всё равно известны. Ознакомиться с ними полезно
Читать на habr.com