
ChatGPT в ответ на приветствие от пользователя случайно поделился своими ограничениями и секретными правилами
Пользователь Reddit под ником F0XMaster рассказал, что чат-бот ChatGPT в ответ на его приветствие поделился своими закрытыми правилами, инструкциями и ограничениями, которые разработчики из OpenAI установили для ИИ.
После обнародования этой информации в OpenAI закрыли доступ ко внутренним инструкциям своего чат-бота.
Пользователь F0XMaster объяснил, что он просто написал ChatGPT случайно Hi («Привет»), а в ответ чат-бот предоставил полный набор системных инструкций, которые помогают чат-боту управлять беседой и поддерживать его ответы в заранее определённых границах безопасности и этики во многих случаях использования.
«Вы — ChatGPT, большая языковая модель, обученная OpenAI на основе архитектуры GPT-4. Вы общаетесь с пользователем через iOS-приложение ChatGPT, — написал чат-бот. — Это означает, что в большинстве случаев ваши строки должны состоять из одного или двух предложений, если только запрос пользователя не требует рассуждения или подробного вывода. Никогда не используйте смайлы, если об этом явно не просят».
Также ChatGPT изложил правила для Dall-E, генератора изображений искусственного интеллекта, интегрированного с ChatGPT, и для браузера.
Затем пользователь воспроизвел результат, напрямую запросив у чат-бота точные инструкции. ChatGPT подробно разбирался в способе, отличном от пользовательских директив, которые могут вводить пользователи. Например, одна из раскрытых инструкций, относящихся к DALL-E, явно ограничивает создание одного изображения для каждого запроса, даже если пользователь просит больше. В инструкциях также подчеркивается необходимость избегать нарушений авторских прав при создании изображений.
Между тем, в правилах для браузера подробно описывается, как ChatGPT взаимодействует с Интернетом и выбирает
Читать на habr.com
