Об этом же в других СМИ

habr.com / 1 месяц назад

Вредоносный коммит подписали «от имени Claude»: жертвой стала OpenAI

habr.com / 1 месяц назад

OpenAI объединяет ChatGPT, Codex и API

habr.com / 1 месяц назад

Показания Сэма Альтмана в суде «Маск против OpenAI»: что рассказал глава OpenAI

gagadget.com / 1 месяц назад

OpenAI против Apple: AI-гигант недоволен интеграцией ChatGPT в iOS и Siri и обвиняет партнера в недобросовестном сотрудничестве

habr.com / 2 месяца назад

Андрей Карпати: главная проблема LLM — в том, как они отвечают

Больше по теме

03.05.2026 - 19:13 / habr.com

Как GPT-5.5 стала одержима гоблинами. OpenAI разобрала собственную ошибку в RL

OpenAI опубликовала технический разбор необычного бага: флагманская GPT-5.5 в кодинг-агенте Codex стала странно часто вставлять в ответы гоблинов, гремлинов, троллей, енотов и голубей — и компании пришлось дважды вписать в системный промпт прямой запрет на эти слова. Самая показательная цифра из расследования: пользовательская "личность" Nerdy давала всего 2,5% ответов ChatGPT, но на нее приходилось 66,7% всех упоминаний "goblin".

История всплыла, когда исследователи нашли в открытом репозитории Codex CLI строку: "Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях и других животных или существах, если это абсолютно и однозначно не относится к запросу пользователя". Причем строка продублирована — инженеры явно не были уверены, что одного запрета хватит. Параллельно пользователи OpenClaw жаловались, что агент использует слово "goblin" по несколько раз в день, иногда вместо нейтральных слов "штука" или "вещь". На X появился мем про Goblin Mode, а Сэм Альтман выложил скриншот с подписью "Запускайте обучение GPT-6, можете забирать весь кластер. Больше гоблинов!".

Корни слов-паразитов OpenAI начала искать еще в ноябре, после релиза GPT-5.1: упоминания "goblin" в ChatGPT тогда выросли на 175%, "gremlin" — на 52%. Сначала это казалось безобидной лексической причудой. В GPT-5.4 рост стал заметнее, а при тестировании GPT-5.5 в Codex сотрудники сразу увидели, что модель буквально тянется к существам. Тогда и нашли первую зацепку: упоминания существ концентрировались у пользователей, выбравших одну из настраиваемых "личностей" ChatGPT — Nerdy, нарочито умную, игривую и ироничную.

Дальше начались цифры. На Nerdy приходилось всего 2,5% ответов ChatGPT, но 66,7% всех упоминаний "goblin". Аудит показал и механику: в

общество самит расследование интересное животный мир Сэм Альтман runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI представила первую голосовую модель с интеллектом GPT-5 habr.com / 2 месяца назад

От 96% до нуля: как Anthropic отучила Claude от шантажа habr.com / 2 месяца назад

Идеальный полигон для ИИ: Google DeepMind стала совладельцем разработчиков EVE Online habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 09:27

технологии смартфоны BMW мода и стиль Дом и интерьер Пятое поколение BMW X5: ИИ, 5 моторов и зарядка за 22 минуты

Компания BMW представила новое, пятое поколение популярного кроссовера X5, который получил масштабное обновление в рамках перехода бренда к дизайну Neue Klasse.

15.07 / 09:23

самит совет интересное лайфхак гаджет Как ускорить работу любого телевизора: есть простой трюк

Современные "умные" телевизоры могут терять прежнюю скорость работы и всё чаще демонстрируют задержки при запуске программ. Особенно досадно, когда операционная система начинает давать сбои или бесконечно загружать видео прямо посреди запланированного кино-вечера.

15.07 / 09:22

Amazon общество visa mastercard google Linux Foundation запустила организацию x402 для развития стандарта интернет-платежей между ИИ-агентами

Некоммерческая организация Linux Foundation объявила о начале работы x402 Foundation. Это новый орган открытого управления, созданный для руководства протоколом x402. Одновременно криптобиржа Coinbase завершила передачу протокола новому фонду. В пресс-релизе отмечается, что x402 интегрирует платежные функции непосредственно во взаимодействие HTTP, позволяя искусственному интеллекту, API и приложениям автоматически осуществлять и получать платежи так же просто, как они обмениваются данными. Как новый протокол для интернет-платежей x402 может изменить Web3-экономику? 27.10.2025 Читать Протокол поддерживает карты и стейблкоины В Linux Foundation заявили, что x402 должен стать открытым стандартом для интернет-платежей без привязки

15.07 / 09:22

банк евро visa пилот Еврозона ЕЦБ выбрал 36 компаний для тестирования цифрового евро в 2027 году

Европейский центральный банк (ЕЦБ) объявил об отборе 36 поставщиков платежных услуг из стран еврозоны для участия в пилотном проекте цифрового евро. Тестирование стартует во второй половине 2027 года и продлится 12 месяцев. Инициатива должна проверить техническую готовность CBDC, улучшить пользовательский опыт и приблизить ЕС к потенциальному запуску цифрового евро, который в настоящее время планируется в 2029 году. Пилот также рассматривают как очер

15.07 / 09:19

Volkswagen продукты самит автомобили Дом и интерьер Volkswagen Tiguan празднует 20 лет: юбилейная версия EDITION 20 и «красный клен»

Volkswagen празднует двадцатилетие своей главной «дойной коровы» — кроссовера Tiguan. По этому случаю компания Volkswagen выпустила спецверсию EDITION 20, которая намекает, что два десятилетия на рынке — это не просто стаж, а повод для новых дисков и эксклюзивной краски. Заказать новинку можно уже сейчас, хотя ценник заставляет задуматься: базовый вариант обойдется в 45 300€ (2 016 000 грн).

15.07 / 09:19

самит capcom Инсайдер про новую стратегию Capcom: игры Resident Evil будут получать масштабные дополнения вместо промежуточных “экспериментов”

Главный инсайдер по хоррорам Dusk Golem поделился новой информацией о планах Capcom по развитию франшизы Resident Evil.

15.07 / 09:19

экономика Путешествия дети семья бюджет Семь мест и «хрустальное лицо»: Skoda выводит на рынок электрический SUV Peaq

Пока вы раздумывали, стоит ли пересаживаться на электричество, Шкода (Skoda) решила, что стоит — и сразу большой компанией. Чехи анонсировали цены и комплектации своего нового флагманского электрокроссовера Шкода Пик (Skoda Peaq). Это не замена популярному Кодиак (Kodiaq), а его технологический «брат», который пытается доказать, что семейные путешествия без выхлопной трубы — это не только экологично, но и вполне реально, если ваш бюджет позволяет подобные эксперименты.

15.07 / 09:16

финансы люди общество звезда интересное Какие знаки Зодиака забудут о проблемах - звезды обещают счастье

Лишь у нескольких начнется период романтики, откровенных разговоров и приятных перемен, говорят астрологи.

15.07 / 09:07

Samsung здоровье самит велоспорт Samsung показала новые Galaxy Watch перед презентацией: ИИ, титановый корпус и рекордная автономность

Ожидается, что уже 22 июля на мероприятии в Лондоне Samsung представит сразу несколько новинок: Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, а также новые смарт-часы Galaxy Watch Ultra2 и Galaxy Watch9.

15.07 / 08:59

деньги закон Tesla выплаты адвокат Пользователь Xbox через суд восстановил доступ к своей игровой библиотеке после удаления аккаунта из-за якобы взлома

Пользователь Xbox в Бразилии через систему малых исков добился доступа к своей учётной записи и цифровой библиотеке купленных игр после удаления аккаунта из-за потенциального взлома.

Лента новостей

На главную страницу