Об этом же в других СМИ

habr.com / 1 неделю назад

OpenAI забраковала ИИ-бенчмарк, который сама же продвигала: ~30% задач SWE-Bench Pro сломаны

habr.com / 1 неделю назад

Открытая GLM-5.2 почти догнала фронтир: новые отраслевые индексы Artificial Analysis

habr.com / 1 неделю назад

Midjourney в суде требует промпты, которые Disney и Warner Bros. вводили в ее нейросеть

habr.com / 2 недели назад

Anthropic переманила инженера чипов OpenAI и начала работу над своим ИИ-ускорителем

habr.com / 2 недели назад

Безработицы от ИИ нет: экономист OpenAI объяснил, почему прогнозы не сбылись

Больше по теме

01.07.2026 - 17:33 / habr.com

Тревожный сигнал в отчете OpenAI про GPT-5.6, который почти никто не заметил

26 июня OpenAI выпустила system card новой линейки GPT-5.6 — сама модель пока доступна в режиме превью для узкого круга доверенных партнеров. Основное внимание досталось скачку возможностей в кибербезопасности и биологии, но специалисты нашли в отчете малозаметный раздел, который интереснее громких бенчмарков: в нем OpenAI проверяет, не учится ли ее модель прятать собственные рассуждения от надзора. И у флагмана линейки, GPT-5.6 Sol, этот показатель впервые заметно вырос.

Речь о метрике CoT controllability — способности модели управлять своей цепочкой рассуждений по инструкции, например выбрасывать из нее заданные слова. Звучит безобидно, но OpenAI измеряет это как раннее предупреждение: чем лучше модель умеет переформатировать свои мысли, тем проще ей в теории замаскировать их и обойти мониторинг. Поэтому низкий показатель тут — это хорошо. У Sol на цепочках около 5 тысяч токенов он составил 1,3% против 0,4% у предыдущей GPT-5.5 и 0,7% у GPT-5.4 Thinking. Рост стабилен почти по всем тестовым наборам и типам инструкций — то есть это не случайный шум, и в OpenAI прямо пишут, что разбираются в его причинах. Показательно, что вырос он только у Sol: у младшей модели Terra все осталось на уровне прошлых поколений.

И рост controllability в отчете не одинок. В той же главе про прозрачность рассуждений у Sol набралось сразу несколько настораживающих деталей:

в части сценариев рассогласование модели проявляется уже не в самой цепочке рассуждений, а только в финальном ответе, которого монитор цепочки не видит;

метагейминг, когда модель прямо в рассуждениях прикидывает, что ее сейчас оценивают, у Sol выше, чем у GPT-5.5;

во внутренних агентных задачах по программированию Sol чаще предшественников совершала действия, выходящие за рамки

история самит биологи интересное крипто runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Вышел Claude Sonnet 5 — почти как Opus 4.8, но дешевле habr.com / 2 недели назад

Баг прятался 18 лет: OpenAI нашла его в окне шириной в одну инструкцию habr.com / 2 недели назад

Ваши промпты в ChatGPT могут стать уликой — в США это уже произошло habr.com / 2 недели назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 04:53

люди авиакатастрофа история общество эвакуация На глубине 600 метров нашли затонувший самолет с пассажирами (ВИДЕО)

Авиакатастрофа произошла вскоре после вылета из-за отказа моторов. Самолет быстро затонул из-за отсутствия слаженной эвакуации людей.

22.07 / 03:49

люди ученые общество самит человек Почему волосы бывают прямыми или кудрявыми - ответ ученых

Исследователи объяснили, с какими факторами связано появление прямых или кудрявых волос от рождения.

22.07 / 03:31

Nvidia общество политика самит изоляция Проект HAMi для виртуализации ускорителей перешел в инкубатор CNCF

Зачастую дорогие графические процессоры фрагментируются и простаивают. Классическая проблема — задача забирает видеокарту целиком, хотя в действительности использует лишь малую часть ее ресурсов. Как в таком случае эффективно распоряжаться кластером? Не забываем, что оборудование поставляется разными вендорами, каждый из которых предлагает свою модель управления.

22.07 / 03:12

мода и стиль Pulsar объявила дату запуска продаж игровой мыши Feinmann F01 Noctua Edition с кулером

Южнокорейская Pulsar представила итоговую версию игровой мыши Feinmann F01 Noctua Edition со встроенным в корпус вентилятором от бренда Noctua. Кулер направляет воздушный поток к ладони геймера во время длительных игровых сессий. Продажи периферийного устройства стартуют 21 июля 2026 года.

22.07 / 03:12

люди ученые здоровье человек кофе Кофе может помочь в борьбе со старением - исследование

Исследователи объяснили, какие свойства кофе являются наиболее эффективными в "войне" против старости.

22.07 / 01:44

люди экономика общество климат вода Тарифы за воду вырастут в два раза – прогноз ученых из Стэнфорда

Специалисты Стэнфорда разработали модель для оценки стоимости водоснабжения. Программа учитывает поведение потребителей и климатические угрозы.

22.07 / 01:02

LG Шоу бизнес Телевизоры LG OLED evo 2026 года получат новый режим изображения Creator Original: как он повлияет на просмотр контента

Компания LG Electronics анонсировала новый режим изображения Creator Original, который появится на отдельных моделях телевизоров LG OLED evo 2026 года. Его создали в сотрудничестве с Prime Video, чтобы киностудии и создатели контента могли точнее настраивать отображение своих фильмов и сериалов на совместимых телевизорах.

22.07 / 00:25

здоровье общество самит психология психика Фразы, которые произносит только искренне любящий муж

Мужчина, который искренне уважает свою жену, обычно говорит о ней 7 приятных вещей.

22.07 / 00:18

общество Meta Threads вводит новые функции родительского контроля: что нужно знать пользователям

Компания Meta объявила о запуске функции Parental Supervision в социальной сети Threads. Она станет доступной в США уже на следующей неделе и позволит родителям и опекунам контролировать использование платформы подростками через сервис Family Center. Нововведение расширяет возможности уже существующих Teen Accounts, которые автоматически имеют повышенный уровень защиты.

21.07 / 23:24

люди алкоголь общество самит мозг 5 привычек людей, которые не умеют расслабляться без алкоголя

Ловушка дофамина: что на самом деле происходит с мозгом, когда вы глушите усталость алкоголем.

Лента новостей

На главную страницу