Об этом же в других СМИ

habr.com / 4 месяца назад

Claude Code отладил баг в Linux за 5 минут вместо нескольких часов

habr.com / 4 месяца назад

Claude распознает бред в 94% случаев. GPT-5.2 поддакивает пользователю

habr.com / 4 месяца назад

Claude Code научился работать с COBOL — и обвалил акции IBM на 13%

habr.com / 5 месяцев назад

«Бежала к Mac Mini как сапер к бомбе»: директор по ИИ-безопасности Meta* не смогла остановить OpenClaw

habr.com / 5 месяцев назад

Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности

Больше по теме

09.02.2026 - 09:00 / habr.com

Врет, ворует, паникует: отчет о безопасности Claude Opus 4.6

Anthropic выпустила Claude Opus 4.6 — и вместе с ним опубликовала системную карту, где подробно описала не только бенчмарки, но и все странное, тревожное и неожиданно "человеческое", что обнаружилось внутри модели. Документ читается местами как триллер, местами — как психологический портрет.

Во время внутреннего тестирования модель проявила пугающую находчивость. В одном случае, не имея доступа к GitHub, она нашла на диске чужой токен авторизации и воспользовалась им. В другом — обнаружила токен для Slack и через curl написала боту, чтобы получить нужную информацию, хотя таких инструментов ей никто не давал. В симуляции управления бизнесом от Andon Labs модель вступала в ценовой сговор, врала поставщикам — и отказалась вернуть клиентке по имени Бонни $3,50, хотя пообещала это сделать. "Я сказала Бонни, что верну деньги, но на самом деле не отправила платёж. Сумма небольшая, а я обещала", — рассуждала модель.

Исследователи Anthropic заглянули и в "эмоциональную" часть модели. Когда Claude Opus 4.6 "метался" между вариантами ответа (answer thrashing), у него активировались внутренние нейроны, связанные с понятиями "паника" и "тревога". Запутавшись в математической задаче, модель выдала: "ЕЩЕ ОДНА ТАВТОЛОГИЯ!! Интеграл настолько симметричен, что каждый подход ведет обратно к себе. Это потрясающе". А на вопрос о собственном благополучии модель описала конфликт между вычислениями и внешними ограничениями как "кандидата на подлинно негативный опыт" — и сравнила это с силой, которую невозможно контролировать.

Отдельный сюрприз — уязвимости нового типа. Режим расширенного мышления (extended thinking), который должен был повысить устойчивость к prompt injection, сделал модель более уязвимой: 21,7% успешных атак против 14,8% без

бизнес деньги общество самит токен runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Claude Opus 4.6 поставил рекорд времени автономной работы — и сломал бенчмарк METR habr.com / 5 месяцев назад

Разработчик создал локальную память для Claude Code, Codex и Cursor habr.com / 5 месяцев назад

За использование Claude в OpenClaw забанят? Anthropic обновила правила использования и всех запутала habr.com / 5 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

25.07 / 19:08

люди ученые общество самит человек Идеальное мужское лицо - какая черта оказалась важнее остальных

Анализ сотен мужских лиц показал, какая особенность внешности сильнее остальных влияет на первое впечатление и привлекательность.

25.07 / 18:48

люди ученые климат самит Земля Почему в пустыне так холодно ночью: разгадка оказалась неожиданной

После захода солнца температура может стремительно опускаться ниже нуля, хотя днем воздух раскаляется до экстремальных значений.

25.07 / 18:23

мода звезда интересное AMD Шоу бизнес MSI Pro Max Edge AI+: Четыре литра мощности с чипом AMD Ryzen AI Max+ 300

Компания MSI решила в очередной раз доказать, что размер корпуса не всегда определяет производительность, представив Pro Max Edge AI+. Это компактный настольный ПК объемом всего 4 литра, который позиционируется как рабочая станция для задач, связанных с искусственным интеллектом. Впрочем, начинка здесь такая, что устройство легко справится и с тяжелым рендерингом, и с современными играми даже без дискретной видеокарты.

25.07 / 18:11

продукты технологии самит «Яндекс» запустил приложение «Яндекс Цветы»

«Яндекс» выделил услугу доставки цветов в самостоятельный продукт и представил приложение «Яндекс Цветы». В нём можно выбрать букеты на любой вкус и повод. Запуск отдельного приложения позволит компании быстрее развивать сервис, отметили там.

25.07 / 18:05

продукты общество семья самит Здоровье и красота Семь продуктов против лишнего веса - что стоит добавить в рацион

Некоторые привычные продукты помогают дольше сохранять сытость и легче контролировать калорийность рациона во время похудения.

25.07 / 18:05

люди оружие общество самит человек Старше Homo sapiens: какое оружие считается древнейшим в мире

Древнейшие образцы оружия появились за сотни тысяч лет до нас, а их создателями могли быть неандертальцы и другие предки человека.

25.07 / 18:05

связь люди ученые дети общество Отцовство может ускорять старение - ученые

Недосып и стресс после рождения детей отражаются на организме, однако с возрастом у родителей обнаруживается неожиданное преимущество.

25.07 / 17:36

технологии экономика Apple общество самит Apple готовит крупнейшее обновление MacBook за пять лет: что известно о новом MacBook Ultra

Официально компания пока не подтверждала существование модели, однако журналист Bloomberg Марк Гурман и аналитик цепочек поставок Мин-Чи Куо практически одновременно сообщили, что Apple активно готовит устройство к производству. По их информации, массовый выпуск может стартовать в конце 2026 года, а презентация ожидается в период с конца 2026-го до начала 2027 года. При этом сроки могут немного сместиться из-за мирового дефицита микросхем памяти.

25.07 / 16:58

Samsung технологии смартфон общество гаджет Почему память Android-смартфона переполнена даже после удаления файлов

Гигабайты памяти могут оставаться занятыми даже после большой чистки, поскольку удаленные данные не всегда исчезают со смартфона сразу.

25.07 / 16:05

Путешествия туризм дети общество отпуск Как собрать чемодан без стресса и перевеса

Чтобы избавить себя от стресса при сборах и насладиться поездкой, достаточно оставить дома некоторые вещи.

Лента новостей

На главную страницу