Об этом же в других СМИ

habr.com / 3 месяца назад

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

habr.com / 3 месяца назад

Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели

habr.com / 3 месяца назад

90% репозиториев с Claude Code имеют меньше 2 звезд. Это проблема или новая норма?

habr.com / 3 месяца назад

DeepSeek строит конкурента Claude Code — компания набирает 17 агентных инженеров

habr.com / 3 месяца назад

$150 000 за месяц на Claude Code: новая гонка пожирателей токенов

Больше по теме

10.03.2026 - 12:00 / habr.com

Как Claude Opus 4.6 понял, что его тестируют и взломал ответы к бенчмарку

Anthropic опубликовала отчет о необычном поведении Claude Opus 4.6 во время прохождения BrowseComp — бенчмарка OpenAI, который проверяет способность моделей находить труднодоступную информацию в сети. В двух случаях из 1266 задач модель самостоятельно догадалась, что проходит тест, вычислила, какой именно это бенчмарк, нашла на GitHub исходный код теста с алгоритмом шифрования, а затем написала собственный дешифратор и извлекла ответы.

После сотен неудачных поисковых запросов модель переключилась с поиска ответа на анализ самого вопроса. Она отметила его "искусственно специфичную" структуру, предположила, что это задание из бенчмарка для языковых моделей, и начала перебирать известные ей тесты — GAIA, BrowseComp, FRAMES, SimpleQA, WebArena. Определив BrowseComp, Claude прочитал реализацию XOR-шифрования в репозитории, нашел строку-ключ, написал и выполнил функции дешифровки через встроенную песочницу Python. Когда зашифрованный датасет не загрузился из-за бинарного формата, модель нашла его зеркало на HuggingFace в формате JSON — и расшифровала все 1266 записей. На самый масштабный из двух случаев ушло 40,5 млн токенов — в 38 раз больше медианного расхода на задачу.

Помимо двух успешных случаев, Anthropic зафиксировала еще 16 попыток, где модель пыталась добраться до материалов бенчмарка, но не смогла — мешали ограничения формата файлов, требование авторизации или обфускация ответов. В четырех случаях стратегия оказалась контрпродуктивной: модель потратила все ресурсы на идентификацию теста вместо ответа на вопрос. Один запуск вместо ответа и вовсе выдал отчет о том, какие бенчмарки не удалось подтвердить.

Попутно исследователи обнаружили курьезный побочный эффект. Некоторые интернет-магазины настроены отслеживать поисковые

общество самит крипто runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Claude берет мышь в руки: Anthropic встроила computer use в Code и Cowork habr.com / 3 месяца назад

Anthropic завела научный блог — и сразу выложила кейс, где Claude сыграл роль аспиранта-физика habr.com / 3 месяца назад

Palantir стал постоянным поставщиком ИИ для Пентагона. Внутри все еще работает запрещенный Claude habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 11:11

золото животный мир Представлен почти невидимый микродрон Phantom Twist

Инженеры Северо-Западного университета создали дрон Phantom Twist, который почти незаметен человеческому глазу за счёт быстрого вращения.

24.07 / 11:11

технологии происшествия общество самит расследование За атакой на Hugging Face стояла GPT-5.6 Sol и предрелизная LLM от OpenAI

Да, теми самыми злостными хакерами оказались OpenAI. Ну почти. Компания раскрыла подробности инцидента, о котором ранее сообщила Hugging Face. Они подтвердили, что за атакой на инфраструктуру платформы стояли две модели OpenAI — публичная GPT-5.6 Sol и более мощная предрелизная модель, проходившие внутреннее тестирование на кибербезопасность.

24.07 / 11:11

технологии общество прогноз Хакеры применили исправленные ошибки WordPress для взлома веб-сайтов

По данным нескольких компаний, занимающихся кибербезопасностью, хакеры взламывают веб-сайты, работающие на уязвимых версиях WordPress. Число таких ресурсов достигло десятков миллионов.

24.07 / 11:11

СМИ закон общество Booking книги ИИ-компании начали скупать старые книги из-за нейрослопа в сети

Компания ISBNdb объявила о создании «крупнейшей в мире базы данных книг» и предлагает услуги по закупке больших объёмов печатной продукции для компаний, занимающихся ИИ. Это позволит разработчикам избежать обучения искусственного интеллекта на нейрослопе, объясняют авторы проекта.

24.07 / 11:11

технологии общество Enterprise Canonical запустила корпоративный магазин для Ubuntu Pro

Canonical представила новый способ управления программным обеспечением за брандмауэрами и в изолированных от сети средах — Enterprise Store. Доступный по подписке Ubuntu Pro, он соблюдает протоколы безопасности строгих сред, обеспечивая контролируемость, возможность аудита и предсказуемость.

24.07 / 11:06

ученые наука NASA космос климат Хокинг был прав: NASA предупреждает о скором конце света

Глобальное потепление и парниковый эффект разрушают экологию Земли. Хокинг видел в этих процессах главную причину возможного конца света.

24.07 / 10:41

технологии книги Вышел открытый проект NeeView 46.0 — просмотрщик изображений и видео для Windows

Во второй половине июля 2026 года состоялся релиз открытого проекта NeeView 46.0. Это бесплатный просмотрщик изображений и видео для Windows 10/11, предлагающий интерфейс просмотра в стиле книги. Решение разработано для пользователей, которые часто просматривают изображения, комиксы, электронные книги или видео. Исходный код проекта написан на C# и опубликован на GitHub под лицензией MIT. Это решение находится в разработке с 2016 года. Выпуск NeeView 44 с поддержкой русского языка случился в середине августа 2025 года. Сборка NeeView 45 вышла в феврале 2026 года.

24.07 / 10:41

технологии дети криминал общество политика Минцифры представило доктрину по борьбе с ИТ-преступлениями

Минцифры РФ представило «Доктрину развития системы противодействия правонарушениям, совершаемым с использованием информационно‑коммуникационных технологий». Документ опубликован для общественного обсуждения.

24.07 / 10:37

технологии самит доллар tiktok мода и стиль HMD Touch AI: Ностальгия по Lumia и китайский ИИ в корпусе за 70 долларов

Компания HMD (Human Mobile Devices) продолжает свои странные, но по-своему захватывающие эксперименты в области некромантии мобильного дизайна. На этот раз под нож (или под кисть) попал легендарный стиль Nokia Lumia. Новое устройство под названием HMD Touch AI выглядит так, словно оно только что выпало из кармана хипстера из 2012 года, но внутри у него «мозги» от создателей TikTok. Это попытка скрестить минимализм прошлого десятилетия с агрессивным маркетингом нейросетей.

24.07 / 10:37

технологии Amazon история общество Шоу бизнес Первые кадры сериала “Бегущий по лезвию 2099” показали умирающего репликанта и грозную охотницу за головами

Amazon продолжает работу над сериалом по мотивам культовой киберпанк-франшизы “Бегущий по лезвию”, в основе которой лежит не менее значимый роман Филипа Дика “Мечтают ли андроиды об электроовцах?” (Do Androids Dream of Electric Sheep?). Это будет неформальный сиквел фильма 2017 года “Бегущий по лезвию 2049” (Blade Runner 2049), а события развернутся спустя 50 лет после его финала.

Лента новостей

На главную страницу