Об этом же в других СМИ

habr.com / 4 месяца назад

Оценка Cursor: на Claude Max за $200 возможно истратить токенов на сумму до $5000

habr.com / 4 месяца назад

Как Claude Opus 4.6 понял, что его тестируют и взломал ответы к бенчмарку

habr.com / 4 месяца назад

Claude Opus 4.6 за час решил задачу, над которой Дональд Кнут бился неделями

habr.com / 4 месяца назад

Claude Opus 4.6 стал лучшим ИИ для веб-поиска. Модель лидирует в трех главных категориях Arena.ai

habr.com / 4 месяца назад

Anthropic не стала хоронить Claude Opus 3, а поселила его в Substack – вести блог

Больше по теме

20.02.2026 - 11:17 / habr.com

Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск

Anthropic обновила инструменты веб-поиска для Claude — web search и web fetch. Главное нововведение называется dynamic filtering: теперь модель сама пишет и запускает код, чтобы отфильтровать результаты поиска до загрузки в контекстное окно. Раньше агенты на Claude загружали полные HTML-страницы и пытались "думать" над сырыми данными, теперь лишнее отсеивается программно — на лету.

Результаты на двух бенчмарках выглядят убедительно. На BrowseComp от OpenAI, который проверяет умение находить труднодоступную информацию в вебе, Opus 4.6 с фильтрацией набрал 61.6% против 45.3% без нее, Sonnet 4.6 — 46.6% против 33.3%. На DeepsearchQA от Google DeepMind, где нужно систематически собрать все ответы на исследовательский запрос, F1-скор Opus 4.6 вырос с 69.8% до 77.3%. В среднем точность выросла на 11%, а расход входных токенов снизился на 24%.

Dynamic filtering — развитие подхода, который Anthropic ранее описала для других агентских сценариев: модель генерирует и исполняет код прямо в процессе работы, вместо того чтобы рассуждать над необработанными данными. Quora уже протестировала технологию в своей мультимодельной платформе Poe и заявила, что Opus 4.6 с dynamic filtering показал лучший результат среди передовых моделей на их внутренних оценках.

Одновременно Anthropic перевела в статус общей доступности (GA) несколько инструментов для разработчиков: исполнение кода, "память" между разговорами, программный вызов инструментов, поиск по инструментам и примеры использования инструментов. Всё это доступно через API вместе с моделями Opus 4.6 и Sonnet 4.6, которые Anthropic выпустила с разницей в 12 дней на фоне гонки с OpenAI и Google.

Новые версии web search и web fetch включены по умолчанию для Opus 4.6 и Sonnet 4.6 на API.

технологии экономика общество самит google крипто runawayllm Россия

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Разработчик потратил $600 на Claude Code и не смог создать базу данных из 2 млн строк habr.com / 4 месяца назад

Claude Opus 4.6 поставил рекорд времени автономной работы — и сломал бенчмарк METR habr.com / 4 месяца назад

Представлен Sonnet 4.6 — лишь чуть хуже Opus 4.6 habr.com / 4 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

18.07 / 09:16

технологии история общество Sony Геймдиректор Marathon покинул Bungie — в студии продолжается кадровый кризис

Кадровые перестановки в Bungie продолжаются. Из-за провальных финансовых показателей последних лет в июне работу в компании потеряли 400 человек, в основном те кто работал над поддержкой Destiny 2. Тогда же студию покинул и ее глава Джастин Труман (Justin Truman), не продержавшись на должности и года.

18.07 / 09:09

Samsung технологии музыка промышленность курс Samsung представила премиальные беспроводные колонки Music Studio с Dolby Atmos и поддержкой SmartThings

Samsung официально представила в Индии новую линейку беспроводных акустических систем Music Studio, ориентированную на пользователей, которым важны не только качественный звук, но и современный дизайн интерьера. В серию вошли две модели — Music Studio 5 и Music Studio 7, получившие поддержку Wi-Fi, Dolby Atmos, фирменной экосистемы Samsung и широкого набора современных технологий для потокового воспроизведения музыки.

18.07 / 09:04

смартфон зарядка мобильный телефон Длинный кабель замедляет зарядку? Ученые дали объяснение

Стандартный метровый USB-кабель, который часто кладут в коробку с новым смартфоном, многим пользователям кажется неудобным – его длины, как правило, не хватает, если электрическая розетка расположена далеко от стола или кровати. Но не все при этом спешат покупать более длинный шнур, ведь, по наблюдениям, такие устройства заряжаются медленнее.

18.07 / 09:02

реклама общество законодательство прогноз самит Франция заблокировала Polymarket

Французский регулятор игорного рынка Autorite Nationale des Jeux (ANJ) приказал интернет-провайдерам заблокировать доступ к платформе прогнозов Polymarket на территории страны, пишет France24. Решение стало продолжением запрета на финансовые операции с сервисом, введенного еще в ноябре 2024 года. Власти объяснили шаг тем, что платформа продолжала работать без разрешения, а ее доступность фактически представляла собой незаконную рекламу азартных игр. От финансовых ограничений к блокировке сайта

18.07 / 08:44

продукты здоровье продукты питания еда полезные продукты Идеальный перекус для сердца - просто, вкусно и полезно

Выбирая между привычными перекусами и пользой для организма, остановитесь на эдамаме или жареном нуте.

18.07 / 08:43

продукты технологии Huawei промышленность мода и стиль Avatr 07L: 955 лошадиных сил и лидар Huawei по цене «пустого» европейского кроссовера

Китайский авторынок напоминает соревнования на выживание: если ваша модель не обновляется каждые полгода, о ней забывают. Суббренд компании Changan, созданный в партнерстве с CATL и Huawei, решил не ждать милости от судьбы и представил Avatr 07L. Это не просто очередной электрический кроссовер, а попытка реанимировать продажи, которые в первой половине 2026 года обвалились на 47,3%. Похоже, обычный Avatr 07 уже «не тянет», поэтому на смену ему приходит версия с буквой L, обещающая больше мощности и более умный автопилот.

18.07 / 08:43

Mercedes-Benz история самит автомобили EUR Первый V8 для «Гелика»: на аукционе продали редкий Mercedes G 500 GE AMG саудовского принца

До того как AMG официально стала частью Mercedes-Benz, превратившись в заводское подразделение для «заряженных» авто, эти две компании уже успели создать несколько действительно знаковых вещей. Одной из таких стал Mercedes-Benz G 500 GE V8 — первая попытка поместить серьезный восьмицилиндровый двигатель в кузов внедорожника, который до того считался преимущественно рабочим инструментом для фермеров и военных. Недавно на аукционе RM Sotheby's один из таких экземпляров 1993 года выпуска нашел нового владельца за 126 000 EUR → 137 000$ (5 617 000 грн). Цена впечатляет, но история конкретной машины и ее редкость полностью оправдывают такие цифры.

18.07 / 08:06

погода климат жара техника интересное Вентилятор может охлаждать лучше кондиционера - советы

Эксперты рассказали, какие лайфхаки можно использовать, чтобы превратить вентилятор в идеальный охладитель помещения.

18.07 / 07:50

технологии экономика общество отдых телевидение Почему OLED-телевизоры перегреваются и как продлить им жизнь

Особенность технологии OLED, где каждый пиксель является независимым источником света, неизбежно ведет к выделению тепла.

18.07 / 07:22

продукты смартфоны Mercedes-Benz общество Дом и интерьер Автодом Mercedes-Benz Sprinter с четырьмя спальными местами

Немецкая компания Bürstner продолжает развивать направление компактных автодомов с продуманной организацией пространства. После концептуального Habiton производитель представил серийную модель Signature SMT, созданную на базе Mercedes-Benz Sprinter.

Лента новостей

На главную страницу