Об этом же в других СМИ

habr.com / 3 часа назад

Claude Fable 5 доказал 12-летнюю гипотезу квантовой оптимизации — но триумф подпортил человек с тем же решением

habr.com / 1 день назад

Услужливость как уязвимость: Claude Code обманули без единой строчки вредоносного кода

habr.com / 1 день назад

Тревожный сигнал в отчете OpenAI про GPT-5.6, который почти никто не заметил

habr.com / 1 день назад

Глава Claude Code описал 5 ролей IT-команды будущего

habr.com / 2 дня назад

PET-скан показал рак. Claude сказал: 90%, что это ложная тревога — и оказался прав

Больше по теме

03.07.2026 - 07:54 / habr.com

Вышел Claude Sonnet 5 — почти как Opus 4.8, но дешевле

Anthropic выпустила Claude Sonnet 5 — модель среднего тира, которая, по замерам самой компании, вплотную подошла к ее флагману Opus 4.8, но стоит заметно дешевле. Sonnet 5 доступна с сегодняшнего дня везде: это модель по умолчанию на бесплатном и Pro-тарифах, она работает в Claude Code и через API (строка claude-sonnet-5). До 31 августа действует промо-цена — 2 доллара за миллион входных токенов и 10 за миллион выходных; затем она вырастет до 3 и 15 долларов. Для сравнения, Opus 4.8 стоит 5 и 25 долларов.

На бенчмарках разрыв с флагманом действительно небольшой. На Terminal-Bench 2.1 (агентная работа в терминале) Sonnet 5 набирает 80.4% против 82.7% у Opus 4.8, на тесте использования компьютера OSWorld-Verified — 81.2% против 83.4%. Заметнее отставание там, где нужны рассуждения: на SWE-bench Pro (реальные задачи по программированию) — 63.2% против 69.2%, на экзамене Humanity's Last Exam без инструментов — 43.2% против 49.8%. Но есть и парадокс: на тесте профессиональной работы GDPval-AA v2 Sonnet 5 даже немного обходит флагман — 1618 баллов против 1615.

У моделей есть уровни усилий (effort) от low до max: на низком Sonnet 5 отвечает дешево и быстро, на максимальном — тратит больше вычислений на рассуждения и подбирается к точности Opus. Anthropic называет Sonnet 5 самой агентной моделью линейки Sonnet: по словам компании и тестировавших ее партнеров, модель доводит до конца многошаговые задачи, на которых прежние Sonnet останавливались, и сама проверяет свой результат, даже когда ее об этом не просили, — например, пишет воспроизводящий баг тест перед тем, как чинить код.

При этом скидка вдвое — наполовину бухгалтерская. Sonnet 5 перешла на новый токенизатор, и тот же текст теперь разбивается примерно на 1.0–1.35 раза

экономика самит доллар крипто токен Lowe's runawayllm

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Grok 4.5 обучили на данных Cursor — Маск пообещал, что «будет не хуже Opus» habr.com / 2 дня назад

Claude Fable 5 могут вернуть уже на следующей неделе — Axios habr.com / 2 дня назад

Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы habr.com / 2 дня назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

03.07 / 09:05

смартфон аномальная жара мобильный телефон лайфхак лето Что делать, если смартфон перегревается в жару: эти простые советы спасут гаджет

Когда на улице сильная жара, перегреться могут не только люди, но и техника. Если из-за высокой температуры ваш смартфон выключился, попробуйте сначала охладить его, однако следует избегать слишком резкого перепада температур.

03.07 / 08:41

Volkswagen экономика Путешествия самит Дом и интерьер Carado CV595 X-Edition: прагматичный внедорожник для тех, кто не любит гламур

Carado CV595 X-Edition — это не очередная попытка продать «внедорожный» вид с помощью двух наклеек и пластикового обвеса. Это вполне прагматичный взгляд на то, каким должен быть дом на колесах, если вы планируете съезжать с идеального асфальта на что-то более похожее на лесные тропы. Вместо того чтобы играть в «дизайнерские» прихоти, разработчики сосредоточились на технической базе и реальном удобстве, выбрав в качестве фундамента проверенный временем Volkswagen Crafter.

03.07 / 08:33

продукты экономика самит инвестор SEC В SEC признали ошибки с криптовалютными ETF и анонсировали нейтральный подход к новым продуктам

Директор подразделения SEC по управлению инвестициями Брайан Дейли дал интервью, в котором рассказал о подходе регулятора к новым и сложным ETF-продуктам — ETF на прогнозные рынки, криптовалютные ETF, ETF с частными активами и другие. SEC признала ошибки с криптовалютными ETF Дейли заявил, что SEC «плохо справилась» с криптовалютными ETF: регулятор плохо проработал тему, был втянут в судебные процессы, утратил доверие индустрии и сейчас пытается его восстановить. По его словам, нынешняя Комиссия хочет работать более предсказуемо и открыто — вместо оборонительной позиции SEC пытается показать рынку, что готова к нейтральному и прозрачному рассмотрению новых продуктов. В то же время Дейли подчерк

03.07 / 08:21

технологии экономика дети общество Будущая армия инженеров: Китай внедряет ИИ-грамотность в школьные программы как базовый навык

Пекин решил, что простого умения читать и писать для современного китайского школьника уже недостаточно — теперь нужно еще и уметь «промптить». Власти КНР официально объявили о начале масштабной интеграции искусственного интеллекта во все уровни национальной системы образования. Соответствующий пятилетний план, который был опубликован Государственным советом КНР, предусматривает превращение компетенций в области ИИ в один из базовых навыков для каждого ученика.

03.07 / 08:02

технологии происшествия закон расследование google Проект Hinkal Protocol был взломан на более чем $800 000

Hinkal Protocol, проект, ориентированный на обеспечение конфиденциальности в сфере DeFi, был взломан и потерял 822 000 USDC. Команда подтвердила факт подозрительной активности и заявила, что начала расследование инцидента. Отметим, первым о взломе сообщил аналитик под псевдонимом Specter. По его словам, взломщик уже конвертировал часть украденного в Ethereum, после чего направил активы в миксер Tornado Cash. По данным экспертов PeckShield, он отмыл около $700 000. Еще часть украден

03.07 / 07:54

история общество самит лечение Баг прятался 18 лет: OpenAI нашла его в окне шириной в одну инструкцию

OpenAI рассказала, как нашла гонку потоков (race condition), которая 18 лет незаметно жила в GNU libunwind — одной из самых распространенных библиотек для раскрутки стека. Самое абсурдное в этом баге — ширина окна, в котором он срабатывает: буквально одна процессорная инструкция, порядка 100 пикосекунд. На таком масштабе казалось, что он слишком редкий, чтобы вообще проявляться. Но на нагрузке OpenAI это выливалось в больше десятка падений в день.

03.07 / 07:54

экономика самит доллар крипто токен Вышел Claude Sonnet 5 — почти как Opus 4.8, но дешевле

03.07 / 07:48

google крипто токен Сооснователь NEAR анонсировал план фиксированного предложения токенов

Пользователь X под псевдонимом KYSЬ предложил два способа усилить токеномику NEAR Protocol: сжечь часть токенов, принадлежащих NEAR Foundation, а также модернизировать текущую программу обратного выкупа. Вместо того чтобы удерживать NEAR, выкупленный за счет комиссий от протокола NEAR Intents, автор предлагает отправлять эти токены непосредственно на адрес сжигания — навсегда изымая их из обращения и постепенно уменьшая предложение со временем. Что происходит с NEAR: Intents, ИИ и текущий вектор развития проекта 27.03.2026 Читать 5 бычьих тезисов по NEAR: сможет ли «звезда» прошлого цикла снова ворваться на рынок? 12.06.2026 Читать Полосухин против

03.07 / 07:32

продукты связь люди самит Здоровье и красота Связь между красным мясом и диабетом – что нужно знать о рационе

Регулярное употребление красного мяса способствует развитию инсулинорезистентности и повышению риска диабета 2 типа.

03.07 / 07:32

медицина общество вирус мозг инфекция Головная боль, способная убить за несколько часов — симптомы

Смертельно опасная инфекция маскируется под обычную простуду, стремительно развиваясь в организме и требуя экстренной госпитализации.

Лента новостей

На главную страницу