Вышел Claude Sonnet 5 — почти как Opus 4.8, но дешевле
Anthropic выпустила Claude Sonnet 5 — модель среднего тира, которая, по замерам самой компании, вплотную подошла к ее флагману Opus 4.8, но стоит заметно дешевле. Sonnet 5 доступна с сегодняшнего дня везде: это модель по умолчанию на бесплатном и Pro-тарифах, она работает в Claude Code и через API (строка claude-sonnet-5). До 31 августа действует промо-цена — 2 доллара за миллион входных токенов и 10 за миллион выходных; затем она вырастет до 3 и 15 долларов. Для сравнения, Opus 4.8 стоит 5 и 25 долларов.
На бенчмарках разрыв с флагманом действительно небольшой. На Terminal-Bench 2.1 (агентная работа в терминале) Sonnet 5 набирает 80.4% против 82.7% у Opus 4.8, на тесте использования компьютера OSWorld-Verified — 81.2% против 83.4%. Заметнее отставание там, где нужны рассуждения: на SWE-bench Pro (реальные задачи по программированию) — 63.2% против 69.2%, на экзамене Humanity's Last Exam без инструментов — 43.2% против 49.8%. Но есть и парадокс: на тесте профессиональной работы GDPval-AA v2 Sonnet 5 даже немного обходит флагман — 1618 баллов против 1615.
У моделей есть уровни усилий (effort) от low до max: на низком Sonnet 5 отвечает дешево и быстро, на максимальном — тратит больше вычислений на рассуждения и подбирается к точности Opus. Anthropic называет Sonnet 5 самой агентной моделью линейки Sonnet: по словам компании и тестировавших ее партнеров, модель доводит до конца многошаговые задачи, на которых прежние Sonnet останавливались, и сама проверяет свой результат, даже когда ее об этом не просили, — например, пишет воспроизводящий баг тест перед тем, как чинить код.
При этом скидка вдвое — наполовину бухгалтерская. Sonnet 5 перешла на новый токенизатор, и тот же текст теперь разбивается примерно на 1.0–1.35 раза
Читать на habr.com