Вышла Claude Opus 4.5
24 ноября стала доступна модель Claude Opus 4.5. Anthropic позиционирует её как свою самую сильную модель для программирования, агентных сценариев и управления компьютером, а также заметно подтянула качество в повседневных задачах — от поиска и анализа информации до работы с презентациями и таблицами.
Claude Opus 4.5 показывает лучшие результаты на бенчмарках, приближенных к реальной разработке (включая SWE-bench Verified).
Модель уже доступна в приложениях Anthropic, через Claude API и на трёх крупных облачных платформах; использовать её можно под именем claude-opus-4-5-20251101. Тариф — 5/25 долларов за миллион токенов (ввод/вывод).
Параллельно обновлены Claude Developer Platform, Claude Code и пользовательские приложения: добавили инструменты для долгоживущих агентов, интеграции с Excel и Chrome, десктопный сценарий использования. В приложениях Claude длинные диалоги теперь продолжаются за счёт автоматического сворачивания раннего контекста.
При внутреннем тестировании в Anthropic разработчики получили очень схожую обратную связь: Claude Opus 4.5 лучше справляется с неоднозначными задачами, умеет взвешивать компромиссы без подробных подсказок и самостоятельно разруливать сложные баги, затрагивающие несколько систем. Задачи, которые недавно были «на грани возможного» для Sonnet 4.5, Opus 4.5 уже закрывает уверенно — тестировщики описывают модель как ту, которая «просто понимает, что происходит».
Для кандидатов на позиции performance-инженеров в Anthropic есть сложный домашний экзамен; его же используют как внутренний бенчмарк для моделей. В отведённые 2 часа Claude Opus 4.5 показала результат выше, чем любой человек, когда-либо проходивший этот тест.
Экзамен оценивает только «жёсткие» навыки — технику и качество решений под
Читать на habr.com