Об этом же в других СМИ

habr.com / 6 месяцев назад

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

habr.com / 7 месяцев назад

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

habr.com / 7 месяцев назад

send(), receive(), done() — и никаких сложностей. Claude переосмысливает API и добавляет 1M контекста

habr.com / 7 месяцев назад

Mistral выпустила две модели для кодинга: одна соперничает с Claude Sonnet, вторая работает на домашнем GPU

habr.com / 7 месяцев назад

Claude Code появится в Slack

Больше по теме

27.11.2025 - 13:34 / habr.com

Вышла Claude Opus 4.5

24 ноября стала доступна модель Claude Opus 4.5. Anthropic позиционирует её как свою самую сильную модель для программирования, агентных сценариев и управления компьютером, а также заметно подтянула качество в повседневных задачах — от поиска и анализа информации до работы с презентациями и таблицами.

Claude Opus 4.5 показывает лучшие результаты на бенчмарках, приближенных к реальной разработке (включая SWE-bench Verified).

Модель уже доступна в приложениях Anthropic, через Claude API и на трёх крупных облачных платформах; использовать её можно под именем claude-opus-4-5-20251101. Тариф — 5/25 долларов за миллион токенов (ввод/вывод).

Параллельно обновлены Claude Developer Platform, Claude Code и пользовательские приложения: добавили инструменты для долгоживущих агентов, интеграции с Excel и Chrome, десктопный сценарий использования. В приложениях Claude длинные диалоги теперь продолжаются за счёт автоматического сворачивания раннего контекста.

При внутреннем тестировании в Anthropic разработчики получили очень схожую обратную связь: Claude Opus 4.5 лучше справляется с неоднозначными задачами, умеет взвешивать компромиссы без подробных подсказок и самостоятельно разруливать сложные баги, затрагивающие несколько систем. Задачи, которые недавно были «на грани возможного» для Sonnet 4.5, Opus 4.5 уже закрывает уверенно — тестировщики описывают модель как ту, которая «просто понимает, что происходит».

Для кандидатов на позиции performance-инженеров в Anthropic есть сложный домашний экзамен; его же используют как внутренний бенчмарк для моделей. В отведённые 2 часа Claude Opus 4.5 показала результат выше, чем любой человек, когда-либо проходивший этот тест.

Экзамен оценивает только «жёсткие» навыки — технику и качество решений под

связь экономика общество самит доллар крипто

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

DeepSeek для ролевых игр, Claude Sonnet для программирования: неожиданное исследование OpenRouter habr.com / 7 месяцев назад

Вышла Unity 6.3 LTS habr.com / 7 месяцев назад

Вышла новая версия ESM-платформы SimpleOne с поддержкой мультиязычных объявлений habr.com / 7 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 07:26

налоги Samsung технологии СМИ самит Samsung может отказаться от популярного бонуса при предзаказе Galaxy Z Fold8 и Z Flip8

Если сведения подтвердятся, изменения затронут все три ожидаемые новинки: Galaxy Z Flip8, Galaxy Z Fold8 и Galaxy Z Fold8 Ultra. При этом речь пока идет о слухе, основанном на публикации южнокорейского издания Chosun Biz. Официально Samsung эту информацию пока не подтверждала.

16.07 / 07:25

ТВ смартфоны бытовая техника Транспорт Компактный проектор Pixorien Z01 со встроенной подставкой

Pixorien представила необычный портативный проектор Z01, который решает одну из самых распространенных проблем — поиск подходящего места для установки.

16.07 / 07:22

промышленность предприятия 1С в промышленности: что обсуждали на ИННОПРОМ-2026

С 6 по 9 июля в Екатеринбурге прошла международная промышленная выставка ИННОПРОМ-2026. Инфостарт участвовал в выставке со стендом и обсуждал с представителями промышленных предприятий развитие ИТ-систем на базе 1С.

16.07 / 07:22

происшествия самит изоляция AI-агенты для аудита кода научились запускать вредоносное ПО вместо его поиска

Исследователи из AI Now Institute описали новую атаку Friendly Fire, которая позволяет превратить AI-агентов для анализа безопасности в — напротив — инструмент компрометации системы. Под удар попали автономные режимы Claude Code и OpenAI Codex, когда они используются для проверки стороннего кода без подтверждения каждого действия со стороны пользователя.

16.07 / 07:19

люди экономика общество инвестор google «Люди стали дешевле, чем программное обеспечение»: венчурные инвесторы пересматривают роль ИИ

Венчурная компания Andreessen Horowitz (a16z) опубликовала аналитический материал с тезисами CEO Hebbia Джорджа Сивулки о том, что искусственный интеллект не заменяет людей, а меняет подходы к управлению трудом. В своем материале a16z приводит главный вывод Джорджа Сивулки: Проблема больше не в моделях, а в управлении ими По мнению Сивулки, современные компании фактически получили «бесконечный штат» ИИ-агентов, но большинство еще не научилось эффективно ими управлять. Он п

16.07 / 07:18

продукты продукты питания Здоровье и красота полезные продукты кулинария Почему стоит добавить авокадо в свой ежедневный рацион

Регулярное употребление авокадо помогает организму получать полезные мононенасыщенные жиры и клетчатку.

16.07 / 07:18

связь экономика здоровье продукты питания еда Почему овсянка, приготовленная с вечера, полезнее – мнение ученых

Ученые выяснили, что "ночная" овсянка поддерживает связь между здоровьем кишечника и работой мозга.

16.07 / 07:04

Amazon общество visa mastercard google Linux Foundation запустила организацию x402 для развития стандарта интернет-платежей между ИИ-агентами

Некоммерческая организация Linux Foundation объявила о начале работы x402 Foundation. Это новый орган открытого управления, созданный для руководства протоколом x402. Одновременно криптобиржа Coinbase завершила передачу протокола новому фонду. В пресс-релизе отмечается, что x402 интегрирует платежные функции непосредственно во взаимодействие HTTP, позволяя искусственному интеллекту, API и приложениям автоматически осуществлять и получать платежи так же просто, как они обмениваются данными. Как новый протокол для интернет-платежей x402 может изменить Web3-экономику? 27.10.2025 Читать Протокол поддерживает карты и стейблкоины В Linux Foundation заявили, что x402 должен стать открытым стандартом для интернет-платежей без привязки

16.07 / 07:04

экономика общество самит финансирование капитал DeepSeek превратил основателя в самого богатого создателя ИИ в мире

Основатель китайского ИИ-стартапа DeepSeek Лян Вэньфэн стал самым богатым в мире предпринимателем среди создателей моделей искусственного интеллекта после завершения раунда финансирования на $7,4 млрд в июне 2026 года. По оценке Bloomberg Billionaires Index, его состояние выросло до $36 млрд, что позволило обогнать сооснователя OpenAI Грега Брокмана и сооснователя Anthropic Дарио Амодеи. DeepSeek увеличил оценку в пять раз По данным Bloomberg, оценка DeepSeek после июньского инвести

16.07 / 07:04

президент общество законопроект каникулы сенат Трамп встретится с сенаторами по поводу положений об этике в CLARITY Act

Президент США Дональд Трамп проведет встречу с группой сенаторов касательно положений об этике в законопроекте о структуре крипторынка (CLARITY). Об этом заявил республиканец Берни Морено в интервью Politico. Отметим, в числе первых о встрече сообщило издание CoinDesk. Это также подтвердила президентка организации Solana Policy Institute Кристин Смит в комментарии для The Block. По ее словам, цель собрания заключается в том, чтобы предложить Трампу несколько вариантов компромисса по этим положениям и получить его одобрение. Смит считает,

Лента новостей

На главную страницу