Об этом же в других СМИ

habr.com / 3 недели назад

Власти США испугались кражи Claude Mythos Китаем — и заблокировали передовые модели Anthropic

incrypted.com / 4 недели назад

Anthropic переписала политику конфиденциальности на фоне блокировки Fable 5 и Mythos 5

habr.com / 4 недели назад

Anthropic открыла доступ к Claude Fable 5 — модель уже в BotHub

habr.com / 1 месяц назад

Anthropic выпустила Claude Fable 5 и закрытую Mythos 5

incrypted.com / 1 месяц назад

Weekly: историческое IPO SpaceX, релиз и блокировка Claude Fable 5 и Incrypted Conference 2026

Больше по теме

29.05.2026 - 08:18 / incrypted.com

Честнее и дешевле: Anthropic представила Claude Opus 4.8

Anthropic выпустила Claude Opus 4.8, «скромное» улучшение предыдущей версии.
Модель демонстрирует лучшие результаты в основных бенчмарках.
Также она якобы честнее в отношении собственных ошибок и неподтвержденных утверждений.
В ближайшие недели Anthropic планирует выпустить в публичный релиз семейство Mythos.

Anthropic представила Claude Opus 4.8, новую версию самой мощной модели компании. По словам разработчика, она выделяется более высокой честностью относительно своих ошибок при написании кода и большей производительностью.

Ключевые изменения

Напомним, Claude Opus 4.7 вышла в апреле 2026 года. Новая модель работает быстрее и эффективнее в сравнительных тестах, а также включает в себя набор новых функций. При этом Claude Opus 4.8 доступна по старой цене — $5 за 1 млн входящих токенов и $25 за 1 млн исходящих.

Сравнивая новую модель с предыдущей, а также основными конкурентами, компания заявила о значительном росте показателей. В бенчмарке SWE-Bench Pro, который оценивает способность исправлять реальные ошибки в коде, Claude Opus 4.8 набрала 69,2% против 64,3% у версии 4.7. У OpenAI GPT-5.5 — 58,6%.

В тесте OSWorld, который анализирует способность выполнять реальные задачи в рамках ОС, модель получила 83,4%. А в бенчмарке GDPval-AA, оценивающем сложные интеллектуальные задачи, результат составил 1890 баллов против 1753 у Claude Opus 4.7.

Вместе с тем модель по-прежнему уступает в GPT-5.5 в тесте Terminal-Bench 2.1. Он оценивает работу ИИ-агентов в реальных терминальных средах.

В бенчмарке Humanity’s Last Exam, который представляет собой набор из 2500 вопросов по различным наукам, модель получила отметку 49,8% без использования инструментов и 57,9% с ними, опередив всех трех конкурентов.

Среди отзывов на

самит IPO крипто Lowe's Enterprise Sergey Khukharkin

Читать на incrypted.com

Все новости от incrypted.com

Об этом же в других СМИ

WSJ: проверка Amazon привела к блокировке последних моделей Claude от Anthropic incrypted.com / 1 месяц назад

Власти США ограничили доступ к Claude Fable 5 и Mythos 5 от Anthropic incrypted.com / 1 месяц назад

CEO Anthropic призвал к более жесткому надзору за ИИ-сферой incrypted.com / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 02:27

продукты здоровье Здоровье и красота питание кулинария Ужин, который остановит старение, назвали эксперты

Полезный ужин может быть еще и очень вкусным, говорят специалисты и рассказывают, что нужно есть для молодости и хорошего самочувствия.

15.07 / 01:22

люди ученые наука история общество Археологи обнаружили пещеру с доисторическими рисунками (ФОТО)

Международная группа исследователей совершила крупное открытие на востоке страны. На стенах скрытого грота ученые нашли около сотни древних фигур.

15.07 / 00:31

медицина люди общество лечение медики Война с прыщами: 5 ошибок, которые навсегда испортят вашу кожу

Специалист объяснила, почему попытки пересушить кожу агрессивными средствами приводят к обратному эффекту и вызывают тяжелые воспаления.

14.07 / 23:23

общество семья отдых человек врачи Привычки, которые незаметно разрушают сердце, назвали врачи

Обычные действия, которые многие считают безобидными, способны со временем серьезно навредить сердцу.

14.07 / 23:23

животные общество природа самит биологи Кашалоты общаются с помощью двух разных диалектов

Крупные морские биологи опубликовали отчет об акустических исследованиях в Европе. Ученые выявили четкие различия в сигналах млекопитающих.

14.07 / 22:14

технологии Apple прогноз журналист предприятия Поставщики Apple завершили подготовку к производству iPhone 20

В новой публикации инсайдер сообщил, что для юбилейной модели Apple выбрала концепцию «возвращения к стеклу». По его словам, качество изготовления устройства должно соответствовать уровню первого поколения iPhone Air.

14.07 / 22:06

продукты медицина люди здоровье общество Почему эксперты просят избегать солнцезащитных спреев

Эксперты выяснили, что популярные аэрозоли могут вредить здоровью. Узнайте, какие три опасных компонента не должны быть указаны на упаковке вашей косметики.

14.07 / 21:13

происшествия люди общество самит животный мир Живут в каждом доме: действительно ли пауки-сенокосцы смертельно ядовиты

Пауки-сенокосцы встречаются по всему миру, населяя разнообразные среды и в частности жилища людей. Они имеют длинные, тонкие лапки, благодаря которым они кажутся намного больше, чем есть на самом деле. Однако с их ядом не все так просто.

14.07 / 19:45

люди ученые общество самит психология Почему прошлое кажется лучше настоящего - ответ ученых

Особенности человеческой памяти заставляют многих воспринимать прошлое более счастливым, чем оно было на самом деле.

14.07 / 19:45

здоровье продукты питания общество семья Здоровье и красота Дешевле и полезнее лосося – ученые назвали неожиданный суперфуд

Врачи рекомендуют сочетать разные источники ценных жиров. Ореховая добавка не должна полностью вытеснять рыбу из меню.

Лента новостей

На главную страницу