Об этом же в других СМИ

cursorinfo.co.il / 1 месяц назад

Когда лучше всего ужинать, чтобы сохранить фигуру и здоровье

cursorinfo.co.il / 2 месяца назад

Душ или ванна - что лучше всего смывает грязь с тела

habr.com / 2 месяца назад

DeepSeek V4 силен только в «своих» бенчмарках. На независимых — отстает на 8 месяцев

gagadget.com / 2 месяца назад

DeepSeek вспомнил всё: в популярном ИИ-сервисе появился поиск по истории чатов

habr.com / 2 месяца назад

Конец независимости DeepSeek: лаборатория Ляна Вэньфэна идет за деньгами

Больше по теме

28.04.2026 - 14:47 / habr.com

DeepSeek AI: “V4 отстаёт от лучших ИИ-моделей всего на 3–6 месяцев”

Компания DeepSeek AI считает, что её флагман V4-Pro-Max “демонстрирует превосходство над GPT-5.2 и Gemini-3.0-Pro в стандартных бенчмарках рассуждений”, но “незначительно уступает GPT-5.4 и Gemini-3.1-Pro, что указывает на траекторию развития, отстающую от передовых фронтирных моделей примерно на 3–6 месяцев”. Обычно лаборатории либо избегают прямых сравнений, либо подают всё как победу – здесь же мы получили редкий образец самодиагностики.

Три–шесть месяцев в сегодняшнем темпе релизов – это очень небольшая фора. Фактически DeepSeek утверждает, что работает на уровне моделей, считавшихся фронтирными в конце прошлого – начале этого года, и продолжает сокращать разрыв. Бенчмарки подтверждают эту картину.

В кодинге V4-Pro-Max обходит обоих фаворитов из США: рейтинг Codeforces 3206 против 3168 у GPT-5.4 и 3052 у Gemini-3.1-Pro, а на LiveCodeBench у неё 93,5 – выше всех конкурентов.

В математике ситуация похожая: IMOAnswerBench 89,8, HMMT 2026 95,2. Заметный проигрыш проявляется на HLE (37,7 против 44,4 у Gemini) и, что ещё важнее, в извлечении фактов – SimpleQA-Verified 57,9 против 75,6 у Gemini-3.1-Pro.

DeepSeek сама признаёт, что “уступает Gemini 3.1 Pro в богатстве знаний о мире”.

Для агентных задач, которые всё сильнее определяют практическую ценность ИИ, отставание сжимается почти до нуля.

SWE-Verified даёт V4-Pro-Max 80,6 – вплотную к Claude Opus 4.6 (80,8) и Gemini (80,6).

На Toolathlon китайская модель опережает обоих (51,8 против 47,2 и 48,8 соответственно), хотя GPT-5.4 здесь лидирует с 54,6.

Отдельный подарок разработчикам – V4-Flash-Max. В техотчёте DeepSeek отмечает, что эта более дешёвая и быстрая модель “достигает производительности, сопоставимой с GPT-5.2 и Gemini-3.0-Pro”. То есть бюджетный вариант сегодня повторяет

история самит google крипто ByteDance gemini dmitrifriend eps США

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

СМИ: DeepSeek приблизился к оценке в $45 млрд после интереса китайского «Большого фонда» incrypted.com / 2 месяца назад

Архив, на котором учились ChatGPT, Claude и DeepSeek, попал под атаку 20 крупных издателей habr.com / 2 месяца назад

DeepSeek учит модель «тыкать пальцем» в кадр по ходу рассуждения habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 16:40

недвижимость мода история общество дизайн Дизайнеры предлагают избавиться от шторки в ванной – какая замена

Для создания стильного ретро-дизайна не нужно покупать дорогой антиквариат. Подойдет отреставрированная старая вещь из гаража.

14.07 / 16:40

люди ученые общество самит человек У всех голубоглазых людей нашли одного общего предка

Генетики выяснили, когда возникли голубые глаза и почему эта особенность сохранилась до наших дней.

14.07 / 16:23

продукты технологии бюджет google OpenAI закрыли Atlas: весь функционал ИИ-браузера переезжает в ChatGPT Work

OpenAI анонсировала ChatGPT Work — новый режим работы, который превращает чат-бота в полноценного агента, способного самостоятельно выполнять цепочки задач с использованием внешних инструментов, локальных файлов и веб-ресурсов. Фактически это эволюция идей, которые ранее тестировались в проекте Atlas, — отдельном браузере с ИИ-управлением.

14.07 / 16:05

продукты люди ученые алкоголь общество Что будет, если пить пиво каждый день — исследование

Даже одна привычка в конце дня способна со временем отразиться на работе организма и общем самочувствии.

14.07 / 15:48

технологии мужчина женщина профессор Эксперт Почему вы просыпаетесь в 2 часа ночи – ответ профессора вас удивит

Хронический стресс и непрерывный поток информации из смартфонов заставляют наш мозг оставаться в режиме «бей или беги» даже ночью.

14.07 / 15:38

технологии происшествия смартфон самит гаджет Не быстрая зарядка - что на самом деле убивает аккумулятор смартфона

Главную угрозу для аккумулятора представляет не высокая мощность зарядки, а совсем другой фактор.

14.07 / 15:35

реклама продукты технологии Apple закон Apple выплатит компенсацию владельцам некоторых моделей iPhone за задержку Siri AI

В мае 2026 года компания Apple согласилась выплатить $250 млн для урегулирования коллективного иска в США, связанного с задержкой запуска Siri AI. Калифорнийский суд, рассматривающий это дело, провёл слушание по вопросу предварительного одобрения мирового соглашения, но решение ещё не вынесено. Скорее всего, пройдёт ещё как минимум несколько месяцев, прежде чем клиенты смогут начать подавать заявки на компенсацию. Пользователи iPhone смогут получить до $95. Выплаты начнутся не раньше конца этого года или начала следующего, если мировое соглашение будет окончательно одобрено, сообщает MacRumors.

14.07 / 15:26

технологии Xiaomi отпуск самит умный дом Xiaomi Mijia Smart Water Flosser Pro: теперь ирригатор умнее твоего первого смартфона

Xiaomi продолжает экспансию в вашу ванную комнату. На этот раз они решили, что обычного струи воды для гигиены недостаточно — теперь нам нужен цветной экран и мобильное приложение для чистки зубов. Новый Mijia Smart Water Flosser Pro уже появился на рынке по цене 399 юаней, что составляет приблизительно 56$ (2500 грн).

14.07 / 15:26

Samsung технологии дети общество роботы Samsung забирает награды Red Dot Award за роботов-нянек и «умные» зеркала

Пока мы пытаемся привыкнуть к тому, что искусственный интеллект теперь в каждом утюге, Samsung Electronics продолжает рисовать будущее, где ИИ будет воспитывать наших детей и критиковать состояние кожи по утрам. Компания получила восемь наград на престижном конкурсе Red Dot Award: Design Concept, доказав, что умению создавать красивые рендеры им не занимать. Две из этих наград имеют высший статус «Best of the Best».

14.07 / 15:23

происшествия туризм политика самит Знаменитости ТОП-10 мест в Лондоне, которые не любят сами британцы

Коренные жители Лондона массово игнорируют культовые городские локации. Каждый горожанин не посетил минимум три знаковых места.

Лента новостей

На главную страницу