Об этом же в других СМИ

gagadget.com / 2 месяца назад

OpenAI против Apple: AI-гигант недоволен интеграцией ChatGPT в iOS и Siri и обвиняет партнера в недобросовестном сотрудничестве

incrypted.com / 2 месяца назад

Майнинговый гигант MARA продал почти 21 000 BTC ради экспансии в сектор ИИ

habr.com / 2 месяца назад

Приглашаем послушать, как ИИ троллит техногигантов

habr.com / 2 месяца назад

Япония использует игровые движки для городского планирования и управления стихийными бедствиями

cursorinfo.co.il / 2 месяца назад

Какие привычки тихо приближают инсульт - срочно проверьте себя

Больше по теме

27.04.2026 - 23:11 / habr.com

DeepSeek-V4: Тихий гигант

Привет, Хабр! 👋 Сегодня разбираем, что принесла новая версия: прорыв или эволюция? Действительно ли «триллион параметров» — это не маркетинг? И главное — стоит ли переключаться с Claude или GPT?

Параметр

DeepSeek-V4 Flash

DeepSeek-V4 Pro

Общее количество параметров

~400 млрд

~1.6 трлн

Активные параметры на токен

~12 млрд

~49 млрд

Экспертов на слой (MoE)

384

Активных экспертов на токен

Контекстное окно

1 000 000 токенов

KV Cache (при 1M контексте)

~8% от V3.2

~10% от V3.2

Вычислительные затраты (FLOPs)

~22% от V3.2

~27% от V3.2

Модальности

Текст

Лицензия

MIT

Цена API (вход/выход)

$0.14 / $0.28 за 1M токенов

$1.74 / $3.48 за 1M токенов

Главная инновация — эволюция Mixture-of-Experts. Если в V3 было 256 экспертов на слой, то в V4-Pro их уже 384, но для генерации одного токена активируется лишь 6 из них.

Входной токен
↓
[Роутинг-механизм] → выбирает 6 наиболее релевантных экспертов
↓
Параллельная обработка в выбранных экспертах
↓
Агрегация результатов → выходной токен

Что это даёт:

Знания модели масштаба триллиона параметров

Стоимость инференса как у модели на ~50 млрд параметров

Возможность локального запуска: INT4-квантование помещается в 1×RTX 4090 для Flash-версии

Проблема длинных контекстов известна: квадратичная сложность внимания убивает производительность. DeepSeek решила её через гибридный механизм внимания DSA2 (DeepSeek Sparse Attention 2), сочетающий:

Компонент

За что отвечает

CSA (Clustered Sparse Attention)

Группировка токенов в семантические кластеры

HCA (Hierarchical Context Aggregation)

Иерархическое сжатие дальних зависимостей

Локальное окно

Точная работа с ближайшим контекстом

Результат: при работе с 1 000 000 токенов:

Потребление памяти (KV Cache) — всего 10% от уровня V3.2

Вычислительные затраты

Huawei Nvidia общество самит мода и стиль крипто токен eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Камеры видеонаблюдения Synology BC510 и TC510: когда софтверный гигант берется за собственное «железо» gagadget.com / 2 месяца назад

В Китае собрали гигантский системный блок с кондиционером habr.com / 2 месяца назад

Гигантские сенсоры и мегапиксельные войны: какими будут камеры в Huawei Mate 90 gagadget.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

23.07 / 16:19

Samsung технологии общество звезда мода и стиль Honor меняет лицо: новый цвет, дерзкий слоган и амбиции стать AI-гигантом

Honor решила, что старого гардероба ей мало. Компания объявила о масштабном ребрендинге, который имеет цель не только освежить картинку, но и радикально изменить восприятие бренда на мировой арене. Вместо привычного слогана «Go Beyond», который сопровождал устройства последние годы, теперь на знаменах будет «Dare to be» (Осмелиться быть). Это явный намек на то, что бренд готов к более агрессивной игре против лидеров рынка.

23.07 / 16:19

самит шутеры трейлеры Ксеноморфы назначили встречу — кооперативный шутер Aliens: Fireteam Elite 2 выйдет 25 августа

Студия Cold Iron раскрыла дату релиза Aliens: Fireteam Elite 2 — сиквела малоизвестного кооперативного шутера 2021 года, посвященного истреблению огромного количества ксеноморфов.

23.07 / 16:03

происшествия общество больница дети и родители гаджет Новая фобия: робот-пылесос едва не убил австралийца

Мать пострадавшего поделилась подробностями этого кошмарного дня. По ее словам, утечка в батарее спровоцировала мгновенное возгорание.

23.07 / 16:03

ученые космос самит планеты звезда В недрах космоса обнаружена планета, похожая на Землю - исследование

Астрономы нашли экзопланету, похожую на Землю, которая имеет ряд особенностей, делающих ее потенциально пригодной для жизни.

23.07 / 15:47

Представлена простая плёночная камера для любителей аналоговой фотографии Kodak EC35

Компания Reto Project, выпускающая камеры по лицензии Kodak, представила компактную плёночную камеру Kodak EC35. Устройство рассчитано на начинающих фотографов и любителей аналоговой съёмки, которым нужна максимально простая альтернатива одноразовым плёночным камерам.

23.07 / 15:37

экономика общество самит крипто токен Исследователь сжёг все свои токены и разработал ИИ-конвейер, изучая способы экономии на ИИ-моделях

Разработчик Бартош Котрыс (Bartosz Kotrys) из компании Quesma рассказал, как полностью исчерпал лимит подписки Claude Max, пытаясь исследовать способы сокращения расходов на использование больших языковых моделей — на это у него ушло всего полчаса.

23.07 / 15:37

общество самит Здоровье и красота взрывы полюс «Уэбб» помог астрономам уточнить диету чёрных дыр

Благодаря космическому телескопу имени Джеймса Уэбба астрономы смогли заглянуть в механизмы, с помощью которых сверхмассивные чёрные дыры питаются. Эти наблюдения могут помочь учёным выяснить, как сверхмассивные чёрные дыры, масса которых в миллионы, а зачастую и в миллиарды раз превышает массу Солнца, смогли так быстро разрастись вскоре после Большого взрыва. Подробности опубликованы в исследовании в журнале The Astrophysical Journal Letters.

23.07 / 15:37

культура политика Иностранные абитуриенты смогут поступать в российские вузы дистанционно

Иностранным абитуриентам предоставили возможность дистанционно подавать заявления в российские вузы через «Госуслуги». Для этого можно оформить учётную запись в мобильном приложении ruID, не приезжая в Россию. Об этом сообщил руководитель Центра компетенций в образовании и культуре ФКУ «ГосТех» Минцифры России Дмитрий Пухов.

23.07 / 15:37

люди Tesla самит Полиция Владелец Tesla получил штраф за превышение скорости, когда машиной управляла FSD

Владелец Tesla из Квебека Фред Ламберт получил штраф за превышение скорости, когда машиной управляла система автономного вождения Tesla (FSD).

23.07 / 15:17

экономика криптовалюта Макроэкономика инвестор google Grayscale оценила шансы на завершение медвежьего рынка биткоина и объяснила, что будет решающим

Аналитики Grayscale заявили, что нынешний медвежий рынок биткоина может уже приближаться к завершению, если ФРС США воздержится от дальнейшего повышения ставок, а экономика будет оставаться устойчивой. В новом исследовании руководитель аналитического подразделения компании Зак Пендл объяснил, почему традиционная теория четырехлетнего цикла все хуже описывает поведение первой криптовалюты. По его словам, среди участников рынка сейчас доминируют два подхода к оценке перспектив биткоина.

Лента новостей

На главную страницу