



DeepSeek V4 хотят выпустить к концу января. Модель тренируют на контрабандных Nvidia Blackwell
По данным The Information, DeepSeek использует несколько тысяч чипов Nvidia Blackwell для разработки следующей модели — условной DeepSeek V4 (или R2, если придерживаться старого варианта именования). Эти новейшие чипы запрещено экспортировать в Китай — но, как утверждают шесть источников издания, их ввозят контрабандой: серверы с Blackwell сначала отправляют в дата-центры стран, где экспорт разрешен, там разбирают и переправляют компоненты в Китай по частям.
Часть сотрудников DeepSeek рассчитывает выпустить новую модель к китайскому Новому году — концу января. Впрочем, основатель компании Лян Вэньфэн жесткий дедлайн не ставит и, по словам источников, ставит качество выше сроков. В сентябре DeepSeek выпустила V3.2-Exp — экспериментальную модель, которую сама компания называет "промежуточным шагом к следующему поколению". Но перенос нового подхода на большие модели идёт медленно.
Ключевая ставка DeepSeek — архитектура DeepSeek Sparse Attention (DSA), которая должна резко удешевить запуск модели для конечных пользователей за счет разреженных вычислений. Blackwell для этого подходит идеально: чипы B200 ускоряют такие операции примерно вдвое по сравнению с предыдущим поколением и дают в 2,5 раза больше производительности на инференсе LLM, чем H200.
Буквально только что Трамп разрешил Nvidia продавать H200 в Китай с 25-процентным сбором в пользу США. Но даже эти чипы не станут для китайских компаний "серебряной пулей". По данным Financial Times, Пекин сам ограничит к ним доступ: компаниям придется доказывать, что отечественных чипов недостаточно, а госзаказчиков будут подталкивать к решениям Huawei и других локальных производителей. В итоге китайские AI-компании продолжают жить на "лоскутном" железе: старые запасы Nvidia,
Читать на habr.com