DeepSeek V4 Pro: Китайские нейросети пересаживаются на оборудование Huawei
Пока весь мир охотится за дефицитными чипами NVIDIA, китайская компания DeepSeek решила пойти сложным путем — путем полной лояльности к отечественному железу. Выход новой модели V4 задержался на несколько месяцев, и теперь причина стала очевидной: разработчики занимались масштабной пересадкой «мозгов» своего алгоритма на ускорители Ascend. Это не была обычная адаптация, а полноценная перепись программного стека ради каждого процента производительности.
Переход на собственные рельсы оказался значительно сложнее, чем это обычно описывают в пресс-релизах. DeepSeek пришлось потратить немало времени, чтобы обеспечить не только совместимость, но и стабильную работу на базе оборудования Huawei Ascend. Интеграция китайских ускорителей в существующую инфраструктуру обучения и вывода моделей требовала глубокой переработки архитектурных решений. Инженеры пытались достичь масштабируемости, которая бы позволила постепенно вытеснить импортные решения из ключевых вычислительных сценариев.
Такие усилия направлены на создание автономной экосистемы, где софт и железо происходят из одного региона. Это критически важно в условиях постоянных санкционных ограничений, которые закрывают доступ к передовым западным технологиям. Разработчикам пришлось адаптировать систему под специфические особенности архитектуры Huawei, чтобы получить предсказуемый результат в сложных задачах машинного обучения.
Несмотря на задержку, в прошлую пятницу DeepSeek наконец представила предварительную версию V4. Модель выходит в двух вариантах: мощная Pro и облегченная Flash-версия. Такое разделение стало стандартом для индустрии, где пользователям нужен выбор между максимальной точностью и скоростью работы за меньшие деньги. В тестах на знание мировых данных версия Pro
Читать на gagadget.com
