DeepSeek V4: Китайский ИИ-стартап переходит на железо Huawei, игнорируя санкции США
Китайский стартап DeepSeek, который в последнее время стал главной головной болью для Кремниевой долины, готовит очередной «сюрприз». Пока западные гиганты вроде OpenAI и Google соревнуются в количестве сожжённых миллиардов на закупку железа от NVIDIA, разработчики из Ханчжоу решили пойти по пути полного импортозамещения. Новая языковая модель DeepSeek V4, по данным источников, будет полностью построена на китайской аппаратной платформе.
Согласно информации издания The Information, следующее поколение нейросети от DeepSeek не просто частично будет использовать местные чипы, а полностью переедет на экосистему Huawei. Речь идет об использовании сотен тысяч чипов Ascend 950PR. Это выглядит как логичный ответ на жесткие ограничения США, которые запрещают поставки передовых ускорителей NVIDIA в Китай.
DeepSeek уже имеет опыт работы с «железом» Huawei, но переход на полный цикл обучения модели такого масштаба на не-NVIDIA архитектуре — это серьёзный вызов. Ранее такие гиганты, как Alibaba Group, ByteDance и Tencent, также начали массово закупать Ascend 950PR, что свидетельствует о формировании мощного внутреннего рынка, который пытается игнорировать санкционный пресс.
Технические аппетиты DeepSeek V4 впечатляют: архитектура модели предполагает использование почти триллиона параметров. Чтобы заставить такую махину работать на китайских чипах, компании пришлось на протяжении нескольких месяцев сотрудничать не только с Huawei, но и с Cambricon — ещё одним крупным игроком на рынке микросхем КНР. Инженеры буквально переписывали основные компоненты кода и проводили бесконечные тесты, чтобы адаптировать алгоритмы под специфическую архитектуру Ascend.
DeepSeek V4 позиционируется как прямой конкурент ChatGPT, специализируясь на написании
Читать на gagadget.com
