DeepSeek R1 бросает вызов чатам GPT и Llama. Как экспортные ограничения США спровоцировали рождение в Китае соперника западным ИИ-гигантам? Разбор WIRED
Кто стоит за китайским стартапом DeepSeek и почему разработчики предоставили свободный доступ к своей передовой ИИ-модели DeepSeek R1? Издание WIRED пообщалось с экспертами по искусственному интеллекту в Китае и изучило интервью с основателем DeepSeek Лян Вэньфеном, чтобы понять историю стремительного успеха стартапа. Forbes пересказывает основное.
DeepSeek – относительно неизвестный стартап из Китая, занимающийся разработкой искусственного интеллекта, 20 января представил ИИ-модель с открытым кодом DeepSeek R1. Его появление уже обрушило мировые фондовые рынки, поставив под сомнение технологическое доминирование США, писал Bloomberg. Кремниевая долина стоит на ушах, ведь результат работы DeepSeek свидетельствует о том, что можно разрабатывать мощные ИИ-модели, которые стоят дешевле.
Своими возможностями DeepSeek R1 превосходит имеющиеся ведущие ИИ-модели, например OpenAI o1, по нескольким математическим показателям и показателям рассуждений, пишет WIRED. Фактически по многим показателям: возможности, стоимость, открытость. Это вызов западным ИИ-компаниям. DeepSeek R1 уже поднялся на вершину чартов загрузок Apple Store.
Успех DeepSeek – непредсказуемый результат технологической холодной войны между США и Китаем, отмечает WIRED.
Экспортный контроль со стороны США заставил китайские фирмы отказаться от традиционного подхода к разработке ИИ-моделей, базирующегося на масштабировании аппаратных ресурсов. Большинство китайских компаний сосредоточились на уже присутствовавших на рынке ИИ-моделях, а не на создании собственных. DeepSeek использовал конкурентный способ – оптимизировать базовую структуру ИИ-моделей и использовать ограниченные ресурсы, пишет WIRED.
«DeepSeek отличается фокусом на программной оптимизации и использовании
Читать на forbes.ua
