«Непостижимые волшебники»: как китайский Deepseek обгоняет Кремниевую долину в сфере AI
Китайский стартап в области искусственного интеллекта Deepseek привлекает внимание в Кремниевой долине, сравнявшись или превзойдя лидеров отрасли, таких как OpenAI o1, GPT-4o и Claude 3.5, — и все это при гораздо меньших затратах. Кто стоит за командой академических исследователей, которые перехитрили самые громкие имена в сфере технологий?
Deepseek опережает ускорители из Кремниевой долины: последняя модель компании, Deepseek-V3 , работает лучше, чем ведущие коммерческие системы AI в тестах производительности, согласно независимым оценкам. Всего несколько месяцев назад их модель R1-Lite почти сравнялась с o1-preview от OpenAI, а финальная версия R1 теперь работает на том же уровне.
Deepseek, опираzcm на западные разработки с открытым исходным кодом, также предлагает свежие идеи. Быстрый прогресс компании привлек внимание технологических лидеров, включая генерального директора Meta* Марка Цукерберга , который, как сообщается, обеспокоен их эффективностью и скоростью.
История начинается с Лян Вэньфэна , родившегося в 1985 году в семье учителя начальной школы в Чжаньцзяне. После окончания Чжэцзянского университета в 2006 году он изучал машинное обучение в финансах во время обучения в магистратуре.
В отличие от таких гендиректоров технологических компаний, как Сэм Альтман или Илон Маск, Вэньфэн остается в стороне от внимания. Его профиль IEEE показывает, что он по-прежнему глубоко вовлечен в исследования, опубликовав в 2024 году статьи об AI в производстве и новых материалах.
К 2015 году Вэньфэн и двое его одноклассников основали квантовый хедж-фонд High-Flyer , который за шесть лет вырос до управления примерно 13 миллиардами евро, став одним из «четырех королей количественного инвестирования» Китая. Этот успех привел к созданию
Читать на habr.com


