Генеральный директор Anthropic опровергает слухи о стоимости разработки Claude 3.5 Sonnet
Генеральный директор Anthropic Дарио Амодеи хочет развеять некоторые заблуждения о Claude 3.5 Sonnet. Разработка модели AI обошлась гораздо дешевле, чем предполагают недавние слухи, и она не была создана с использованием более продвинутых секретных моделей, как утверждают некоторые.
По словам Амодеи, обучение Claude 3.5 Sonnet — в настоящее время считающегося самой способной языковой моделью AI — обошлось примерно в несколько десятков миллионов долларов, а не в миллиарды, как предполагалось в недавних отчетах. Он также опровергает предположения о том, что Sonnet был разработан с использованием синтетических данных, сгенерированных более сложными, невыпущенными моделями, такими как Opus 3.5 .
«Несмотря на то, что обучение проводилось девять-двенадцать месяцев назад, Sonnet по-прежнему заметно опережает по многим внутренним и внешним оценкам», — говорит Амодей, отмечая, что это особенно очевидно, когда модель фактически используется в практических задачах, таких как программирование и взаимодействие с людьми.
Реальное техническое достижение Deepseek — это не широко обсуждаемая модель R1 , говорит Амодеи, а скорее их модель Deepseek-V3, выпущенная в конце декабря , которая представила ключевые усовершенствования, такие как продвинутый подход «смешанных экспертов». Модель R1 , выпущенная позже, в основном основана на существующих подходах, говорит Амодеи.
Экономия затрат Deepseek не является чем-то необычным для отрасли, отмечает Амодеи. Стоимость обучения моделей AI обычно снижается примерно «примерно в 4 раза в год».
«Я думаю, справедливо будет сказать: «DeepSeek создала модель, близкую по производительности к американским моделям, выпущенным на 7–10 месяцев раньше, за гораздо меньшую стоимость (но далеко не такую, как
Читать на habr.com