




Kimi-K2 — следующий этап развития искусственного интеллекта в Китае после Deepseek
Компания Moonshot AI из Китая выпустила Kimi-K2 — новую большую языковую модель с открытым исходным кодом, которая призвана составить конкуренцию ведущим проприетарным моделям, таким как Claude Sonnet 4 и GPT-4.1, без специального модуля логического вывода. Это событие напоминает выпуск Deepseek.
Компания Moonshot AI, основанная в 2023 году, создала Kimi-K2 — модель, объединяющую опыт экспертов, с огромным количеством параметров — один триллион, из которых активируются 32 миллиарда при выводе данных. Открытые весовые коэффициенты делают модель доступной для исследований, тонкой настройки и индивидуального применения.
Согласно стандартным тестам больших языковых моделей, Kimi-K2-Instruct — версия, оптимизированная для использования в реальных условиях, — находится в одной лиге с ведущими закрытыми моделями. На SWE-bench Verified она набрала 65,8% в режиме агента, уступив Claude Sonnet 4 и значительно опередив GPT-4.1 (54,6%). Этот тест проверяет, может ли модель выявлять и исправлять реальные ошибки в коде проектов с открытым исходным кодом.
Kimi-K2 также лидирует в LiveCodeBench (53,7%) и OJBench (27,1%) без модуля логического вывода. Эти тесты показывают, насколько хорошо языковые модели справляются с задачами программирования: LiveCodeBench — в интерактивном режиме, OJBench — в виде традиционных конкурсных заданий.
Kimi-K2 также выделяется в задачах по математике и естественным наукам. В таких тестах, как AIME, GPQA-Diamond и MATH-500, он превосходит своих конкурентов. Он также входит в число лучших моделей в многоязычных тестах, таких как MMLU-Pro. Moonshot AI демонстрирует возможности Kimi-K2 в программировании на X.
В неофициальном тесте Саймона Уиллисона Kimi-K2 успешно сгенерировал SVG-изображение пеликана на
Читать на habr.com