Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов
Команда Qwen представила Qwen3-Coder-Next — языковую модель с открытыми весами, разработанную специально для программирующих агентов и локальной разработки. Она построена на базе Qwen3-Next-80B-A3B-Base, в которой используется новая архитектура с гибридным механизмом внимания и MoE (Mixture of Experts, «смесь экспертов»). Qwen3-Coder-Next прошла масштабное агентное обучение на данных, включающих синтез исполняемых задач, взаимодействие со средой и обучение с подкреплением, благодаря чему получила сильные навыки программирования и агентного поведения при заметно более низкой стоимости инференса.
Вместо того чтобы полагаться только на масштабирование числа параметров, Qwen3-Coder-Next делает акцент на масштабировании обучающих сигналов для агентного поведения. Мы обучаем модель на больших коллекциях проверяемых задач по программированию, связанных с исполняемыми окружениями, чтобы модель могла учиться напрямую на обратной связи от среды. Это включает:
Продолженное предобучение на данных, ориентированных на код и работу агентов
Обучение с учителем на данных с высококачественными траекториями агента
Обучение специализированных экспертов по доменам (например, разработка ПО, QA, веб/UX)
Дистилляцию экспертов в единую модель, готовую к развёртыванию
Этот рецепт делает упор на рассуждения на длинном горизонте, использование инструментов и восстановление после сбоев при выполнении, что критично для реальных программирующих агентов.
Результаты на агентно-ориентированных бенчмарках
На рисунке ниже показаны результаты на нескольких широко используемых бенчмарках для программирующих агентов, включая SWE-Bench (Verified, Multilingual и Pro), TerminalBench 2.0 и Aider.
Рисунок показывает, что:
Qwen3-Coder-Next набирает более 70% на SWE-Bench
Читать на habr.com