Триллион параметров, 63 млрд активных: модель Ling-2.5-1T бросает вызов DeepSeek V3.2
Ant Group, оператор платежной платформы Alipay и аффилиат Alibaba, выпустила Ling-2.5-1T — открытую языковую модель с триллионом параметров, из которых 63 млрд активны при генерации. Модель обучена на 29 трлн токенов (против 20 трлн у предшественника), поддерживает контекстное окно до 1 млн токенов и распространяется под лицензией MIT. Веса уже доступны на Hugging Face и ModelScope, онлайн-чат и API через Ling Studio и ZenMux обещаны в ближайшее время. Одновременно компания представила Ring-2.5-1T — thinking-версию на той же архитектуре.
По данным разработчиков, модель соревнуется с DeepSeek V3.2 и GPT-5.2 в большинстве бенчмарков. Однако в следовании инструкциям и работе с длинным контекстом Ling-2.5-1T уступает закрытым моделям, а в задачах на знания и код — Kimi K2.5. Сами авторы это признают.
Архитектурно Ling-2.5-1T — гибрид. Разработчики заменили классическое групповое внимание (GQA) комбинацией из многоголового линейного внимания (MLA) и Lightning Linear в соотношении 1:7. По данным Ant Group, на длинных последовательностях такая архитектура обеспечивает значительный рост пропускной способности — даже по сравнению с моделями, у которых активных параметров вдвое меньше.
Ant Group развивает три серии открытых моделей: Ling (instant), Ring (thinking) и Ming (мультимодальная). Первый триллионный релиз — Ling-1T — вышел в октябре 2025 года, и менее чем за пять месяцев компания выпустила обновлённую линейку. Все бенчмарки пока внутренние — но динамика релизов показывает, что в гонке китайских open-source моделей у DeepSeek появился настойчивый конкурент.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читать на habr.com