Китайский стартап MiniMax представил модель MiniMax M1 — конкурент для Gemini 2.5 Pro
Китайский стартап в области искусственного интеллекта MiniMax выпустил MiniMax-M1 — новую языковую модель с открытым исходным кодом, которая превосходит R1 от Deepseek.
MiniMax-M1 — это модель, ориентированная на рассуждения, с большим контекстным окном до одного миллиона токенов и «мыслительным» бюджетом до 80 000 токенов. Модель использует особенно эффективный подход к обучению с подкреплением, что делает её намного компактнее, чем другие варианты с открытым исходным кодом.
Он доступен бесплатно по лицензии Apache-2.0. В тестовых испытаниях MiniMax-M1 превосходит другие открытые модели, такие как DeepSeek-R1-0528 и Qwen3-235B-A22B, в нескольких категориях. В тесте OpenAI MRCR, который измеряет способность к сложным многоэтапным рассуждениям на основе длинных текстов, производительность M1 близка к ведущей закрытой модели Gemini 2.5 Pro.
В то время как проприетарные модели, такие как OpenAI o3 и Gemini 2.5 Pro, по-прежнему имеют преимущество в некоторых областях, MiniMax-M1 значительно сократил разрыв. Модель доступна в двух версиях на Hugging Face.
MiniMax, стартап в области искусственного интеллекта из Шанхая, быстро стал крупным игроком на растущем рынке ИИ в Китае. Компания, основанная в конце 2021 года при поддержке таких инвесторов, как Alibaba, специализируется на разработке передовых языковых и мультимодальных моделей.
Ранее в этом году компания MiniMax выпустила несколько языковых моделей с открытым исходным кодом, в том числе MiniMax-Text-01, которая может обрабатывать до четырёх миллионов токенов контекста — в два раза больше, чем ведущие модели на данный момент. Хотя большее окно контекста впечатляет, исследователи предупреждают, что большее количество токенов не всегда означает более точную формулировку
Читать на habr.com