Xiaomi разгоняет ИИ: режим UltraSpeed выдает более 1000 токенов в секунду
Пока большинство разработчиков искусственного интеллекта соревнуются в количестве параметров, Xiaomi решила, что пора подумать о скорости. В семействе больших языковых моделей MiMo официально представлен режим UltraSpeed для версии MiMo-V2.5-Pro. Это не просто очередное обновление софта, а попытка доказать, что даже монструозные модели с 1 триллионом параметров могут работать без задержек, которые обычно раздражают пользователей.
Новый режим UltraSpeed позволяет MiMo-V2.5-Pro преодолевать психологический барьер в 1000 токенов в секунду. Для понимания масштаба: предыдущая модель MiMo-V2-Flash, выпущенная в декабре 2025 года, выдавала около 150 токенов в секунду. Это уже было быстрее, чем любой человек способен читать или говорить, но Xiaomi решила ускорить процесс еще почти в семь раз. Такого результата удалось достичь благодаря совместной разработке с специалистами Xiaomi и TileRT.
Ключевая особенность заключается в том, что модель оптимизирована для работы на универсальных графических процессорах. Компания утверждает, что секрет кроется в выверенном проектировании самой модели и ее базовой архитектуры. Это позволяет эффективно распределять нагрузку и избегать «узких мест» при обработке данных, что обычно тормозит работу крупных нейросетей.
Как это часто бывает в мире высоких технологий, за скорость приходится платить. Использование API MiMo-V2.5-Pro в режиме UltraSpeed обойдется разработчикам втрое дороже стандартного тарифа. Это логично, поскольку поддержка такой производительности требует значительных вычислительных ресурсов, которые на рынке все еще остаются дефицитными.
Чтобы протестировать возможности системы, Xiaomi запускает пробный период, который продлится с 9 по 23 июня 2026 года. Однако доступ получат не все.
Читать на gagadget.com
