В топ рейтинга ИИ попала модель правительства Рио-де-Жанейро на основе Qwen
На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B.
Изначально заявлялось, что разработчики дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать решение, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — однако за этим успехом скрывался совсем другой технический нюанс.
Как модель привлекла внимание общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «смеси экспертов». Во время генерации активируется часть параметров — 17 млрд на токен. Подход позволяет получить производительность моделей флагманского уровня, т. к. архитектура этой модели аналогична большинству самых успешных моделей.
Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы
Из основных плюсов (по заявлению разработчиков) можно выделить следующее:
интеграция SwiReasoning с возможностью динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;
отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями;
хорошее понимание многих языков — результаты на английском, китайском и других языках на высоком уровне;
лицензия MIT, которая снимает с открытого кода запреты вроде использования в коммерческих целях или модификации.
Ключевое, на мой взгляд,
Читать на habr.com
