Новая модель ИИ Light-R1-32B с открытым исходным кодом превосходит аналоги в решении математических задач
Исследователи представили Light-R1-32B — новую модель ИИ с открытым исходным кодом, оптимизированную для решения сложных математических задач. Теперь она доступна на Hugging Face по разрешённой лицензии Apache 2.0 — бесплатно для предприятий и исследователей, которые могут использовать, внедрять, настраивать или изменять её по своему усмотрению, даже в коммерческих целях.
Модель с 32 миллиардами параметров превосходит по производительности аналогичные (и даже более крупные) модели с открытым исходным кодом, такие как DeepSeek-R1-Distill-Llama-70B и DeepSeek-R1-Distill-Qwen-32B, в стороннем тесте American Invitational Mathematics Examination (AIME), который содержит 15 математических задач, предназначенных для студентов с очень высоким уровнем подготовки, и рассчитан на 3 часа.
Модель превосходит предыдущие альтернативы с открытым исходным кодом по результатам тестов по математике.
Невероятно, но исследователи завершили обучение модели менее чем за шесть часов на 12 графических процессорах Nvidia H800 при общей стоимости около 1000 долларов. Это делает Light-R1-32B одним из самых доступных и практичных подходов к разработке высокопроизводительных математических моделей ИИ. Однако важно помнить, что модель была обучена на Qwen 2.5-32B-Instruct с открытым исходным кодом от Alibaba, который, как предполагается, сам по себе требует гораздо более высоких первоначальных затрат на обучение.
Наряду с моделью команда опубликовала наборы данных для обучения, скрипты и инструменты оценки, обеспечив прозрачную и доступную платформу для создания математических моделей ИИ.
Появление Light-R1-32B стало результатом аналогичных усилий конкурентов, таких как Microsoft Orca-Math.
Исследователи улучшили способности Light-R1-32B справляться со
Читать на habr.com