Nvidia выпускает компактную открытую модель Nemotron-Nano-9B-v2 с переключаемыми рассуждениями
Сегодня звёздный час маленьких моделей. Сразу после выхода AI‑модели, которая помещается даже в смарт‑часы от Liquid AI, стартапа MIT, и модели Google, способной работать прямо на смартфоне, Nvidia тоже вступает в игру — представив новую компактную языковую модель (SLM) Nemotron‑Nano-9B‑V2. Она показала лучшие результаты в своём классе на ряде тестов и снабжена функцией переключения режима «reasoning» — то есть самопроверки перед тем, как выдать ответ.
Хотя 9 миллиардов параметров больше, чем у некоторых «малюток» с несколькими миллионами параметров, Nvidia подчёркивает: это заметное сокращение по сравнению с первоначальным размером в 12 миллиардов. Более того, модель оптимизирована так, чтобы работать на одной видеокарте Nvidia A10.
Как пояснил директор по пост‑обучению моделей Nvidia Алексей Кучаев в X в ответ на мой вопрос: «12 миллиардов параметров урезали до 9, чтобы она точно помещалась в A10 — популярный выбор для внедрения. Это ещё и гибридная модель, которая позволяет обрабатывать более крупные пакеты данных и быть до 6 раз быстрее аналогичных трансформеров сопоставимого размера».
Для сравнения: многие флагманские LLM сегодня переваливают за планку в 70+ миллиардов параметров (напомним, параметры — это внутренние настройки, управляющие поведением модели: чем их больше, тем она мощнее, но тем выше вычислительные издержки).
Модель работает с множеством языков: английским, немецким, испанским, французским, итальянским, японским, а также — в расширенных описаниях — с корейским, португальским, русским и китайским. Она подходит как для следования инструкциям, так и для генерации кода.
Nemotron‑Nano-9B‑V2 и её датасеты предобучения уже доступны на Hugging Face и в каталоге моделей Nvidia.
В основе модели лежит Nemotron‑H —
Читать на habr.com