


Не просто объехать мяч, а подумать о ребёнке: Nvidia показала открытую модель DRIVE Alpamayo-R1
На конференции NeurIPS, прошедшей 1 декабря 2025 года в Сан‑Диего (США), компания Nvidia объявила о выпуске DRIVE Alpamayo‑R1 — открытой ИИ‑модели и набора инструментов для автономного транспорта и робототехники. В центре внимания презентации было укрепление технологической базы физического ИИ — интеллекта, который способен понимать и ощущать реальный мир, взаимодействуя с ним напрямую.
Nvidia DRIVE Alpamayo‑R1 — новая ИИ‑модель, созданная для исследований в области беспилотного вождения. В её основе лежит визуально‑языковая модель для рассуждений Cosmos‑Reason1, предназначенная для физического ИИ и робототехники. Разработчики позиционируют Alpamayo‑R1 как первую в мире визуально‑языковую модель действий (VLA), способную не только интерпретировать изображение и текст, но и вырабатывать поведенческие решения.
Обычные системы беспилотного вождения справляются с элементарными задачами — вроде перестроений или объезда препятствий, — но испытывают трудности, когда нужно оценить ситуацию целиком. Alpamayo‑R1 же объединяет видеопоток с камер и языковую информацию, позволяя системе рассуждать почти «по‑человечески» и принимать решения с учётом контекста.
Так, например, в демонстрационном ролике автомобиль, заметив катящийся мяч, не просто объезжает его как помеху, но понимает возможные последствия: «Нужно притормозить — вдруг за мячом бежит ребёнок». Подобный уровень осмысленного поведения приближает отрасль к внедрению автономного вождения IV уровня, при котором система способна полностью управлять машиной в заданных условиях и локациях.
Датасет Nvidia DRIVE Alpamayo‑R1 свободно доступен на Hugging Face.
Чтобы облегчить разработчикам работу с новыми продвинутыми моделями, команда Cosmos также выпустила руководство и набор
Читать на habr.com