Об этом же в других СМИ

habr.com / 1 год назад

Джек Дорси выпустил ещё одно приложение, оно помогает не сгореть на солнце и получать достаточно витамина D

gagadget.com / 1 год назад

Для запуска Wuchang: Fallen Feathers достаточно видеокарты GTX 1060: представлены системные требования хардкорного экшена

habr.com / 1 год назад

Reachy Mini от Hugging Face: компактный робот для разработчиков

habr.com / 1 год назад

Вышла стабильная версия открытого проекта TornadoVM 1.1.1 для запуска Java на гетерогенном оборудовании: CPU, GPU и FPGA

habr.com / 1 год назад

Raspberry Pi выпустила компактный модуль камеры

Больше по теме

28.06.2025 - 10:13 / habr.com

Исследователи DeepSeek выпустили nano-vLLM — компактный движок для запуска языковых моделей

Команда исследователей DeepSeek выпустила nano-vLLM — легковесный движок для запуска языковых моделей. Проект написан с нуля на Python и занимает около 1200 строк, что меньше существующих решений. Код nano-vLLM опубликован на GitHub.

Авторы проекта отмечают, что существующие движки для запуска языковых моделей, например vLLM, обеспечивают впечатляющую производительность. Они используют продвинутые алгоритмы и оптимизацию, что позволяет ускорить инференс. При этом кодовая база таких движков зачастую перегруженная и запутанная. Это мешает менее опытным командам модифицировать код и дорабатывать его под свои нужды.

Для решения этой проблемы команда разразработала nano-vLLM — компактный движок, который сочетает в себе высокую скорость работы и компактную кодовую базу без сложных механизмов и запутанных реализаций. При этом nano-vLLM поддерживает кэширование префиксов, тензорный параллелизм, компиляцию с torch.compile() и работу с CUDA. Всё это в 1200 строках кода на Python.

Команда проекта сравнила возможности nano-vLLM и vLLM. Для тестов использовали видеокарту RTX 4070 для ноутбуков с 8 ГБ памяти, на которой запускали модель Qwen3-0.6B. Ниже результаты:

Движок

Выходные токены

Время (с)

Пропускная способность (токенов в секунду)

vLLM

133 966

98,37

1361,84

nan0-vLLM

133 966

93,41

1434,13

Кому может пригодиться nano-vLLM:

Разработчикам, которые создают пользовательские приложения на базе языковых моделей.

Преподавателям, которые обучают инфраструктуре глубокого обучения.

Инженерам, которые развёртывают языковые модели на устройствах с ограниченными ресурсами.

Код проекта разработчики опубликовали на GitHub. Код распространяется по лицензии MIT, а в репозитории также есть инструкции по запуску.

токен daniilshat eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Nothing выпустила Headphone (1) — свои первые полноразмерные наушники habr.com / 1 год назад

В Японии прошёл Hebocon 2025 — фестиваль робототехники для тех, кто в ней не особо разбирается habr.com / 1 год назад

Raspberry Pi выпустила радиомодуль для RP2040 и RP2350 habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.07 / 17:01

Amazon доллар reddit AWS по ошибке выставила пользователям миллиардные счета

С вечера 16 июля и 17 июля 2026 года некоторые клиенты облачного сервиса Amazon Web Services обнаружили выставленные автоматически счета за облачные услуги, которые они не заказывали. Суммы в личных кабинетах пользователей варьировались от нескольких миллионов до миллиардов долларов.

21.07 / 16:52

здоровье работа общество психология стресс Опасный начальник – главные признаки и как этому противостоять

Токсичные руководители часто используют свою власть для давления. Они унижают подчиненных и разрушают здоровую атмосферу в команде.

21.07 / 16:34

технологии общество В Росатоме разработали систему «Когнитрон» для создания ИИ‑агентов

Госкорпорация «Росатом» представила систему «Когнитрон» для обучения и развертывания моделей искусственного интеллекта, а также для создания ИИ‑помощников и ИИ‑агентов. Решение поддерживает работу с текстом, изображениями, аудио‑ и видеофайлами. Платформа позволяет дообучать большие языковые модели знаниями компании без участия разработчиков. В мае 2026 года система была включена в реестр российского программного обеспечения.

21.07 / 16:34

происшествия СМИ Госдума здоровье общество СМИ: «В Госдуме предложили создать сервис передачи геолокации через „Госуслуги“ и систему 112 при угрозах безопасности»

Группа депутатов во главе с вице-спикером Государственной думы Владиславом Даванковым выступила с предложением внедрить сервис передачи геопозиции граждан в экстренные службы. Об этом сообщило агентство ТАСС со ссылкой на текст предложения.

21.07 / 16:34

общество самит звезда интересное Астрономы впервые нашли землеподобную планету с атмосферой, расположенную в зоне обитаемости своей звезды

Учёные обнаружили первую каменистую планету с атмосферой, похожую на Землю, которая находится в зоне обитаемости удалённой звезды. По словам учёных, их открытие является самым весомым на сегодняшний день доказательством того, что за пределами нашей Солнечной системы могут существовать миры с условиями, схожими с земными.

21.07 / 16:21

технологии Nvidia общество роботы интересное AGIBOT штурмует рынок: 15 000 роботов и гуманоид A3 Ultra на базе Nvidia Thor

Пока мировые технологические гиганты соревнуются в красноречии своих языковых моделей, китайская компания AGIBOT решила напомнить, что железо тоже имеет значение. На Всемирной конференции по вопросам искусственного интеллекта WAIC 2026 в Шанхае разработчики выложили на стол целый ворох новинок, среди которых человекоподобные машины для заводов, образовательные платформы и даже «умная» кисть. Но главным сообщение стало не очередной прототип, а цифра 15 000 — именно столько роботов компания уже успела выпустить.

21.07 / 16:21

технологии здоровье деньги общество Garmin Без экрана, без подписок и без проблем — Garmin представила лаконичный фитнес-трекер CIRQA Smart Band

Garmin выпустила CIRQA Smart Band — компактный фитнес-браслет без дисплея, предназначенный для круглосуточного отслеживания показателей здоровья и активности без постоянных отвлекающих уведомлений.

21.07 / 16:21

Xbox Game Pass Ремейк Halo, амбициозная новинка от авторов Pokémon и многое другое: XBOX раскрыла, чем порадует подписчиков Game Pass

XBOX представила впечатляющий список ближайших новинок сервиса Game Pass. Вторая половина июля и начало августа окажутся невероятно богатыми на пополнение, но необходимо отдельно отметить Halo: Campaign Evolved — ремейк культового шутера 2001 года и Beast of Reincarnation — амбициозный постапокалиптический экшен от японских разработчиков из Game Freak, которые много лет занимались франшизой Pokémon.

21.07 / 16:07

происшествия ученые общество климат самит Невидимый враг планеты – мировой океан стремительно задыхается

Ученые предупреждают, что стремительная потеря кислорода в океанах, реках и озерах из-за глобального потепления стала новой критической угрозой.

21.07 / 16:07

происшествия здоровье общество Эксперт мозг 10 привычек, которые незаметно сокращают вашу жизнь

Вредные привычки сокращают продолжительность нашей жизни. Полный отказ от алкоголя и курения радикально улучшает самочувствие.

Лента новостей

На главную страницу