Об этом же в других СМИ

habr.com / 4 месяца назад

Открываем в Open Source библиотеку для автоматического обнаружения узлов Tarantool

incrypted.com / 4 месяца назад

Google добавила Lyria 3 в Gemini и открыла генерацию музыки из фото и видео

habr.com / 4 месяца назад

Компания Anthropic открыла офис в Бангалоре и объявила о новых партнерах в Индии

habr.com / 4 месяца назад

Индия утвердила государственный венчурный фонд на $1,1 млрд для deep‑tech и стартапов

habr.com / 4 месяца назад

Meta* запатентовала AI для ведения соцсетей после смерти владельца аккаунта

Больше по теме

02.02.2026 - 09:35 / habr.com

Tencent открыла HPC-Ops, библиотеку для максимальной выжимки из H100 и H200

Продакшен больших моделей давно превратился в соревнование за проценты эффективности. Когда счет идет на тысячи GPU, даже небольшой прирост скорости напрямую превращается в миллионы долларов экономии. Tencent Hunyuan AI Infra выложила в open source HPC-Ops, библиотеку, на которой работает их собственная продакшен инфраструктура.

Ключевая идея простая и радикальная. Вместо оптимизации существующих решений разработчики переписали все с нуля на чистой CUDA и CuTe, строго под архитектуру Hopper. Это осознанный шаг, так как популярные фреймворки вроде vLLM или стандартного FlashAttention часто не используют потенциал H100 и H200 на полную.

HPC-Ops заточен именно под максимальную утилизацию GPU. Внутри есть полный набор инструментов для серьезного инференса. Оптимизированные ядра внимания с paged attention, квантованный Grouped GEMM с поддержкой FP8 и блочным скейлингом, Fused MoE и эффективные механизмы коммуникации между нодами в распределенных системах.

Результаты выглядят убедительно. На собственных моделях Tencent рост пропускной способности составил около 30 процентов, на моделях DeepSeek около 17 процентов. Самый впечатляющий эффект показал H20, где ускорение достигло 2.22 раза по сравнению с предыдущими решениями.

Основной выигрыш приходит на этапе декодинга. В режиме BF16 механизм внимания работает примерно в 2.2 раза быстрее, чем связка FlashInfer, FlashAttention и TensorRT LLM. На префилле ускорение скромнее, около 1.33 раза, но и это заметный прирост для продакшена. В FP8 картина похожая. Декодинг ускоряется почти в 2 раза, а префилл дает около 12 процентов прироста. Отдельно выделяется Fused MoE, который в FP8 ускоряет префилл почти на 50 процентов.

Библиотека хорошо интегрируется с vLLM и SGLang, но важно учитывать

технологии экономика самит доллар крипто токен Tencent cognitronn

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google представила WebMCP — стандарт для работы ИИ-агентов с сайтами habr.com / 4 месяца назад

В какое время нужно ужинать для максимальной пользы cursorinfo.co.il / 5 месяцев назад

Anthropic открыла возможности платного тарифа Claude для пользователей без подписки habr.com / 5 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 07:54

здоровье общество психология мужчина женщина Почему вы постоянно говорите «спасибо» – психологи назвали причину

Хотя привычка постоянно благодарить часто воспринимается как признак хорошего воспитания, психологи предупреждают, что за ней может скрываться тревожность.

16.07 / 07:54

общество семья самит отношения психология Семь сигналов от психолога, что отношения пора заканчивать

Американский психотерапевт перечислил поведенческие маркеры, разрушающие семейные союзы. Эти признаки часто игнорируются самими жертвами.

16.07 / 07:49

Amazon Nvidia профессия Глава Nvidia Дженсен Хуанг: инженеры компании все реже пишут код и все чаще создают ИИ‑агентов

Генеральный директор Nvidia Дженсен Хуанг заявил, что искусственный интеллект уже заметно изменил работу инженеров‑программистов в компании, сообщает Business Insider. По его словам, разработчики все меньше времени тратят на традиционное написание кода и все больше — на проектирование агентных ИИ‑систем, проверку их работы и постановку задач.

16.07 / 07:49

СНГ HoneyBadger CTF от AvitoTech: 18–19 июля, 30 часов, две лиги

18–19 июля AvitoTech проводит свой первый CTF — HoneyBadger CTF.

16.07 / 07:26

налоги Samsung технологии СМИ самит Samsung может отказаться от популярного бонуса при предзаказе Galaxy Z Fold8 и Z Flip8

Если сведения подтвердятся, изменения затронут все три ожидаемые новинки: Galaxy Z Flip8, Galaxy Z Fold8 и Galaxy Z Fold8 Ultra. При этом речь пока идет о слухе, основанном на публикации южнокорейского издания Chosun Biz. Официально Samsung эту информацию пока не подтверждала.

16.07 / 07:25

ТВ смартфоны бытовая техника Транспорт Компактный проектор Pixorien Z01 со встроенной подставкой

Pixorien представила необычный портативный проектор Z01, который решает одну из самых распространенных проблем — поиск подходящего места для установки.

16.07 / 07:22

промышленность предприятия 1С в промышленности: что обсуждали на ИННОПРОМ-2026

С 6 по 9 июля в Екатеринбурге прошла международная промышленная выставка ИННОПРОМ-2026. Инфостарт участвовал в выставке со стендом и обсуждал с представителями промышленных предприятий развитие ИТ-систем на базе 1С.

16.07 / 07:22

происшествия самит изоляция AI-агенты для аудита кода научились запускать вредоносное ПО вместо его поиска

Исследователи из AI Now Institute описали новую атаку Friendly Fire, которая позволяет превратить AI-агентов для анализа безопасности в — напротив — инструмент компрометации системы. Под удар попали автономные режимы Claude Code и OpenAI Codex, когда они используются для проверки стороннего кода без подтверждения каждого действия со стороны пользователя.

16.07 / 07:19

люди экономика общество инвестор google «Люди стали дешевле, чем программное обеспечение»: венчурные инвесторы пересматривают роль ИИ

Венчурная компания Andreessen Horowitz (a16z) опубликовала аналитический материал с тезисами CEO Hebbia Джорджа Сивулки о том, что искусственный интеллект не заменяет людей, а меняет подходы к управлению трудом. В своем материале a16z приводит главный вывод Джорджа Сивулки: Проблема больше не в моделях, а в управлении ими По мнению Сивулки, современные компании фактически получили «бесконечный штат» ИИ-агентов, но большинство еще не научилось эффективно ими управлять. Он п

16.07 / 07:18

продукты продукты питания Здоровье и красота полезные продукты кулинария Почему стоит добавить авокадо в свой ежедневный рацион

Регулярное употребление авокадо помогает организму получать полезные мононенасыщенные жиры и клетчатку.

Лента новостей

На главную страницу