Об этом же в других СМИ

habr.com / 3 месяца назад

ИИ-симуляторы пользователей оказались слишком вежливыми – и это проблема. Google придумала, как их раскусить

cursorinfo.co.il / 3 месяца назад

Как сварить идеальный кофе по-бразильски в обычной кастрюле

habr.com / 3 месяца назад

Разработчик потерял исходники, но сохранил скрипты. Claude Code восстановил игру за один уикенд

habr.com / 3 месяца назад

Интернет обложат пошлинами? Разбираемся, кого коснется «растаможка» всемирной сети

habr.com / 3 месяца назад

Google объявила о требовании 64-битной версии для экосистемы умных часов

Больше по теме

27.03.2026 - 17:07 / habr.com

TurboQuant: Google сжал KV-кеш LLM до 3 бит без потери точности – ускорение на H100 до 8 раз

Команда Google Research представила TurboQuant – новый алгоритм сжатия, который сокращает объём памяти, занимаемой KV-кешем больших языковых моделей, в 6 и более раз, при этом не жертвуя точностью. В тестах на ускорителях NVIDIA H100 использование 4-битной версии TurboQuant дало восьмикратный прирост производительности при вычислении логитов внимания, по сравнению с 32-битными неквантованными ключами.

Проблема KV-кеша хорошо знакома всем, кто запускает LLM с длинным контекстом. Эта “цифровая шпаргалка” хранит уже вычисленные данные внимания, чтобы не пересчитывать их на каждом шаге генерации. Однако с ростом контекстных окон именно KV-кеш становится главным узким местом по памяти. Традиционные методы векторного квантования, хоть и уменьшают его размер, требуют хранения квантованных констант в полной точности – это добавляет по 1–2 бита на каждое значение, что в масштабах больших контекстов превращается в существенный оверхед.

TurboQuant устраняет этот оверхэд за счёт двухступенчатого процесса.

На первом этапе в дело вступает метод PolarQuant. Вместо того чтобы работать с векторами в стандартных декартовых координатах (X, Y, Z), он переводит их в полярные координаты. Образно говоря, вместо “пройти 3 квартала на восток и 4 на север” вы получаете “пройти 5 кварталов под углом 37 градусов”. Теперь вектор описывается радиусом (сила данных) и углом (смысл). Поскольку распределение углов предсказуемо и сконцентрированно, PolarQuant избавляется от дорогостоящего шага нормализации данных, который требуется обычным квантователям. Это и даёт сжатие без оверхеда от хранения констант.

_{PolarQuant выступает в роли высокоэффективного компрессионного моста, преобразуя входные данные в декартовых координатах в компактную “стенографию” в}

промышленность конференция Nvidia общество книги самит google dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google выпустила Gemma 4 2B/4B/26B/31B: открытые веса и 3-е место на Arena AI habr.com / 3 месяца назад

Gemini от Google пришёл на ТВ через YouTube – нажимайте кнопку “Спросить” и говорите с видео habr.com / 3 месяца назад

Революция графики: NVIDIA представила технологию Neural Texture Compression, которая уменьшает вес текстур на 85% без потери в качестве gagadget.com / 3 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 23:24

продукты здоровье самит человек мозг Память с возрастом ухудшается — какие продукты могут ее поддержать

С возрастом мозгу требуется особенно внимательное отношение к рациону, поскольку питание напрямую связано с состоянием когнитивных функций.

24.07 / 21:54

технологии происшествия общество самит кибератаки Исследование показало, насколько Windows 10 уступает Windows 11 по безопасности: разница оказалась почти трехкратной

Согласно результатам исследования, на одном ПК с Windows 10 в среднем обнаруживается 1903 активные уязвимости. Для компьютеров с Windows 11 этот показатель составляет 652 уязвимости. Таким образом, разница достигает почти трехкратного значения, что делает более новую операционную систему значительно безопаснее с точки зрения защиты от современных киберугроз.

24.07 / 20:48

технологии общество самит google Google разрешила входить в аккаунт с помощью селфи-видео: новая функция может заменить пароль в экстренных случаях

Новая система работает на основе предварительно записанного селфи-видео. Во время первоначальной настройки пользователю необходимо посмотреть в камеру смартфона и выполнить несколько простых движений головой по подсказкам на экране. Это позволяет системе зафиксировать лицо с разных ракурсов и создать защищенный биометрический шаблон для последующей проверки личности.

24.07 / 20:03

медицина здоровье история общество прогноз В какой стране женщины будут жить дольше всех в мире

Благодаря развитому здравоохранению и здоровому образу жизни южнокорейские женщины имеют все шансы установить мировой рекорд долголетия.

24.07 / 20:03

люди дети общество психология психика Как распознать нарцисса — 5 вещей, от которых он получает удовольствие

Психологи рассказали, от чего эгоистичные люди получают настоящее удовольствие и почему они так себя ведут.

24.07 / 19:15

технологии Apple общество курс планшеты WhatsApp получил сразу четыре полезных обновления: приложение стало удобнее на iPad, в автомобиле и при работе с PDF

Все нововведения уже начали поэтапно становиться доступными пользователям по всему миру. Как обычно, распространение происходит постепенно, поэтому некоторые функции могут появиться не сразу после установки последней версии приложения.

24.07 / 19:06

бизнес связь общество В России число подключений к публичному WiFi выросло в 3,5 раза за полгода

В России продолжает расти популярность WiFi в общественных местах на фоне проблем с мобильным интернетом. В первом полугодии 2026 года по сравнению с первым полугодием 2025-го количество подключений в публичных городских интернет-сетях увеличилось в 3,5 раза, до 4,1 млрд сессий. К такому выводу пришли аналитики оператора публичного WiFi Hot-WiFi, проанализировав динамику подключений пользователей в центральных районах Москвы. Тенденцию подтвердили крупные провайдеры: «Ростелеком», «Билайн» и «Транстелеком».

24.07 / 19:02

люди недвижимость здоровье семья tiktok «Отрыжка дома»: простая привычка для свежего воздуха в квартире

Эксперты рекомендуют открывать окна на 10–15 минут каждый день для борьбы с аллергенами и плесенью.

24.07 / 18:34

бизнес люди экономика общество самит Как строится первый в мире небоскреб высотой более километра

В Саудовской Аравии активно продолжается строительство первого в мире километрового небоскреба Jeddah Tower, который уже достиг 106 этажа.

24.07 / 18:10

продукты экономика недвижимость общество техника 11 привычек, которые избавят от генеральной уборки

Автор делится простыми ежедневными привычками, которые помогают держать дом в чистоте и откладывать генеральную уборку без лишнего стресса и затрат времени.

Лента новостей

На главную страницу