



Nvidia Vera Rubin и Groq: когда мало просто быть лидером, можно купить скорость
Дженсен Хуанг (Jensen Huang) снова доказал, что лучший способ победить конкурента — это выписать ему чек на такую сумму, от которой никто не откажется. Новая платформа Vera Rubin теперь не просто очередной ускоритель вычислений, а настоящий гибрид высоких технологий, где под одним капотом сошлись разработки Nvidia, Intel и Groq. Последний союз обошелся «зеленым» в 20 млрд долларов (860 млрд грн), что позволило получить не только лицензии, но и ключевых специалистов вместе с основателем Groq.
Основой нового подхода стал чип Groq 3 LPU (Language Processing Unit). Это узкоспециализированный языковой процессор, который не стремится быть мастером на все руки, а делает одно дело — вывод (inference) — с пугающей скоростью. Устройство содержит 98 млрд транзисторов, но имеет лишь 500 МБ памяти SRAM. На первый взгляд, это кажется шуткой на фоне гигабайтов в современных видеокартах, но дьявол кроется в деталях, а точнее — в пропускной способности.
Согласно официальным данным, пропускная способность SRAM в Groq 3 достигает 150 ТБ/с. Для сравнения: 288 ГБ современной памяти HBM4 в графических процессорах Rubin могут выдать лишь 22 ТБ/с. Это создает колоссальный разрыв в скорости обработки данных, что критично для крупных языковых моделей, где задержка на каждом токене определяет общую производительность системы.
Nvidia не ограничилась одиночными чипами. В рамках платформы создана отдельная стойка Groq 3 LPX, которая объединяет 256 процессоров. В такой конфигурации система предлагает 128 ГБ памяти SRAM с суммарной пропускной способностью 40 ПБ/с. Это решение позиционируется как мощный сопроцессор для GPU Rubin, который берет на себя декодирование на каждом уровне модели искусственного интеллекта.
Кроме языковых ускорителей, платформа
Читать на gagadget.com