Google выпустила Gemma 4 2B/4B/26B/31B: открытые веса и 3-е место на Arena AI
Google DeepMind официально представила Gemma 4 – новое семейство открытых моделей, которые можно запускать на собственном оборудовании под лицензией Apache 2.0.
Релиз состоялся 2 апреля 2026 года, и в него вошли сразу четыре размера: две мощные модели для локального инференса (31B Dense и 26B MoE) и две модели для периферийных устройств (E4B и E2B). Все они, по заявлению компании, “сдвигают планку intelligence-per-parameter” – то есть выдают результат, сопоставимый с гораздо более крупными конкурентами, потребляя при этом меньше ресурсов.
Семейство построено на той же исследовательской и технологической базе, что и Gemini 3, но, в отличие от проприетарного флагмана, Gemma 4 создана для работы офлайн – начиная от Android-смартфонов и заканчивая рабочими станциями с одной видеокартой. Google отчиталась, что предыдущие поколения Gemma были скачаны более 400 миллионов раз, а сообщество создало свыше 100 тысяч вариантов моделей (так называемый Gemmaverse).
Что важно знать
31B Dense – максимальное качество. На данный момент эта модель занимает 3-е место в мире среди открытых моделей по версии Arena AI text leaderboard. Обходит конкурентов, которые в 20 раз больше неё по числу параметров. Немного уступает только закрытым гигантам.
26B MoE (Mixture of Experts) – скорость. При инференсе активируется только 3,8 млрд параметров, что даёт очень высокие токены в секунду. В том же рейтинге Arena AI модель находится на 6-й позиции.
E4B и E2B (Effective 4B / 2B) – для мобильных и IoT. Полностью мультимодальные, работают с текстом, видео, изображениями и аудио (последнее – только у edge-моделей). Поддерживают контекст до 128K токенов и оптимизированы для энергоэффективности – активируют лишь эффективные 2 или 4млрд параметров, чтобы не
Читать на habr.com