Google выпускает новое семейство открытых моделей Gemma 3
Компания Google Deepmind представила Gemma 3 — новое поколение открытых моделей искусственного интеллекта, разработанных для обеспечения высокой производительности при относительно небольших размерах, что делает их пригодными для работы на отдельных графических процессорах или TPU.
Семейство Gemma 3 включает четыре модели с параметрами от 1 до 27 миллиардов. Несмотря на компактный размер, эти модели превосходят гораздо более крупные LLM, такие как Llama-405B и DeepSeek-V3, в первоначальных тестах, согласно Google Deepmind.
Модели могут обрабатывать более 140 языков, причем 35 не требуют дополнительного обучения. Они обрабатывают текст, изображения (кроме версии 1B) и короткие видео, используя контекстное окно на 128 000 токенов. Google утверждает, что их возможности вызова функций и структурированного вывода делают их хорошо подходящими для агентских задач.
Все модели прошли дистилляционное обучение, за которым последовало специализированное пост-обучение с использованием различных подходов к обучению с подкреплением. Эти методы специально нацелены на улучшение математики, функциональности чата, следования инструкциям и многоязычной коммуникации.
Впервые Google официально предлагает квантованные версии, которые снижают требования к памяти и вычислениям, сохраняя точность. Компания заявляет, что Gemma 3 будет воспроизводить меньше дословного текста, чем предыдущие версии, и избегать воспроизведения персональных данных. Проверить это вы можете перейдя на BotHub по ссылке и протестировав модель.
Специалисты по оценке в области чат-ботов дали Gemma 3-27B-IT оценку Эло 1338, поместив ее в десятку лучших моделей AI. Меньшая модель 4B работает на удивление хорошо, соответствуя возможностям большей Gemma 2-27B-IT. Версия 27B
Читать на habr.com