Вышла Gemini 3 Flash: модель уровня Gemini 3 Pro доступна бесплатно
Google выпустил Gemini 3 Flash для разработчиков через API, Google AI Studio и Vertex AI и приложение Gemini AI. Модель показывает 90,4% на тесте GPQA Diamond против 91,9% у флагманской 3 Pro, но стоит $0,50 за миллион входных токенов вместо $2 и работает в три раза быстрее по данным Artificial Analysis. На Humanity's Last Exam разница 33,7% против 37,5%, то есть около 4 процентных пунктов. В веб-версии и мобильных приложениях Gemini модель доступна бесплатно в двух режимах: моментальном и thinking. Лимиты использования пока не раскрыты.
На SWE-bench Verified модель достигла 78%, что сопоставимо с Pro, но при троекратном превосходстве в скорости генерации. Google позиционирует 3 Flash как модель, которая превосходит предыдущую 2.5 Pro по большинству бенчмарков, оставаясь при этом значительно дешевле текущего флагмана. Даже с минимальным уровнем "мышления" 3 Flash часто обгоняет предыдущие версии с максимальным уровнем, отмечает компания.
Новая модель продолжает стратегию Flash-линейки — баланс между производительностью и эффективностью. Цена $0,50 и $3 за миллион входных и выходных токенов соответственно делает ее в четыре раза дешевле 3 Pro с тарифами $2 и $12. При этом доступны кэширование со скидкой 90% для повторяющихся запросов и Batch API с уменьшением стоимости на 50% для асинхронной обработки.
Первые пользователи уже внедряют модель. Платформа Astrocade использует 3 Flash для своего движка создания игр, генерируя полные игровые планы и исполняемый код из одного промпта. Компания Resemble AI применяет модель для анализа дипфейков в реальном времени, получив четырехкратное ускорение мультимодального анализа по сравнению с 2.5 Pro. Google также интегрировала 3 Flash в свою платформу Antigravity для агентной разработки
Читать на habr.com