Gemini 2.5 Flash-Lite — самая быстрая и экономичная модель в линейке Gemini от Google
Компания Google официально выпустила стабильные версии своих моделей Gemini 2.5 Flash и Pro, отметив их готовность к использованию после успешного этапа предварительного тестирования.
Обе модели уже показали высокие результаты в отраслевых тестах, и, согласно неофициальным данным, эти показатели сохраняются и при использовании в реальных условиях.
Наряду с этими релизами Google представляет новый вариант: Gemini 2.5 Flash-Lite. Компания описывает Flash-Lite как самую быструю и экономичную модель в линейке Gemini 2.5.
Теперь разработчики могут получить доступ к Flash-Lite в Google AI Studio и Vertex AI, а также к стабильным моделям Flash и Pro на этих платформах и в приложении Gemini. Google Search также использует собственные версии Flash и Flash-Lite.
По данным Google, Gemini 2.5 Flash-Lite превосходит своего предшественника (2.0 Flash-Lite) в тестах на программирование, математику, естественные науки, логическое мышление и мультимодальные задачи. В таких тестах, как GPQA (естественные науки), AIME (математика) и LiveCodeBench (генерация кода), Flash-Lite набирает значительно больше баллов, чем предыдущие модели Lite, и даже в некоторых областях сокращает разрыв с более крупными моделями.
Стоимость Flash-Lite одинакова как для стандартного режима, так и для режима «Мышление»: 0,10 доллара за миллион входных токенов и 0,40 доллара за миллион выходных токенов. Однако модели «Мышление» генерируют значительно больше токенов — так называемых логических цепочек — для улучшения результатов, а значит, их фактическая стоимость использования обычно выше.
По словам Google, Gemini 2.5 Flash-Lite особенно хорошо подходит для задач с большим объёмом данных и низкой задержкой, таких как перевод и классификация. Результаты тестов
Читать на habr.com