



Новая модель искусственного интеллекта Gemini от Google фокусируется на эффективности
Google выпускает новую модель искусственного интеллекта, разработанную для обеспечения высокой производительности с упором на эффективность.
Модель Gemini 2.5 Flash скоро будет запустили в Vertex AI, платформе разработки искусственного интеллекта от Google. Компания утверждает, что предлагает «динамические и управляемые» вычисления, позволяя разработчикам корректировать время обработки в зависимости от сложности запросов.
«[Вы можете] настроить скорость, точность и баланс затрат в соответствии с вашими конкретными потребностями», — пишет Google в сообщении в блоге, предоставленном TechCrunch. «Эта гибкость является ключом к оптимизации производительности флэш-памяти в высокообъемных, чувствительных к затратам приложениях».
Gemini 2.5 Flash появился в то время, когда стоимость флагманских моделей ИИ продолжает расти. Более дешевые, но высокопроизводительные модели, такие как 2.5 Flash, являются привлекательной альтернативой дорогим топовым вариантам за счет некоторой потери точности.
Gemini 2.5 Flash — это модель «рассуждения», похожая на o3-mini от OpenAI и R1 от DeepSeek. Это означает, что ей требуется немного больше времени, чтобы ответить на вопросы и подтвердить себя.
Google утверждает, что 2.5 Flash идеально подходит для приложений с «большим объемом данных» и «реального времени», таких как обслуживание клиентов и анализ документов.
«Эта рабочая лошадка оптимизирована специально для низкой задержки и низкой стоимости», — говорится в сообщении Google в блоге. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором».
Google не опубликовала отчет по безопасности или технический отчет для Gemini 2.5
Читать на hitechexpert.top