Об этом же в других СМИ

habr.com / 6 месяцев назад

xAI запустила Grok Collections API для создания RAG-приложений

habr.com / 6 месяцев назад

Коллективный иск писателей против OpenAI, Google, xAI и других за обучение ИИ на пиратских библиотеках

habr.com / 6 месяцев назад

Jeff Dean объяснил, почему Google начал разрабатывать специализированные AI‑чипы

habr.com / 6 месяцев назад

Anthropic и Google набирают долю на рынке LLM API, OpenAI теряет позиции в корпоративном сегменте

habr.com / 6 месяцев назад

xAI открывает Grok Voice Agent API с задержкой ответа менее секунды

Больше по теме

16.12.2025 - 08:35 / habr.com

Google добавил генерацию речи в Gemini API

Google официально расширил функциональность своего Gemini API, добавив полноценную генерацию речи на основе искусственного интеллекта. Теперь разработчики могут превращать текстовые ответы моделей Gemini в реалистичный голос, который звучит естественно и близко к человеческой речи. Это важное обновление, потому что раньше такие возможности требовали подключения отдельных TTS‑сервисов или внешних библиотек. С новым API разработчики получают готовый голосовой интерфейс, который можно использовать прямо в своих приложениях, сервисах и устройствах.

Новая система синтеза речи поддерживает множество языков и акцентов. Это позволяет создавать голосовые интерфейсы не только на английском, но и на других международных языках. В настройках можно выбирать параметры озвучивания, такие как стиль голоса, тембр, скорость и выразительность, чтобы адаптировать звучание под конкретные задачи. Например, голосовой помощник для навигации может звучать энергично и ясно, а образовательное приложение может использовать более спокойный и мягкий голос для объяснений.

Работа с генерацией звука осуществляется через стандартные REST‑вызовы к Gemini API. Разработчик передаёт текст и параметры желаемого голоса, а сервис возвращает готовый аудиофайл. Это значительно упрощает интеграцию, поскольку нет необходимости вручную настраивать аудио‑движки или конвертировать форматы. Полученный звуковой файл можно сразу воспроизводить пользователю в веб‑ или мобильном приложении, умном устройстве или любой платформе с поддержкой аудио.

Google в документации отмечает, что синтез речи ориентирован на понятность и естественное звучание, но при работе с очень специфическими терминами или узкоспециальной лексикой возможны ошибки в произношении. Для таких случаев

продукты технологии люди мода и стиль google cognitronn

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Google выпускает T5Gemma 2 — мультимодальная модель с поддержкой длинного контекста habr.com / 6 месяцев назад

Google Labs запускает экспериментального ИИ‑ассистента CC для автоматизации повседневных задач habr.com / 6 месяцев назад

Google интегрирует инструмент Vibe Coding Opal прямо в экосистему Gemini habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 08:30

продукты продукты питания семья Здоровье и красота еда Обгоняя малину: семь продуктов с рекордным уровнем клетчатки

Нутрициологи составили перечень доступных продуктов с максимальным содержанием нутриентов. Эти компоненты необходимы для нормализации веса.

14.07 / 08:26

погода люди здоровье наука общество Жара не отступает. В США — температурные рекорды, в Европе — тысячи погибших

По данным метеорологической службы США, на этой неделе на всей территории государства будет побито более 90 температурных рекордов, и большинство из них станут рекордами именно в контексте ночной жары. Эксперты в области здравоохранения утверждают, что высокие ночные температуры особенно опасны, поскольку у организма нет времени на восстановление после дневной жары.

14.07 / 08:15

люди общество самит психология психика Что значит привычка мыть чашку сразу – ответ психологов

Эксперты рассказали, как бытовые привычки помогают справляться с признаками депрессии. Вымытая кружка становится маркером работоспособности.

14.07 / 08:15

iPhone технологии Apple смартфон самит Революция от Apple – каким будет юбилейный iPhone 20

Юбилейный iPhone 20 обещает стать самым смелым смартфоном Apple благодаря полностью стеклянному корпусу и инновационному OLED-экрану.

14.07 / 07:57

экспорт общество жертва Microsoft отключит Outlook Web Access Light в будущем обновлении Exchange Server

Microsoft объявила о планах отключить Outlook Web Access (OWA) Light — облегчённую версию почтового клиента Outlook Web App — в одном из будущих обновлений Exchange Server.

14.07 / 07:38

общество Релиз Rust 1.97.0

9 июля 2026 года состоялся релиз языка программирования Rust 1.97. Вклад в разработку этого обновления внесли 277 программистов со всего мира. Предыдущая стабильная версия решения состоялась в апреле 2026 года. Версия проекта Rust 1.80 вышла в июле 2024 года. Релиз Rust 1.85.0 (Rust 2024) состоялся 20 февраля. Выпуск Rust 1.87.0 и празднование десяти лет после выхода Rust 1.0 произошло в мае 2025 года.

14.07 / 07:38

Apple google Broadcom Google запустила LiteRT.js для ускорения обработки задач ИИ в браузере

Google выпустила LiteRT.js — новую библиотеку, позволяющую запускать модели машинного обучения локально в веб-браузере, минуя необходимость обработки на стороне сервера.

14.07 / 07:38

технологии общество google Обновлён открытый кроссплатформенный проект AltSendme 0.5.0 для конфиденциальной одноранговой передачи файлов

Вышло обновление AltSendme 0.5.0 открытого минималистичного кроссплатформенного приложения под названием AltSendme, разработанного для быстрой, безопасной и конфиденциальной одноранговой передачи файлов (веб-версия доступна на app.altsendme.com). Исходный код инструмента написан на TypeScript и Rust и опубликован на GitHub под лицензией GNU Affero General Public License v3.0.

14.07 / 07:34

Компьютеры смартфоны аксессуары Транспорт Thunderobot Zero Air 16: тонкий игровой ноутбук с мощной начинкой

Компания Thunderobot представила на выставке BW2026 игровой ноутбук Zero Air 16 Racing Edition.

14.07 / 07:24

технологии Telegram google Раскрыт новый цвет Google Pixel 11 Pro Fold: свежая утечка показала складной флагман

Изображение опубликовал источник под псевдонимом Mystic Leaks в Telegram, показав устройство в новом цвете Pine. Кроме новой расцветки, рендер подтверждает изменения в дизайне камеры, о которых ранее уже сообщали инсайдеры.

Лента новостей

На главную страницу