Об этом же в других СМИ

gagadget.com / 2 месяца назад

Все о здоровье без цифрового мусора: Google представила незаметный фитнес-трекер Fitbit Air без экрана и кнопок

gagadget.com / 2 месяца назад

Бюджетные смартфоны станут плавнее: Qualcomm представила новые чипы Snapdragon 4 Gen 5 и 6 Gen 5

gagadget.com / 2 месяца назад

Премиальная акустика в каждую комнату: Bose представила новую серию домашних динамиков Lifestyle Collection

habr.com / 2 месяца назад

Обновление умных устройств «Яндекса»: новая модель телевизора и раздел «Игромир» с облачным геймингом

gagadget.com / 2 месяца назад

Casio представила новую коллаборацию с The Mandalorian в стиле Star Wars

Больше по теме

20.04.2026 - 07:36 / habr.com

Gemini 3.1 Flash TTS: Google представила новую модель синтеза речи с управлением через текст

Google анонсировала новую модель синтеза речи — Gemini 3.1 Flash TTS. Основной акцент — на управляемости генерации и более естественном звучании. Модель уже доступна в превью для разработчиков и бизнеса через API и облачные сервисы.

В новой версии улучшили общее качество речи — модель звучит более естественно и вариативно по сравнению с предыдущими версиями. По данным бенчмарка Artificial Analysis, она получила высокий рейтинг по субъективной оценке слушателей.

При этом важнее не столько само качество, сколько контроль над генерацией. В модели появилась возможность задавать параметры речи прямо в тексте — без сложных конфигураций или отдельных настроек.

Ключевое нововведение — так называемые audio tags. Это текстовые инструкции, которые встраиваются прямо в исходный текст и позволяют управлять: тоном и интонацией, темпом речи, акцентом и манерой подачи.

Фактически это попытка сделать TTS ближе к сценарию: разработчик задаёт не просто текст, а «режиссуру» озвучки.

Дополнительно поддерживаются диалоги с несколькими голосами, настройка параметров для каждого «персонажа» и изменение стиля речи внутри одной реплики.

С учётом новых возможностей модель ориентирована на более сложные сценарии, чем классический TTS:

голосовые интерфейсы и ассистенты

генерация диалогов (например, для обучения или игр)

озвучка видео и контента

автоматизация колл-центров и IVR

За счёт управления через текст можно быстрее прототипировать голосовые сценарии без отдельной настройки аудио-пайплайна.

Модель поддерживает более 70 языков. Отдельно отмечается возможность контролировать акцент и стиль речи, что важно для локализации.

Это делает модель применимой не только для прототипов, но и для продакшн-сценариев с международной аудиторией.

На момент анонса

бизнес общество самит мода и стиль google gemini Vertex

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Как появились люди - ученые представили новую теорию cursorinfo.co.il / 2 месяца назад

Китайские бренды объединяются: OPPO создаст из OnePlus и realme новую структуру под единым управлением gagadget.com / 2 месяца назад

Google представила чипы TPU восьмого поколения habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 19:45

люди ученые общество самит психология Почему прошлое кажется лучше настоящего - ответ ученых

Особенности человеческой памяти заставляют многих воспринимать прошлое более счастливым, чем оно было на самом деле.

14.07 / 19:45

здоровье продукты питания общество семья Здоровье и красота Дешевле и полезнее лосося – ученые назвали неожиданный суперфуд

Врачи рекомендуют сочетать разные источники ценных жиров. Ореховая добавка не должна полностью вытеснять рыбу из меню.

14.07 / 19:44

Samsung технологии Xiaomi история жертва Xiaomi представила Redmi Note 17 и 17 Pro — производительность, память и камеры принесены в жертву доступности, но батареи впечатляют

На рынке бюджетных смартфонов появилось интересное, хотя и весьма компромиссное пополнение. Xiaomi официально представила Redmi Note 17 и Redmi Note 17 Pro, о которых в последние дни ходило множество слухов.

14.07 / 19:36

люди закон общество политика Советская электроника. Встреча основателей двух удивительных Музеев

Сегодня состоялась знаменательная встреча двух замечательных людей. Эти два человека живут в городе Чебоксары. Оба, практически в одно и то же время, основали два музея и ничего до февраля сего года не знали друг о друге.

14.07 / 19:36

общество рубль НДС авиакомпания «Аэрофлот» закупил 200 серверов Yadro для обновления ИТ-инфраструктуры

Компания «Аэрофлот» приобрела у производителя вычислительной техники и электроники Yadro, которая входит в «ИКС Холдинг», 200 серверов Yadro V240 G3. Информация о поставке опубликована на сайте вендора.

14.07 / 19:36

технологии общество самит Специалист по ИБ показал, что копию дверного ключа можно создать за 10 минут по фотографии, опубликованной в соцсетях

Специалист по кибербезопасности и этичный хакер Эван Оттингер показал, что копию дверного ключа можно быстро воссоздать по анализу фотографии, опубликованной в социальных сетях.

14.07 / 19:36

технологии закон Telegram общество политика Дуров: Евросоюз становится банановой республикой, Telegram не будет сканировать ваши личные сообщения

Павел Дуров сравнил Евросоюз с банановыми республиками из-за закона о слежке за публикациями пользователей в интернете и сетевых сервисах.

14.07 / 19:18

люди работа общество самит астрология Идеальные коллеги: какие знаки Зодиака лучше всего работают вместе

Совместимость важна не только в любви, но и работе, говорят астрологи.

14.07 / 19:18

люди здоровье общество модель Эксперт Стоит ли израильтянам повторять за Хейли Бибер – мнение дерматолога

Израильский дерматолог оценила популярные домашние рецепты красоты. Многие модные лайфхаки из интернета вредят здоровью кожи.

14.07 / 19:18

история общество курьез интересное дети и родители 843 языка в одной стране – разбор удивительного феномена

Ученые объясняют культурное богатство сложным горным рельефом местности. Изоляция общин помогла сберечь редкие наречия от вымирания.

Лента новостей

На главную страницу