



Google представила Gemini 3.5 Live Translate — новую аудиомодель для синхронного перевода без задержек и с сохранением интонаций и тембра голоса
Google объявила о выпуске Gemini 3.5 Live Translate — топовой аудиомодели, предназначенной для перевода речи в режиме близком к реальному времени.
Модель распознает более 70 языков и обеспечивает перевод без необходимости вручную настраивать параметры, что позволяет использовать более 2000 языковых комбинаций без затрат времени. В отличие от систем, работающих по принципу поочередных реплик (turn-by-turn), Gemini 3.5 Live переводит речь непрерывно во время потокового вещания, отставая от говорящего всего на несколько секунд. При этом сохраняются интонации, темп и высота голоса говорящего.
Модель стабильно работает в громких и неподготовленных условиях, справляясь с фоновым шумом и наложением голосов.
Google позаботилась о безопасности и вся аудиодорожка, генерируемая моделью, маркируется невидимыми водяными знаками SynthID для предотвращения дезинформации.
Для разработчиков: С 9 июня 2026 года доступна в режиме публичного превью (public preview) через Gemini Live API и Google AI Studio. Сторонние платформы (Agora, Fishjam, LiveKit, Pipecat и Vision Agents) уже внедряют эту технологию. Партнер Google — компания Grab — тестирует модель для общения водителей и пассажиров.
Для корпоративных клиентов (Google Meet): С июня 2026 года запускается закрытое превью (private preview) для отдельных бизнес-пользователей Google Workspace. Полноценное развертывание планируется позже в этом году. Лимит доступных языков расширится с 5 до более чем 70, исчезнет ограничение на перевод только с/на английский.
Для обычных пользователей (Google Translate): Начинается глобальное развертывание в приложении Google Translate на Android и iOS. При использовании функции Live translate с наушниками перевод транслируется с сохранением тона спикера.
Режим
Читать на gagadget.com