



Gemini 3.5 Live Translate: Google учит ИИ переводить с вашей интонацией
Google наконец пытается решить одну из самых давних проблем машинного перевода — эффект «железного голоса» и неудобные паузы в диалоге. Новая аудиомодель Gemini 3.5 Live Translate обещает приблизить нас к будущему, где языковой барьер исчезает без потери человеческой индивидуальности. Это не просто замена текста, а попытка передать эмоциональную окраску речи в реальном времени.
Главная особенность системы заключается в её переходе к потоковой обработке сигнала (speech-to-speech). В отличие от классических инструментов, которые терпеливо ждут, пока вы закончите предложение, чтобы начать перевод, Gemini 3.5 анализирует звук «на лету». Это позволяет сократить задержку до нескольких секунд, делая разговор живым, а не похожим на сеанс связи с Марсом. Модель автоматически распознаёт более 70 языков и, что самое важное, пытается копировать тембр, высоту голоса и темп говорящего.
Технология уже начала интегрироваться в ключевые продукты компании. В Google Translate функция Live Translate становится доступной для пользователей Android и iOS. При использовании наушников система создаёт иллюзию прямого общения, где вы слышите переведённую речь, которая звучит максимально похоже на оригинальный голос собеседника. Для тех, кто не любит гарнитуры, предусмотрен «режим прослушивания», который превращает смартфон в своего рода телефон-переводчик.
Корпоративный сектор также не остался в стороне. Google Meet планирует внедрить модель для синхронного перевода встреч. Это может стать спасением для международных команд, где уровень владения английским у всех разный, а контекст лекции или презентации терять не хочется. В настоящее время функция проходит закрытое тестирование среди бизнес-клиентов Google Workspace.
Google не держит разработку
Читать на gagadget.com