NVIDIA рассказала о своих успехах в синтезировании естественной человеческой речи силами ИИ
Искусственный интеллект сейчас позволяет воссоздавать голос виртуальных помощников в смартфонах и умных колонках, очень похожий на человеческую речь. Хотя всё ещё можно заметить различия между речью синтезированной и живой, которую мы слышим в повседневной беседе и в средствах массовой информации. Это связано с тем, что люди говорят со сложным ритмом, интонацией и тембром, которые ИИ сложно воспроизвести.
Однако благодаря работе NVIDIA различия постепенно стираются. Исследователи компании создают модели и инструменты для высококачественного управляемого синтеза речи, которые передают богатство человеческой речи без звуковых артефактов. Их последние проекты теперь демонстрируются на сессиях конференции Interspeech 2021, которая продлится
Читать на itc.ua


