Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса
Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.
Nova Sonic — это ответ Amazon на новые голосовые модели ИИ, такие как модель, лежащая в основе голосового режима ChatGPT. В отличие от более ранних версий Amazon Alexa, Nova Sonic обеспечивает более естественное общение.
Nova Sonic доступна через Bedrock, платформу Amazon для разработчиков корпоративных приложений на основе ИИ, с помощью нового двунаправленного потокового API. В пресс-релизе Amazon назвала Nova Sonic «самой экономичной» голосовой моделью ИИ на рынке, которая примерно на 80% дешевле, чем GPT-4o от OpenAI.
По словам старшего вице-президента Amazon и главного научного сотрудника AGI Рохита Прасада, компоненты Nova Sonic уже используются в Alexa+, обновлённом цифровом голосовом помощнике Amazon.
В интервью TechCrunch Прасад рассказал, что Nova Sonic опирается на опыт Amazon в «крупных системах управления» — технических платформах, на которых работает Alexa. По словам Прасада, по сравнению с конкурирующими голосовыми моделями ИИ Nova Sonic лучше справляется с маршрутизацией пользовательских запросов к различным API. Эта возможность помогает Nova Sonic «знать», когда ей нужно получать информацию из интернета в режиме реального времени, анализировать собственный источник данных или выполнять действия во внешнем приложении — и использовать для этого подходящий инструмент.
Во время двустороннего диалога Nova Sonic начинает говорить «в подходящий момент», учитывая
Читать на habr.com