Podcastle запускает добавление более 450 голосов ИИ
Podcastle — платформа для записи и редактирования подкастов, присоединяется другие компании, участвующие в гонке по преобразованию текста в речь на основе искусственного интеллекта, выпустили собственную модель под названием Asyncflow v1.0. API Разработчики также смогут напрямую интегрировать модель преобразования текста в речь в свои приложения.
Благодаря новой модели компания может предложить более 450 голосов искусственного интеллекта, которые могут читать ваш текст. Стартап заявил, что разработал технологию и модель таким образом, что затраты на обучение и вывод низкие, что дает ему преимущество перед конкурентами.
С этим шагом Podcastle присоединяется к ряду стартапов, включая ElevenLabs, Speechify и WellSaid, которые разработали технологию и модели ИИ для превращения любого типа текста в озвученный ИИ голосовой клип. Эта технология охватывает такие области использования, как маркетинг, реклама, создание контента, образование и корпоративное обучение.
Основатель Podcastle Арто Ерицян рассказал TechCrunch, что компания всегда хотела создать модель преобразования текста в речь, но затраты на обучение и требования к данным были очень высокими.
«Мы хотели создать надежную модель преобразования текста в речь с момента нашего основания. Однако затраты на разработку были очень высокими. Благодаря недавним крупным разработкам в области речевых моделей мы смогли добиться прорыва в прошлом году и достичь точки, где мы могли построить высококачественную голосовую модель без необходимости в большом количестве данных», — сказал Ерициан.
В прошлом году компании также удалось привлечь 13.5 млн долларов в рамках финансирования серии А.
Ерицян говорит, что в то время как Podcastle взимает около 40 долларов за 500 минут
Читать на hitechexpert.top