
Cartesia привлекает $64 миллиона для развития голосового ИИ в режиме реального времени
Голосовой ИИ становится быстрее, умнее и естественнее. Cartesia, компания, специализирующаяся на голосовых технологиях на основе ИИ в реальном времени, привлекла 64 миллиона долларов в рамках раунда серии A, возглавляемого Kleiner Perkins. Это финансирование позволит ускорить исследования, расширить команду и усовершенствовать Sonic 2.
Sonic 2.0 предназначен для генерации сверхреалистичной речи с низкой задержкой, что делает его идеальным в создании творческого контента и общении в реальном времени.
Модель использует архитектуру с пространством состояний, что позволяет удвоить её размер по сравнению с предшественником, сохраняя при этом более высокую скорость и эффективность. Она обеспечивает задержку в 90 миллисекунд для полных моделей и ещё более быструю задержку в 40 миллисекунд в приложениях реального времени — показатели производительности, которые превосходят показатели конкурентов.
Помимо скорости, технология Cartesia отлично справляется с клонированием голоса, позволяя генерировать реалистичную речь, которая передаёт тонкие нюансы, акценты и тональные вариации. Это делает её особенно полезной в тех случаях, когда точность имеет решающее значение, например, при обслуживании клиентов, локализации контента и использовании специальных возможностей. Компания также представила Sonic Turbo — улучшенную версию, которая обеспечивает ещё более быстрый синтез.
Инфраструктура Cartesia создана для обеспечения надёжности на уровне предприятия и может похвастаться 99,9% времени безотказной работы и соответствием стандартам SOC-2 и HIPAA. Sonic API разработан для разработчиков и предлагает надёжную работу в режиме реального времени и возможности развёртывания на устройствах, что может сделать приложения для генерации голоса на
Читать на habr.com