Об этом же в других СМИ

habr.com / 1 год назад

Проект бессерверной БД FaunaDB объявил о закрытии и выпуске исходного кода своей основной технологии

habr.com / 1 год назад

G-Assist от Nvidia: от первоапрельской шутки до функционального ИИ-помощника

habr.com / 1 год назад

Otter представляет ИИ-помощников для оптимизации бизнес-коммуникаций

habr.com / 1 год назад

Улучшения в голосовом режиме ChatGPT: меньше прерываний, больше человечности

hitechexpert.top / 1 год назад

Голосовой помощник на основе искусственного интеллекта от OpenAI стал проще в использовании

Больше по теме

11.03.2025 - 07:36 / habr.com

Sesame AI демонстрирует впечатляющего голосового помощника с открытым исходным кодом

Sesame AI, калифорнийский стартап, использует нетрадиционный подход к голосовому ИИ, намеренно добавляя дефекты в свою речь. Их новая модель представляет собой первый шаг к более аутентичным диалогам и тому, что они называют «присутствием голоса» в системах ИИ.

Согласно результатам предварительного тестирования, наиболее впечатляющими особенностями Sesame являются такие тонкие элементы, как микропаузы, акценты и смех во время разговора. В одном из диалогов аватар Sesame Майя в режиме реального времени отреагировала на внезапный смех пользователя, продемонстрировав эмоциональную осведомлённость.

Система намеренно имитирует человеческое поведение, например, исправляет себя в середине предложения и извиняется за перерывы в речи. Techradar особо отметил эти намеренные несовершенства, подчеркнув, что они отличаются от отполированного корпоративного стиля ChatGPT или Gemini.

В смоделированных сценариях, таких как обсуждение стресса на работе или планирование вечеринки, система предлагала контекстуально подходящие ответы и вопросы, а не использовала шаблонные фразы.

Система обрабатывает речь, используя семантические маркеры для лингвистических свойств и фонетики, а также акустические маркеры для таких характеристик звука, как высота тона и ударение. Для оптимизации обучения аудиодекодер обучается только на одной шестнадцатой части аудиокадров, в то время как семантическая обработка использует весь набор данных.

Модель обучалась на одном миллионе часов аудиоданных на английском языке за пять эпох. Она может обрабатывать последовательности из 2048 токенов (около двух минут аудио) в сквозной архитектуре. Этот подход отличается от традиционных систем преобразования текста в речь интегрированной обработкой текста и аудио.

В ходе слепых

люди Amazon финансирование стартап Apache крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Perplexity хочет купить TikTok и открыть исходный код его алгоритма habr.com / 1 год назад

AI QA Copilot: новый помощник для тестирования игр от Razer habr.com / 1 год назад

Pruna AI создает свой фреймворк оптимизации открытым исходным кодом habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

23.07 / 00:10

технологии Apple Apple готовит масштабное обновление линейки Mac: новые чипы, OLED и редизайн

Apple работает над обновлением почти всей линейки компьютеров Mac. Как сообщает Bloomberg, компания планирует выпустить новые модели с обновленными процессорами, увеличенным объемом оперативной памяти, а также постепенно внедрять OLED-дисплеи. Часть новинок может дебютировать уже этой осенью, а другие в 2027–2028 годах.

22.07 / 23:55

люди общество семья политика самит Семь вещей, которых избегают социально умные люди

Разговорная речь отражает внутреннюю зрелость, а избыток информации и спешка часто вредят репутации.

22.07 / 23:26

происшествия общество прогноз человек Земля Каким станет человечество через тысячу лет — ответ ученых

Новая модель показала, что судьба цивилизации может развиваться совсем не по привычному сценарию.

22.07 / 21:56

Samsung технологии общество евро самит Samsung представила Galaxy Z Flip 8 с увеличенным внешним экраном, новыми возможностями ИИ и обновленной конструкцией

Во время презентации компания сделала ставку не только на аппаратные улучшения, но и на программные возможности. Galaxy Z Flip 8 получил множество ИИ-функций, работающих непосредственно в оболочке One UI 9, а также расширенное взаимодействие с сервисами Google Gemini.

22.07 / 21:39

лайфхаки для бизнеса Предназначение и бизнес: где находится точка роста - Журнал "ФОКУС ВНИМАНИЯ"

Как связаны между собой задача духа и современный бизнес? Задача духа — это то предназначение, которое человек должен реализовать на Земле.

22.07 / 21:03

технологии деньги общество рубль электромобиль Опубликован обзор первого электромобиля КАМА «Атом», выданного частному владельцу

Блогер и популяризатор российской микроэлектроники Максим Горшенин выпустил обзор первого электромобиля КАМА «Атом», выданного частному владельцу.

22.07 / 19:49

связь экономика дефицит ФАС предложила изменить правила возврата железнодорожных билетов

Федеральная антимонопольная служба разработала проект приказа, который позволит перевозчикам самостоятельно устанавливать размер сбора за возврат неиспользованных железнодорожных билетов — до 10% от их стоимости. По мнению ведомства, эта мера поможет сократить число возвратов и увеличить доступность билетов для пассажиров.

22.07 / 19:49

связь технологии закон Chevrolet расследование Полиция Техаса потратила $4,5 млн на четыре Chevrolet Tahoe

Отдел уголовных расследований Департамента общественной безопасности Техаса (DPS) закупил систему видеонаблюдения Cognyte на борту четырёх внедорожников Chevrolet Tahoe. Транспорт и всё оборудование обошлись почти в $4,5 млн.

22.07 / 19:31

политика выплаты правительство Через чат‑бот «Госуслуг» можно будет узнать о доступных мерах социальной поддержки

Правительство России утвердило постановление, которое позволит гражданам запрашивать сведения о мерах социальной поддержки через чат‑бот на портале «Госуслуг». Документ внесло Министерство труда и социальной защиты России.

22.07 / 19:22

Apple СМИ политика Роскомнадзор: ведомство не ограничивает доступ к AppStore

20 июля 2026 года в Роскомнадзоре заявили СМИ, что ведомство не ограничивает доступ к сервису Apple — магазину приложений AppStore.

Лента новостей

На главную страницу