Об этом же в других СМИ

delo.ua / 2 года назад

Microsoft выпустила компактную модель ШИ Phi-3 Mini для смартфонов

habr.com / 2 года назад

Microsoft поможет Estée Lauder разрабатывать новые продукты при помощи искусственного интеллекта

habr.com / 2 года назад

Microsoft представила Infra Copilot, который использует GitHub Copilot для генерации инфраструктурного кода

gagadget.com / 2 года назад

Новый шаг к покорению Азии: Microsoft открывает новый центр обработки данных в Таиланде

habr.com / 2 года назад

В Google Meet зашифрованные звонки стали доступны для пользователей без аккаунта

Больше по теме

17.04.2024 - 09:26 / habr.com

Universal-1 от AssemblyAI превзошел Whisper от OpenAI: новый лидер в гонке решений для распознавания речи

Почти год Whisper от OpenAI удерживал лидерство среди открытых решений для распознавания речи, но теперь пальму первенства среди API сервисов перехватила новая модель Universal-1 от AssemblyAI. Обученная на более чем 12,5 миллионах часов многоязычных аудиоданных, Universal-1 превосходит предыдущего лидера - Whisper от OpenAI, а также другие коммерческие решения по ключевым параметрам.

В основе Universal-1 лежит архитектура Conformer RNN-T с 600 миллионами параметров. Энкодер модели состоит из стека сверточных слоев для 4-кратного субдискретизации, позиционного кодирования и 24 слоев Conformer, использующих chunk-wise attention с размером чанка 8 секунд. Это обеспечивает не только устойчивость к вариациям длительности аудио, но и ускоряет обработку за счет ограничения вычислений внимания внутри каждого чанка. Декодер RNN-T использует двухслойный LSTM предиктор и джойнер для генерации выходных токенов.

Процесс обучения Universal-1 состоял из двух этапов: предобучения энкодера на немаркированных аудиоданных с помощью алгоритма BEST-RQ и дообучения полной модели RNN-T на маркированных данных. Для предобучения использовался оптимизатор AdamW с линейно убывающей скоростью обучения, а дообучение проводилось с различными скоростями обучения для энкодера и декодера. Использование микса из транскрибированных человеком и псевдомаркированных данных позволило добиться высокой акустической и лингвистической устойчивости модели.

Результаты тестирования показывают, что Universal-1 превосходит аналоги по точности распознавания речи на 10% и более для английского, испанского и немецкого языков, а также генерирует на 30% меньше некорректных вставок слов на обычной речи и на 90% - на фоновых шумах. Universal-1 демонстрирует WER на уровне 7.3%

Amazon общество google крипто Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Meta* открыла ОС для VR-устройств сторонним производителям и выпустит ограниченную серию Quest VR вместе с Microsoft habr.com / 2 года назад

Bloomberg: Apple хочет привлечь OpenAI и Google для внедрения ИИ-сервиса в iOS incrypted.com / 2 года назад

Для Windows представлен Vulkan-видеодрайвер с открытым исходным кодом проекта Terakan для видеокарт серии Radeon HD 6000 habr.com / 2 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 04:55

технологии происшествия смартфон Эксперт Как продлить жизнь аккумулятору смартфона – три совета

Хотя большинство производителей заявляют о ресурсе в 1000 циклов зарядки, реальный срок службы аккумулятора напрямую зависит от условий эксплуатации.

15.07 / 04:55

происшествия недвижимость ограбление квартира Роковая ошибка владельцев жилья, которая привлекает грабителей

Американский аналитик успешно протестировал опасный метод взлома на собственной двери. Напечатанный из пластика прототип сработал с первой попытки.

15.07 / 04:31

животные МИД природа пляж мозг Жизнь на морской воде: существо, которому не нужен мозг

У этих удивительных существ полностью отсутствуют мозг и кровеносная система. Все жизненные процессы у них поддерживает обычная морская вода.

15.07 / 03:57

технологии общество Опубликовано полное видео полёта ракеты CZ-10B (Long March 10B) и возврата первой ступени на морскую платформу

Опубликовано полное видео полёта китайской ракеты‑носителя CZ-10B (Long March 10B — «Великий Поход 10Б») от старта до посадки, включая возврат первой ступени на морскую платформу с помощью технологии улавливания «сетевой захват».

15.07 / 03:17

общество рубль В России запускают производство печатных плат для принтеров

В России начнётся производство печатных плат для принтеров. К осени 2026 года контрактный производитель электроники «Цифровые телевизионные системы» (ЦТС, входит в GS Group) поставит 50 тысяч российских высоковольтных плат и плат питания для производителя печатной техники «Катюша». Это будет первая партия после запуска производства. Об этом сообщило издание «Ведомости» со ссылкой на коммерческого директора ЦТС Егора Макеева и управляющего директора ГК «Катюша» Дмитрия Владимирова.

15.07 / 03:17

общество крипто токен Релиз пакетного менеджера NPM 12.0, в новой версии по умолчанию прекращён запуск скриптов во время установки пакетов

8 июля 2026 года состоялся выпуск пакетного менеджера NPM 12.0. Это решение входит в поставку Node.js и применяется для распространения модулей на языке JavaScript. Новая версия проекта примечательна прекращением по умолчанию запуска скриптов во время установки пакетов. Это изменение должно усложнить проведение атак через компрометацию зависимостей и замедлить распространение червей, активируемых из установочных скриптов.

15.07 / 02:27

продукты здоровье Здоровье и красота питание кулинария Ужин, который остановит старение, назвали эксперты

Полезный ужин может быть еще и очень вкусным, говорят специалисты и рассказывают, что нужно есть для молодости и хорошего самочувствия.

15.07 / 01:22

люди ученые наука история общество Археологи обнаружили пещеру с доисторическими рисунками (ФОТО)

Международная группа исследователей совершила крупное открытие на востоке страны. На стенах скрытого грота ученые нашли около сотни древних фигур.

15.07 / 00:31

медицина люди общество лечение медики Война с прыщами: 5 ошибок, которые навсегда испортят вашу кожу

Специалист объяснила, почему попытки пересушить кожу агрессивными средствами приводят к обратному эффекту и вызывают тяжелые воспаления.

14.07 / 23:23

общество семья отдых человек врачи Привычки, которые незаметно разрушают сердце, назвали врачи

Обычные действия, которые многие считают безобидными, способны со временем серьезно навредить сердцу.

Лента новостей

На главную страницу