Об этом же в других СМИ

gagadget.com / 10 месяцев назад

Bose представила QuietComfort Ultra 2 — новое поколение легендарных премиум-наушников

gagadget.com / 10 месяцев назад

BMW представила серийный iX3 нового поколения — первую модель семейства Neue Klasse

gagadget.com / 10 месяцев назад

Новый успех Konami: в первый же день продаж Metal Gear Solid Δ: Snake Eater превысили 1 миллион копий

gagadget.com / 10 месяцев назад

Huawei выпустила новое поколение своих TWS-наушников FreeBuds 7i

habr.com / 10 месяцев назад

VK выложила в открытый доступ датасет для инженеров, развивающих рекомендательные системы

Больше по теме

19.08.2025 - 09:50 / habr.com

Датасет Granary от Nvidia: миллион часов речи для обучения нового поколения ИИ

Хотя сегодня кажется, что ИИ повсюду, на деле он уверенно работает лишь с частью из семи тысяч существующих языков, оставляя без внимания огромный пласт мировой аудитории. Nvidia решила устранить этот очевидный пробел — в первую очередь в Европе.

Компания представила мощный набор открытых инструментов, который позволит разработчикам создавать высококачественные системы распознавания и синтеза речи для 25 европейских языков. Среди них есть и крупные, широко используемые, но главное — сюда попали и забытые фаворитами больших технокорпораций языки вроде хорватского, эстонского и мальтийского.

Задача проста и амбициозна: дать возможность программистам создавать голосовые сервисы, которые для многих уже стали обыденностью, — от многоязычных чат‑ботов, действительно понимающих собеседника, до систем поддержки клиентов и переводчиков, работающих мгновенно.

Сердцем этой инициативы стала Granary — гигантская библиотека человеческой речи. В ней около миллиона часов аудиозаписей, тщательно отобранных, чтобы обучать ИИ тонкостям распознавания и перевода устной речи.

Чтобы извлечь максимум из этих данных, Nvidia предлагает две новые языковые AI‑модели:

Canary-1b‑v2 — крупная модель, созданная для высокой точности при сложной транскрипции и переводе;

Parakeet‑tdt-0.6b‑v3 — модель для молниеносных приложений, где важна прежде всего скорость.

Тем, кто хочет заглянуть под капот, пригодится научная статья о Granary, которую представят в этом месяце на конференции Interspeech в Нидерландах. А нетерпеливые разработчики могут уже сейчас скачать набор данных и обе модели на Hugging Face.

Но настоящее волшебство — в том, как эти данные были созданы. Общеизвестно: обучение ИИ требует невероятных объёмов данных, а их сбор обычно растягивается на месяцы,

продукты технологии экономика конференция Nvidia общество семья dmitrifriend Голландия

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Пользователям Anthropic предложили отказаться от использования данных чатов или поделиться ими для обучения ИИ habr.com / 10 месяцев назад

Лингвисты НИУ ВШЭ — Санкт-Петербург создали уникальный «эмоциональный словарь» для обучения ИИ habr.com / 10 месяцев назад

Apple запатентовала новое поколение MagSafe habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 01:47

ученые животные наука общество Знаменитости Главный миф об облике и жизни тираннозавра разрушили ученые

Палеонтологи полностью пересмотрели скорость взросления знаменитого тираннозавра. Выяснилось, что этот хищник рос почти до сорока лет.

19.07 / 00:48

продукты медицина продукты питания Здоровье и красота лекарства Дешевая зелень из магазина может спасти от тяжести в желудке

Исследования подтвердили, что обычная мята не просто украшает летние блюда, но и эффективно помогает пищеварению, снижает стресс и повышает тонус.

18.07 / 23:30

здоровье общество человек Здоровье и красота врачи Привычки, которые незаметно ускоряют старение организма, назвали врачи

Многие совершают эти ошибки ежедневно, не подозревая, что они постепенно приближают старость.

18.07 / 22:37

люди здоровье общество мозг возраст Какая привычка убережет от слабоумия людей в возрасте

Врачи уверяют, что есть простой способ существенно снизить риски болезни Альцгеймера.

18.07 / 22:17

технологии Apple Релиз инструмента для работы с MKV-файлами MKVToolNix 100.0

В июле 2026 года состоялся стабильный релиз инструмента для работы с MKV‑файлами MKVToolNix 100.0 под кодовым названием «Do Hot Girls Like Chords». Предыдущая версия проекта вышла в мае 2026 года.

18.07 / 22:17

технологии Apache крипто Вышло обновление FreeRDP 3.29 с 22 патчами безопасности

14 июля 2026 года состоялся выпуск открытого проекта FreeRDP 3.29. Это реализация протокола удалённого рабочего стола Microsoft (Remote Desktop Protocol — RDP), опубликованная на GitHub под лицензией Apache License 2.0. Исходный код проекта написан на С и С++. Разработка решения ведётся более 15 лет. Стабильная версия FreeRDP 3.20 вышла в декабре 2025 года.

18.07 / 22:03

Samsung технологии общество семья политика Samsung прекратила поддержку сразу четырех популярных смартфонов Galaxy: владельцам стоит задуматься об обновлении

Речь идет об официальной информации, опубликованной после обновления перечня поддерживаемых устройств Samsung. Компания выполнила ранее данное обещание, предоставляя обновления безопасности в течение четырех лет с момента выхода этих моделей на рынок.

18.07 / 21:26

технологии самит доллар Work Louder и OpenAI выпустили Codex Micro — макропад для управления AI-агентами в Codex

OpenAI совместно с компанией Work Louder выпустила Codex Micro — макропад, с помощью которого можно управлять AI-агентами в Codex. Устройство позволяет отслеживать состояние задач, запускать сценарии и регулировать глубину рассуждений модели с помощью физических кнопок, джойстика и поворотного энкодера.

18.07 / 20:55

технологии Дом и интерьер Boston Dynamics тестирует робота‑собаку Spot для доставки посылок на «последней миле»

Компания Boston Dynamics начала испытания робота‑собаки Spot в качестве помощника для курьеров в новом сценарии. Робота адаптируют для доставки небольших отправлений от автомобиля до двери клиента — этапа, который в логистике называют «последней милей».

18.07 / 20:44

технологии происшествия люди общество профессор Почему многие люди просыпаются в 2 часа ночи - ответ профессора

Стресс, смартфоны и постоянный поток информации могут заставлять мозг оставаться активным даже ночью.

Лента новостей

На главную страницу