Об этом же в других СМИ

habr.com / 11 месяцев назад

Появилась новая опенсорсная модель FLUX.1-Krea-dev

gagadget.com / 11 месяцев назад

OpenAI представила новые модели ИИ, которые можно запускать прямо на своем компьютере

gagadget.com / 11 месяцев назад

Xiaomi разработала сверхбыструю модель распознавания голоса и сделала ее OpenSource

habr.com / 11 месяцев назад

VK заявила, что её новая ИИ-модель RuModernBERT ускоряет обработку длинных текстов

gagadget.com / 11 месяцев назад

Ждем God of War на Xbox? Новая вакансия Sony указала на расширение мультиплатформенной стратегии компании

Больше по теме

19.07.2025 - 11:33 / habr.com

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

Французская компания Mistral, специализирующаяся на искусственном интеллекте, представляет Voxtral — модель распознавания речи с открытым исходным кодом. Она обещает заменить проприетарные решения, предлагая при этом вдвое меньшую стоимость.

Модели Voxtral представлены в двух вариантах: 24B для производственных приложений и компактная модель 3B для локального и периферийного развёртывания. Обе модели поддерживают контекстное окно на 32 000 токенов, которое, по словам представителей Mistral, может обрабатывать аудиофайлы длительностью до 30 минут для расшифровки или до 40 минут для понимания.

В отличие от стандартных инструментов для расшифровки, Voxtral предоставляет возможность задавать вопросы и получать ответы, а также обобщать информацию без использования отдельных моделей распознавания речи и языковых моделей. Кроме того, пользователи могут использовать голосовые команды для непосредственного запуска серверных функций, автоматически преобразуя устные запросы в вызовы API.

Модели поддерживают автоматическое распознавание речи на английском, испанском, французском, португальском, хинди, немецком, голландском и итальянском языках, сохраняя при этом возможности понимания текста, заложенные в основу языковой модели Mistral Small 3.1.

Тесты Mistral показывают, что Voxtral Small превосходит ведущую модель с открытым исходным кодом Whisper large-v3, а также GPT-4o mini Transcribe и Gemini 2.5 Flash во всех протестированных задачах. В задачах на расшифровку коротких текстов на английском языке и в тесте Common Voice от Mozilla он, как сообщается, превосходит ElevenLabs Scribe — на данный момент одну из самых эффективных моделей.

В тесте на многоязычное распознавание речи FLEURS Voxtral Small якобы превосходит Whisper на всех

технологии экономика самит доллар крипто gemini mefdayy Франция

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новая утечка о внешнем виде Galaxy S25 FE - больше никаких ярких цветов, здесь все солидно gagadget.com / 11 месяцев назад

Землю всколыхнет новая магнитная буря? Когда она прогнозируется telegraf.com.ua / 11 месяцев назад

Новая технология защиты анодов удваивает ресурс аккумуляторов электрокаров itc.ua / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

10.07 / 22:07

технологии Apple история самит доллар iPhone Ultra может получить почти незаметный сгиб экрана: Apple выбирает между двумя технологиями

Согласно свежей утечке, компания намерена сделать складку на гибком дисплее практически незаметной. По словам инсайдера Fixed Focus Digital, по этому показателю iPhone Ultra сможет сравниться с одним из лучших складных смартфонов на рынке — Oppo Find N6.

10.07 / 20:41

продукты здоровье общество самит человек Продукты, которые помогают печени работать эффективнее, назвали врачи

Специалисты рассказали, какие продукты стоит чаще включать в рацион, чтобы поддерживать нормальную работу печени и снизить нагрузку на нее.

10.07 / 20:11

Samsung технологии политика доллар Раскрыты цены Samsung Galaxy Z Fold8 и Galaxy Z Fold8 Ultra для США

Если ранее инсайдеры раскрыли предполагаемые цены устройств для Европы и Южной Кореи, то теперь стали известны и ожидаемые американские цены на Galaxy Z Fold8 и Galaxy Z Fold8 Ultra.

10.07 / 19:46

технологии климат самит электроэнергия Эксперт Сколько на самом деле служат солнечные панели – экспертный разбор

Очистка солнечных панелей от пыли и загрязнений является ключевым условием, позволяющим замедлить естественную потерю производительности оборудования.

10.07 / 19:31

продукты продукты питания общество отдых человек Фрукты, которые помогают уснуть без лишних усилий, назвали врачи

Исследования показали, что некоторые фрукты способны сократить время засыпания и сделать ночной отдых более качественным.

10.07 / 19:31

люди музыка общество психология интересное Почему важно записывать свои мечты - лайфхак от психолога

Записывая мечты, вы можете легче трансформировать их в цели, определить приоритеты и поддерживать мотивацию.

10.07 / 19:23

продукты продукты питания общество отдых человек Фрукты помогают уснуть без лишних усилий, назвали врачи

10.07 / 19:08

продукты технологии закон google OpenAI закрывает браузер ChatGPT Atlas: его функции перейдут в новое приложение ChatGPT

OpenAI представила браузер ChatGPT Atlas для macOS в октябре 2025 года. Он создавался как браузер, в центре которого находился ChatGPT. Однако вместо дальнейшего развития этого продукта компания решила перенести все его ключевые возможности в переработанное приложение ChatGPT для компьютеров.

10.07 / 19:07

здоровье общество Здоровье и красота возраст привычка От каких привычек важно избавиться до 50 лет, рассказали врачи

Чем раньше вы измените некоторые привычки, тем дольше будете оставаться молодым, говорят ученые.

10.07 / 18:46

общество возраст инфекция косметика Часть лица, которая стареет быстрее других, назвал дерматолог

Эксперты говорят, что стресс и другие факторы приводят к быстрому старению кожи, но с этим процессом можно бороться.

Лента новостей

На главную страницу