Об этом же в других СМИ

habr.com / 1 год назад

Модели ИИ могут определять, когда их тестируют, и вести себя по-другому

habr.com / 1 год назад

Anthropic ограничивает доступ к моделям Claude 3.x из-за планов OpenAI приобрести Windsurf

habr.com / 1 год назад

Meta* запускает программу, призванную стимулировать стартапы к использованию моделей ИИ Llama

habr.com / 1 год назад

Новая модель ИИ от Anthropic переходит к шантажу, когда инженеры пытаются отключить её

habr.com / 1 год назад

Как модель ИИ Anthropic Claude Opus 4 выражает себя через эмодзи

Больше по теме

22.05.2025 - 08:18 / habr.com

Stability AI выпускает модель преобразования текста в звук, которая работает на мобильных устройствах

Stability AI и Arm выпустили компактную модель преобразования текста в звук, которая работает на смартфонах и способна генерировать стереофонические аудиоклипы продолжительностью до 11 секунд примерно за 7 секунд.

Модель под названием Stable Audio Open Small основана на методе, известном как «состязательный релятивистско-контрастный» (ARC), разработанном исследователями из Калифорнийского университета в Беркли и других учреждений. На высокопроизводительном оборудовании, таком как графический процессор Nvidia H100, она может воспроизводить стереозвук частотой 44 кГц всего за 75 миллисекунд — достаточно быстро для генерации практически в реальном времени.

Первоначальная версия Stable Audio Open была выпущена в прошлом году как бесплатная модель с открытым исходным кодом с 1,1 миллиарда параметров. В этой уменьшенной версии используется всего 341 миллион параметров, что значительно упрощает её использование на потребительском оборудовании. Stability AI и Arm впервые объявили о своём сотрудничестве в марте.

Чтобы модель работала на смартфонах, команда переработала архитектуру. Теперь система состоит из трёх компонентов: автокодировщика, который сжимает аудиоданные, встраиваемого модуля, который интерпретирует текстовые подсказки, и диффузионной модели, которая генерирует финальный звук.

Эта переработанная система не использует дистилляцию, но при этом сокращает использование памяти почти вдвое — с 6,5 ГБ до 3,6 ГБ. Такое сокращение позволяет впервые запустить модель на мобильных устройствах. Во время тестирования исследователи использовали Vivo X200 Pro — телефон на Android с 12 ГБ оперативной памяти и чипом Mediatek Dimensity 9400, выпущенным в конце 2024 года.

Stability AI сообщает, что модель особенно хорошо справляется с

технологии музыка Nvidia крипто mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Document AI от Mistral извлекает текст из документов и заметок с высокой точностью habr.com / 1 год назад

OpenAI обновляет модель искусственного интеллекта, на которой работает агент Operator habr.com / 1 год назад

Палата представителей США приняла законопроект, который запретит регулирование ИИ на 10 лет habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 03:37

технологии экономика Госдума Huawei закон Производители и дистрибьюторы бытовой техники выступили против расширенного толкования ИИ-технологий

Ассоциация РАТЭК (объединяет Huawei, DNS, Fplus, «М.Видео», «Ситилинк» и других) направила в ФАС письмо с критикой проекта поправок к закону об иностранных инвестициях (57-ФЗ). Проект, разработанный ФАС, предлагает отнести к стратегическим видам деятельности «деятельность, связанную с разработкой, созданием, внедрением, реализацией или оборотом технологий искусственного интеллекта». В ассоциации считают, что такая широкая формулировка создаёт системные риски для всего рынка бытовой и компьютерной техники, пишет «Ъ».

17.07 / 03:37

общество ЕГЭ телевидение интересное Шоу бизнес Филологи нашли слово-рекордсмен по числу значений

Государственный институт русского языка им. А. С. Пушкина назвал слово, имеющее наибольшее количество значений — это глагол «идти». В Большом универсальном словаре русского языка у этой лексемы зафиксировано 56 значений.

17.07 / 02:46

люди здоровье Здоровье и красота лечение питание Какие крупы помогают "чистить" кровь от токсинов и вредных веществ

Какие каши нужно включить в рацион, чтобы укрепить здоровье и улучшить самочувствие.

17.07 / 01:24

продукты google Google переименовала NotebookLM в Gemini Notebook: что изменилось после ребрендинга

Google официально переименовала свой сервис для исследований и работы с документами NotebookLM в Gemini Notebook. Компания объясняет, что новое название должно объединить продукт с остальной экосистемой Gemini, хотя сервис и дальше будет функционировать как отдельное приложение.

17.07 / 01:24

история общество netflix стриминг Шоу бизнес Netflix выпустил первый сезон "Очень странных дел" в формате VHS: сериал можно посмотреть в стиле 80-х

Netflix представил специальную VHS-версию первого сезона сериала "Очень странные дела" (Stranger Things). Несмотря на окончание истории, стриминговый сервис сделал ставку на ностальгию и предложил зрителям просмотр в духе домашних видеокассет 1980-х годов.

17.07 / 01:20

технологии экономика ученые культура наука Как читать мысли растений – новый сенсор изменит фермерство

Американские инженеры создали уникальные нательные сенсоры для агрокультур. Новая технология способна предупредить фермеров о болезнях растений.

17.07 / 00:50

здоровье продукты питания общество самит правильное питание Вместо кофе — почему перед спортзалом нужно понюхать шоколад

Новое исследование показало, что вдыхание аромата горького шоколада помогает сделать тренировку эффективнее и одновременно снижает чувство голода.

17.07 / 00:39

продукты YouTube reddit google gemini Google интегрировала Canva, YouTube Music и Instacart в режим AI Mode в своём поисковом сервисе

Google объявила о новых возможностях режима AI Mode в своём поисковом сервисе. Теперь пользователи в США могут подключать к нему Canva, YouTube Music и Instacart, чтобы выполнять различные задачи с помощью ИИ через поиск. Интеграции начали внедрять на этой неделе.

16.07 / 23:19

связь люди здоровье общество самит Количество кофе, которое может продлить жизнь, назвали ученые

Ученые проанализировали данные почти 450 тысяч человек и определили оптимальную ежедневную норму кофе

16.07 / 23:17

продукты Amazon экспорт Nvidia самит Google открыла k8s-aibom — контроллер Kubernetes для инвентаризации ИИ-нагрузок

Google Cloud опубликовала исходный код k8s-aibom — контроллера Kubernetes, который обнаруживает запущенные в кластере ИИ-компоненты и автоматически формирует ведомости компонентов машинного обучения в формате CycloneDX 1.6 ML-BOM. Инструмент собирает данные из фактического состояния кластера, поэтому способен находить в том числе нагрузки, которые не были зарегистрированы во внутренних системах компании.

Лента новостей

На главную страницу