Об этом же в других СМИ

habr.com / 8 месяцев назад

Jamba Reasoning 3B: новая компактная ИИ-модель от AI21, работающая прямо на устройствах

habr.com / 8 месяцев назад

В Meta* запустили игровую активность с бонусами для сотрудников в рамках развития умений по использованию ИИ

habr.com / 8 месяцев назад

Восход Bare Metal Cloud? Новые инструменты для управления IT-инфраструктурой

habr.com / 8 месяцев назад

Selectel запускает сервис для внедрения AI-моделей в бизнес

habr.com / 9 месяцев назад

К2Тех назвал четыре тренда рынка ИТ-инфраструктуры: от вендорозамещения к творческому подходу

Больше по теме

22.09.2025 - 13:32 / habr.com

Тренд на компактные модели: Meta* запускает семейство моделей рассуждений MobileLLM-R1 для ПК и мобильных устройств

Долгое время мощь ИИ-моделей напрямую связывалась с их размером: число параметров росло до сотен миллиардов и даже триллионов. Но слишком большие модели создают очевидные проблемы для компаний: отсутствие контроля над системой, зависимость от сторонних облаков и непредсказуемые расходы.

На фоне этого набирает обороты противоположный тренд — малые языковые модели (SLM), которые можно запускать прямо на ПК и смартфонах.

Последний и самый яркий пример — Meta* MobileLLM-R1, семейство моделей с менее чем миллиардом параметров, специализирующихся на решении задач с рассуждениями. Их появление подтверждает общий поворот индустрии от принципа «больше значит лучше» к ставке на компактные и эффективные модели.

MobileLLM-R1 от Meta* — это семейство reasoning-моделей с размерами 140M, 360M и 950M параметров, специально предназначенных для математики, программирования и научных задач (они не подходят для общих чат-приложений).

Эффективность достигается за счет архитектурных решений, заложенных ещё в оригинальной линейке MobileLLM, оптимизированной для моделей до 1 млрд параметров. Например, используется архитектура deep-and-thin (глубже слоев при меньших эмбеддингах) и прием grouped-query attention (разделяемые веса внимания для сокращения числа параметров). В сочетании с очень эффективным процессом обучения это позволяет запускать сложные вычисления даже на ограниченных устройствах.

Для обучения использовалось около 5 трлн токенов (для сравнения: у других моделей сопоставимого размера — десятки триллионов), включая дистиллированные данные из Llama-3.1-8B-Instruct, что позволило перенести развитые способности к рассуждению без гигантских затрат на обучение.

Модель на 950M параметров немного превосходит Alibaba Qwen3-0.6B на бенчмарке MATH

бизнес продукты технологии общество самит крипто

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новый фитнес-тренд, который обещает сжигать жир без спортзала и тяжелых упражнений cursorinfo.co.il / 9 месяцев назад

Тренд среди ритейлеров. Rozetka – четвертая торговая сеть, запустившая собственные платежные карты. Как компания может заработать на этом forbes.ua / 9 месяцев назад

В App Store вышли гонки для мобильных устройств с управлением через AirPods habr.com / 9 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

08.07 / 12:11

1С под прицелом: как защитить критически важную систему бизнеса

14 июля состоится вебинар, на котором эксперты УЦСБ и «Газинформсервис» расскажут, как защитить 1С от наиболее распространенных угроз, снизить риски компрометации системы и подготовиться к требованиям Распоряжения Правительства РФ № 360-р.

08.07 / 12:11

общество Alibaba запрещает сотрудникам использовать Claude Code

Китайская Alibaba запрещает сотрудникам использовать инструмент для написания программного кода на базе искусственного интеллекта Claude Code от Anthropic, пишет Reuters. Ранее ИИ-инструмент привлёк внимание из-за функций, которые способны помочь идентифицировать пользователей, связанных с Китаем. Запрет начнёт действовать с 10 июля 2026 года.

08.07 / 12:07

связь происшествия Telegram политика google Anthropic убрала скрытое отслеживание в Claude Code

Компания Anthropic убрала скрытый механизм отслеживания из инструмента Claude Code после того, как в июне исследователи по кибербезопасности обнаружили невидимые маркеры для идентификации отдельных пользователей. Об этом говорится в материале Decrypt. Компания заявила, что система была экспериментом для борьбы со злоупотреблениями аккаунтами и дистилляцией ИИ-моделей, однако инцидент снова обострил дискуссию о прозрачности работы передовых моделей и защите интеллектуальной собственности в сфере искусственного интеллекта. Скрытые маркеры для выявлен

08.07 / 12:04

музыка общество семья журналист деревня Тридцать минут геймплея The Blood of Dawnwalker — журналисты показали начало новой игры от ветеранов CD Projekt RED

Польская студия Rebel Wolves, основанная ветеранами CD Projekt RED, завершает работу над амбициозной ролевой игрой The Blood of Dawnwalker. Команда предоставила журналистам VGC возможность ознакомиться со своим дебютным проектом и записать 30-минутный геймплейный ролик.

08.07 / 12:04

технологии Apple мода и стиль Новое приложение для Vision Pro позволяет во всех деталях рассмотреть четыре суперкара Lamborghini

У редких владельцев AR-гарнитуры Vision Pro появился достойный повод смахнуть с нее пыль. Для этого устройства вышло приложение Automobili Lamborghini, которое позволит ощутить себя владельцем шикарного спорткара и рассмотреть все его элементы в натуральную величину.

08.07 / 11:42

общество финансирование капитал инвестор google SEC подготовит первые обязательные правила для крипторынка в июле

Комиссия по ценным бумагам и биржам США (SEC) уже в этом месяце может представить проект нового регулирования крипторынка, которое предусматривает временные исключения из требований по регистрации для криптопроектов, упрощение привлечения капитала и создание «безопасной гавани» для отдельных эмитентов цифровых активов. Об этом свидетельствует обновленная регуляторная повестка дня SEC. Инициатива станет первым масштабным криптоспецифическим правилом при председательстве Пола Аткинса и может существенно изменить условия работы криптостартапов в США. SEC готовит первое масштабное крипторегулирование Согласно обновленному п

08.07 / 11:42

налоги политика банк криптовалюта валюта Reuters: Центробанк Индии выступает за запрет криптовалют

Центральный банк Индии (RBI) вновь заявил о необходимости разработки политики в отношении криптовалют, которая «склоняется к запрету», тогда как налоговое ведомство страны предупредило о сложностях с отслеживанием торговли через офшорные биржи. Об этом свидетельствуют правительственные документы, с которыми ознакомилось агентство Reuters. Криптовалюты в Индии находятся в «серой зоне» с 2018 года, когда суд отменил решения RBI, которые фактически запрещали их. Законопроект о запрете частных криптовалют, составленный в 2021 году, так и не был внесен в парламент, а рассмотрение дискуссионного документа по этому вопросу неоднократно откладывалось. Несмотря на это, в стране насчитывается почти 39 миллионов криптотрейдеров, которые по состоянию на конец мая в

08.07 / 11:41

продукты люди Amazon Amazon прекратит принимать новых клиентов на платформу Mechanical Turk

Amazon не будет принимать новых клиентов на платформу Mechanical Turk c 30 июля 2026 года. Её функциональность сохранится, но обновления внедряться не будут.

08.07 / 11:41

самит reddit Покупатели Steam Machine пожаловались на «красную полоску смерти»

Первые покупатели новой Steam Machine рассказали о появлении Red Line of Death (RLOD, «красной полоски смерти». Этот баг сигнализирует об аппаратном сбоев в работе консоли.

08.07 / 11:41

технологии культура закон история общество В честь 250-летия США создали капсулу времени с iPhone 17 Pro Max, фото от НАСА и предсказанием от Claude

В честь 250-летия США инициатива America250 создала капсулу времени с iPhone 17 Pro Max, фото от НАСА и предсказанием чат-бота Claude. Цилиндр из нержавеющей стали весом 400 кг установили в землю 4 июля недалеко от места подписания Декларации независимости США в Филадельфии. Законсервированное послание America’s Time Capsule планируют распечатать в 2276 году — в честь 500-летия Соединённых Штатов.

Лента новостей

На главную страницу