Об этом же в других СМИ

habr.com / 10 месяцев назад

Nvidia и Carbon Robotics показали роботрактор для уничтожения сорняков

habr.com / 10 месяцев назад

Nvidia выпустила «мозг для робота» — суперкомпьютер Jetson AGX Thor стоимостью $3499

habr.com / 10 месяцев назад

Framework представила свой первый игровой модульный ноутбук с Nvidia RTX 5070

habr.com / 10 месяцев назад

Nvidia GB300: 288 ГБ, PCIe 6, 1400 Вт — тот случай, когда «ещё больше всего» действительно работает

habr.com / 10 месяцев назад

Комплект разработчика NVIDIA AGX Thor — серверная мощь в мире роботов

Больше по теме

13.08.2025 - 08:46 / habr.com

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

По мнению специалистов Nvidia, индустрия слишком увлеклась крупными языковыми моделями (LLM) для работы агентов — подходом, который, как они утверждают, экономически и экологически нежизнеспособен.

В недавней научной статье они предлагают пересмотреть стратегию: большинство агентов, уверены авторы, могут работать не хуже, если использовать компактные языковые модели (SLM), и призывают компании изменить подход.

В 2024 году рынок API LLM для агентных систем оценивался в 5,6 млрд $, но расходы на облачную инфраструктуру для их работы достигли 57 млрд $ — разрыв 10 к 1. «Эта операционная модель так глубоко вросла в индустрию, что стала фундаментом для масштабных капитальных ставок», — пишут исследователи.

SLM, которые в Nvidia определяют как модели с числом параметров менее 10 млрд, «по сути, обладают достаточной мощностью», «изначально лучше подходят для практического применения» и «неизбежно экономичнее» для большинства агентных задач.

Исследователи утверждают, что компактные модели нередко способны работать наравне с куда более массивными. Они приводят пример Phi 2 от Microsoft, которая, по их словам, сопоставима с LLM на 30 млрд параметров в задачах логики и программирования, но при этом работает в 15 раз быстрее. Модели Nemotron H от Nvidia — до 9 млрд параметров — демонстрируют аналогичную точность, что и LLM на 30 млрд параметров, при гораздо меньших затратах вычислительных ресурсов. В их перечень попали и Deepseek R1 Distill Qwen 7B, и RETRO от DeepMind, которые, по заявлению авторов, на ключевых задачах не уступают более крупным закрытым аналогам.

По расчётам Nvidia, арифметика явно играет в пользу SLM: запуск модели на 7 млрд параметров обходится в 10–30 раз дешевле, чем работа LLM на 70–175 млрд параметров, если

люди экономика Nvidia dmitrifriend Microsoft

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Конденсатор NVIDIA RTX 5090 взорвался и погнул радиатор без игровой нагрузки: "Это еще "захватывающий опыт", или уже "нейронный рендеринг?" itc.ua / 10 месяцев назад

NVIDIA увеличила выручку до $46,7 млрд во II квартале incrypted.com / 10 месяцев назад

Серверы Nvidia GB200 NVL72 пока не справляются с обучением передовых ИИ — SemiAnalysis habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 12:45

происшествия ЧП история общество космос ЧП на космодроме в Китае: молния поразила летящую ракету (ВИДЕО)

Специалисты подтвердили отсутствие повреждений на борту космического корабля. Электроника ракеты имеет надежную защиту от подобных природных явлений.

26.07 / 12:32

Huawei дети предприятия Freelander 8: Британский дух на китайских стероидах

Пока классические Land Rover пытаются найти свое место в электрическом будущем, совместное предприятие Chery-JLR решили не ждать милости от природы и представили Freelander 8. Это уже не тот «Фрил», которого мы помним по поездкам на дачу — теперь это огромный кроссовер с «гостиной аристократа» внутри и железом, которому позавидуют современные игровые ПК. Официальный релиз запланирован на август, но основные карты уже раскрыты.

26.07 / 12:16

технологии самит курс мода и стиль Lenovo представила игровую клавиатуру Legion R7 RT75 с магнитными переключателями и экраном

Стоимость Lenovo Legion R7 RT75 в Китае составляет 1 299 юаней, что по актуальному курсу соответствует примерно 8 000 гривен. Клавиатура уже поступила в продажу в двух цветах — Cloud Silver Grey и Storm Grey.

26.07 / 11:50

ученые животные наука общество дети и родители Наука выживания – почему животные бросают своих детенышей

В дикой природе отказ матери от потомства — это эволюционная стратегия, помогающая сохранить ресурсы и выжить наиболее сильным.

26.07 / 11:50

медицина люди здоровье общество самит Вредят ли вьетнамки стопам — неожиданный ответ врача

Вьетнамки не так опасны, как принято думать. При умеренном и постепенном использовании они могут даже укреплять мышцы стопы.

26.07 / 11:50

продукты технологии люди здоровье человек Зрение портится незаметно: какие продукты могут защитить глаза

Правильный рацион способен поддержать здоровье глаз, особенно у тех, кто ежедневно проводит много времени перед экранами.

26.07 / 11:49

технологии промышленность общество роботы Шоу бизнес Эта робособака преодолеет все: Unitree Super Athlete AS2-W быстро перемещается по любой поверхности, поднимает 150 кг и исполняет брейк-данс

Автором идеи и первым создателем робособак является Boston Dynamics, но китайская компания Unitree Robotics, которая уже поразила публику андроидами-танцорами и небольшим спортивным шоу, представила впечатляющее развитие концепции.

26.07 / 11:26

технологии санкции Telegram общество капитал Weekly: продвижение CLARITY Act, новые пошлины Трампа и некастодиальный кошелек в Telegram

Редакция Incrypted подготовила для вас новый выпуск еженедельного дайджеста о ключевых событиях в сферах Web3 и ИИ. В нем мы расскажем вам о продвижении законопроекта о структуре крипторынка в США (CLARITY), новых пошлинах администрации президента Дональда Трампа, анонсе некастодиального кошелька в Telegram и многом другом. Главные новости

26.07 / 11:26

экономика Apple политика финансирование дефицит Apple просит разрешение на чипы компании из Китая из «черного списка» США: демократы обвинили политику Трампа — FT

Администрация президента США Дональда Трампа может усилить дефицит памяти для электроники из-за пересмотра политики поддержки производства микрочипов, тогда как Apple просит разрешить закупку компонентов у китайской компании ChangXin Memory Technologies (CXMT). Об этом сообщает Financial Times. На этой неделе конгрессмен-демократ Ро Ханна направил письмо министру торговли США Говарду Лютнику, в котором обвинил администрацию Трампа в подрыве усилий по созданию собственного производства памяти в США. Он также попросил администрацию объяснить, разрешат ли американским компаниям закупать

26.07 / 11:25

бизнес общество политика ликвидация школы За полгода 2026 года появилось на 64% больше ИТ‑компаний, чем за 6 месяцев 2025 года

В первом полугодии 2026 года в России было создано 37 тысяч новых компаний и индивидуальных предпринимателей в IT‑сфере. Это на 64% больше, чем за аналогичный период 2025 года, когда было зарегистрировано 13,3 тысячи новых субъектов. Такие данные привела компания Rusprofile. Всего на конец июня в стране было зарегистрировано 273 тысяч субъектов бизнеса в сфере IT. Из них 68% приходится на индивидуальных предпринимателей, а 5 тысяч организаций находятся в процессе ликвидации, реорганизации или банкротства.

Лента новостей

На главную страницу