Об этом же в других СМИ

habr.com / 10 месяцев назад

Google запустила Stax: инструмент для честной оценки языковых моделей

habr.com / 10 месяцев назад

PixVerse представила модель V5 для генерации видео

gagadget.com / 10 месяцев назад

Audi официально представила новый концепт спортивного купе и он почти готов превратиться в серийную модель

habr.com / 10 месяцев назад

Отстав от гонки ген-ИИ, IBM и AMD объединяют усилия для создания квантово-центричных суперкомпьютеров

habr.com / 10 месяцев назад

Фреймворк BeyondWeb (Datology AI) перестраивает веб-документы для лучшего обучения моделей

Больше по теме

14.08.2025 - 13:14 / habr.com

Instella Math: языковая модель AMD с поддержкой рассуждений

AMD представила Instella Math — языковую модель, ориентированную на решение задач, требующих сложных логических построений. Отмечается, что это первая модель, в которой применено обучение с подкреплением на основе длинных цепочек рассуждений, и при этом — целиком на графических процессорах AMD.

В основе проекта лежит Instella 3B Instruct, чьи возможности расширили многоэтапным циклом обучения: двумя стадиями контролируемой донастройки и тремя этапами обучения с подкреплением по методике VERL. Всё это выполнялось на ускорителях AMD Instinct MI300X.

Instella Math — первая языковая модель AMD для рассуждений, с объёмом 3 млрд параметров, обученная на кластере из 32 ускорителей AMD Instinct MI300X. Instella Math — полностью опенсорсная модель: открыты её архитектура, код обучения, веса и наборы данных. Базовая модель Instella 3B Instruct также выложена в открытом доступе, включая результаты донастройки для задач рассуждения.

Модель построена на программном стеке AMD ROCm и использует эффективные распределённые методы обучения, включая обучение с подкреплением, запущенное на четырёх узлах MI300X (по 8 GPU в каждом).

Наследуя архитектуру Instella 3B Instruct, Instella Math оптимизирована для многошагового логического анализа, решения математических задач и работы с цепочками рассуждений. Процесс обучения включает две стадии контролируемой донастройки и три этапа обучения с подкреплением по алгоритму GRPO.

Для Instella Math применили двухэтапную схему донастройки, чтобы постепенно развивать у Instella 3B Instruct способность к рассуждению. На первом этапе проводилась инструкционная донастройка с охватом математической тематики. На втором — модель обучали выдавать глубокий анализ и чётко структурированные логические шаги, необходимые

технологии Олимпиада общество AMD крипто dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Microsoft внедряет поддержку Model Context Protocol в Visual Studio habr.com / 10 месяцев назад

Когда ИИ слишком уж соглашается: Spiral-Bench разоблачает, какие модели склонны подпитывать бред habr.com / 10 месяцев назад

Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео habr.com / 10 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 02:46

люди здоровье Здоровье и красота лечение питание Какие крупы помогают "чистить" кровь от токсинов и вредных веществ

Какие каши нужно включить в рацион, чтобы укрепить здоровье и улучшить самочувствие.

17.07 / 01:24

продукты google Google переименовала NotebookLM в Gemini Notebook: что изменилось после ребрендинга

Google официально переименовала свой сервис для исследований и работы с документами NotebookLM в Gemini Notebook. Компания объясняет, что новое название должно объединить продукт с остальной экосистемой Gemini, хотя сервис и дальше будет функционировать как отдельное приложение.

17.07 / 01:24

история общество netflix стриминг Шоу бизнес Netflix выпустил первый сезон "Очень странных дел" в формате VHS: сериал можно посмотреть в стиле 80-х

Netflix представил специальную VHS-версию первого сезона сериала "Очень странные дела" (Stranger Things). Несмотря на окончание истории, стриминговый сервис сделал ставку на ностальгию и предложил зрителям просмотр в духе домашних видеокассет 1980-х годов.

17.07 / 01:20

технологии экономика ученые культура наука Как читать мысли растений – новый сенсор изменит фермерство

Американские инженеры создали уникальные нательные сенсоры для агрокультур. Новая технология способна предупредить фермеров о болезнях растений.

17.07 / 00:50

здоровье продукты питания общество самит правильное питание Вместо кофе — почему перед спортзалом нужно понюхать шоколад

Новое исследование показало, что вдыхание аромата горького шоколада помогает сделать тренировку эффективнее и одновременно снижает чувство голода.

17.07 / 00:39

продукты YouTube reddit google gemini Google интегрировала Canva, YouTube Music и Instacart в режим AI Mode в своём поисковом сервисе

Google объявила о новых возможностях режима AI Mode в своём поисковом сервисе. Теперь пользователи в США могут подключать к нему Canva, YouTube Music и Instacart, чтобы выполнять различные задачи с помощью ИИ через поиск. Интеграции начали внедрять на этой неделе.

16.07 / 23:19

связь люди здоровье общество самит Количество кофе, которое может продлить жизнь, назвали ученые

Ученые проанализировали данные почти 450 тысяч человек и определили оптимальную ежедневную норму кофе

16.07 / 23:17

продукты Amazon экспорт Nvidia самит Google открыла k8s-aibom — контроллер Kubernetes для инвентаризации ИИ-нагрузок

Google Cloud опубликовала исходный код k8s-aibom — контроллера Kubernetes, который обнаруживает запущенные в кластере ИИ-компоненты и автоматически формирует ведомости компонентов машинного обучения в формате CycloneDX 1.6 ML-BOM. Инструмент собирает данные из фактического состояния кластера, поэтому способен находить в том числе нагрузки, которые не были зарегистрированы во внутренних системах компании.

16.07 / 22:38

технологии экономика общество В последнее время многие современные ноутбуки стали выходить без HDMI-порта

Производители ноутбуков стали чаще исключать порты HDMI из-за желания уменьшить размеры лэптопа и расширения возможностей USB-C, пишет журнал SlashGear.

16.07 / 21:57

Sony Разработчикам эмулятора KytyPS5 удалось запустить GTA V, Quake II и другие трёхмерные игры

Разработчики эмулятора PlayStation 5 KytyPS5 выпустили обновление, в котором им впервые удалось запустить GTA V, QuakeII и другие трёхмерные игры. Проекты запускаются с разной производительностью, но разработчики считают, что сейчас важно добиться максимальной совместимости.

Лента новостей

На главную страницу