Об этом же в других СМИ

habr.com / 1 год назад

OpenAI и FDA обсуждают использование AI для оценки лекарственных препаратов

habr.com / 1 год назад

Anthropic запускает API для веб-поиска на базе AI

habr.com / 1 год назад

Microsoft объединяет силы с Google: новый протокол A2A для совместной работы AI-агентов

habr.com / 1 год назад

Apple и Anthropic объединяются для создания платформы кодирования AI

habr.com / 1 год назад

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*

Больше по теме

05.05.2025 - 13:03 / habr.com

Xiaomi представляет MiMo-7B — компактную модель для решения математических задач и задач по кодированию

С новой моделью MiMo-7B Xiaomi стремится продемонстрировать, что математические и программные задачи могут эффективно решаться относительно небольшими языковыми моделями. По словам компании, результаты должны соответствовать или даже превосходить результаты, достигнутые более крупными конкурентами.

В то время как многие современные модели рассуждений с открытым исходным кодом используют 32 миллиарда параметров, Xiaomi полагается на архитектуру из 7B параметров, стремясь максимизировать ее эффективность с помощью специально разработанных стратегий предварительного и последующего обучения.

Исследовательская группа сообщает, что MiMo-7B был предварительно обучен примерно на 25 триллионах токенов с целью раннего ознакомления модели с шаблонами рассуждений. Для поддержки этого были разработаны новые инструменты извлечения для математических формул и кода, охватывающие такие форматы, как HTML и PDF. Также использовался трехэтапный процесс смешивания данных, подчеркивающий синтетически сгенерированные задачи.

В ходе финальной фазы предварительной подготовки доля математических и кодовых данных была увеличена примерно до 70 процентов. Длина контекста была увеличена до 32 768 токенов, чтобы позволить модели обрабатывать более сложные, расширенные рассуждения.

Другим элементом процесса обучения является многотокенное прогнозирование (MTP), в котором модель пытается предвидеть несколько последующих токенов одновременно. Эта техника предназначена для повышения точности и ускорения вывода.

После предварительной подготовки две версии модели были дополнительно улучшены с использованием обучения с подкреплением (RL): MiMo-7B-RL-Zero была обучена непосредственно на основе базовой модели, в то время как MiMo-7B-RL была разработана на основе

связь Xiaomi крипто dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Сэм Альтман представляет мобильное устройство верификации habr.com / 1 год назад

Amazon запускает Nova Premier — свою самую мощную на сегодняшний день AI-модель habr.com / 1 год назад

JetBrains выпускает Mellum, открытую модель кодирования AI habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 01:22

люди ученые наука история общество Археологи обнаружили пещеру с доисторическими рисунками (ФОТО)

Международная группа исследователей совершила крупное открытие на востоке страны. На стенах скрытого грота ученые нашли около сотни древних фигур.

15.07 / 00:31

медицина люди общество лечение медики Война с прыщами: 5 ошибок, которые навсегда испортят вашу кожу

Специалист объяснила, почему попытки пересушить кожу агрессивными средствами приводят к обратному эффекту и вызывают тяжелые воспаления.

14.07 / 23:23

общество семья отдых человек врачи Привычки, которые незаметно разрушают сердце, назвали врачи

Обычные действия, которые многие считают безобидными, способны со временем серьезно навредить сердцу.

14.07 / 23:23

животные общество природа самит биологи Кашалоты общаются с помощью двух разных диалектов

Крупные морские биологи опубликовали отчет об акустических исследованиях в Европе. Ученые выявили четкие различия в сигналах млекопитающих.

14.07 / 22:14

технологии Apple прогноз журналист предприятия Поставщики Apple завершили подготовку к производству iPhone 20

В новой публикации инсайдер сообщил, что для юбилейной модели Apple выбрала концепцию «возвращения к стеклу». По его словам, качество изготовления устройства должно соответствовать уровню первого поколения iPhone Air.

14.07 / 22:06

продукты медицина люди здоровье общество Почему эксперты просят избегать солнцезащитных спреев

Эксперты выяснили, что популярные аэрозоли могут вредить здоровью. Узнайте, какие три опасных компонента не должны быть указаны на упаковке вашей косметики.

14.07 / 21:13

происшествия люди общество самит животный мир Живут в каждом доме: действительно ли пауки-сенокосцы смертельно ядовиты

Пауки-сенокосцы встречаются по всему миру, населяя разнообразные среды и в частности жилища людей. Они имеют длинные, тонкие лапки, благодаря которым они кажутся намного больше, чем есть на самом деле. Однако с их ядом не все так просто.

14.07 / 19:45

люди ученые общество самит психология Почему прошлое кажется лучше настоящего - ответ ученых

Особенности человеческой памяти заставляют многих воспринимать прошлое более счастливым, чем оно было на самом деле.

14.07 / 19:45

здоровье продукты питания общество семья Здоровье и красота Дешевле и полезнее лосося – ученые назвали неожиданный суперфуд

Врачи рекомендуют сочетать разные источники ценных жиров. Ореховая добавка не должна полностью вытеснять рыбу из меню.

14.07 / 19:44

Samsung технологии Xiaomi история жертва Xiaomi представила Redmi Note 17 и 17 Pro — производительность, память и камеры принесены в жертву доступности, но батареи впечатляют

На рынке бюджетных смартфонов появилось интересное, хотя и весьма компромиссное пополнение. Xiaomi официально представила Redmi Note 17 и Redmi Note 17 Pro, о которых в последние дни ходило множество слухов.

Лента новостей

На главную страницу