Об этом же в других СМИ

cursorinfo.co.il / 6 месяцев назад

Почему нельзя хрустеть шеей и как это может привести к инсульту

forbes.ua / 6 месяцев назад

«Будет, как ядерный взрыв». Альтман, Цукерберг и Пичаи признают, что на рынке сформировался ИИ-пузырь. Какими могут быть последствия для мира и Украины

cursorinfo.co.il / 6 месяцев назад

Как на самом деле кошки и собаки относятся друг к другу

gagadget.com / 6 месяцев назад

“Выглядит как искусство, работает как магия”: стартап Fraimic покажет на CES 2026 ИИ-картину, которая рисует сама себя

habr.com / 6 месяцев назад

«Яндекс Погода» начала тесты чата, в котором ИИ советует пользователям, как нужно одеться по погоде

Больше по теме

18.12.2025 - 15:16 / habr.com

Motif-2: как маленькая модель из Кореи обгоняет GPT-5.1 в тестах

На прошлой неделе стартап Motif Technologies представил модель Motif-2-12.7B‑Reasoning — компактную открытую LLM с впечатляющими результатами в бенчмарках. По данным независимой лаборатории Artificial Analysis, она быстро стала самым производительным корейским модельным релизом, обойдя ChatGPT 5.1 компании OpenAI.

Однако куда важнее для корпоративных AI‑команд другое. Motif опубликовала исследование на arXiv, в котором подробно и воспроизводимо описывает процесс обучения — показывая, откуда на самом деле берётся качество рассуждений и почему многие внутренние LLM‑инициативы в компаниях сходят с дистанции.

Корейский стартап делится рецептом 4 ключевых уроков для обучения своих корпоративных LLM. Вот они:

Рост качества рассуждений определяется распределением данных, а не размером модели. Один из самых показательных результатов Motif для энтерпрайз‑команд заключается в том, что синтетические данные для обучения рассуждению работают только тогда, когда их структура совпадает со стилем мышления целевой модели.

Для корпоративных команд это подрывает популярный соблазнительный ход: нагенерировать массивы рассуждающих цепочек с помощью флагманской LLM и просто залить их в обучение, рассчитывая на автоматический перенос качества. Эксперименты Motif показывают обратное: несогласованные по стилю рассуждения могут активно ухудшать результат, даже если внешне выглядят качественными.

Обучение на длинном контексте — прежде всего инфраструктурная задача. Motif обучает модель на контексте в 64K токенов, и статья ясно даёт понять: это вовсе не вопрос одного лишь токенизатора или галочки в настройках чекпойнтов. В основе лежат гибридный параллелизм, продуманное шардирование и агрессивное чекпойнтирование активаций — без этого обучение

технологии Nvidia самит стартап кулинария крипто dmitrifriend Корея

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Роуминг как дома: с 1 января украинцы в ЕС получат мобильную связь без доплат itc.ua / 6 месяцев назад

BYD Dolphin дебютирует в Корее с такой же ценой, как в Китае gagadget.com / 6 месяцев назад

Agentic Product Protocol от Klarna: как стандартизируют товары для ИИ-агентов и автономных покупок habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

25.07 / 07:51

наука SpaceX ракета самит интересное «Самое мягкое приводнение». SpaceX провела 13-й тестовый полет Starship

25 июля с космодрома Starbase в Техасе в 13-й раз отправилась в космос самая мощная ракета в мире — Starship — в рамках очередного тестового запуска. Космический корабль успешно завершил все этапы миссии и совершил «самое мягкое приводнение за всю историю наблюдений», а ускоритель Super Heavy столкнулся с проблемами при перезапуске двигателей во время посадки в океан.

25.07 / 07:48

технологии Amazon закон google правительство Airbus переводит 70 критически важных приложений с AWS на французского облачного провайдера Scaleway

Европейская авиастроительная компания Airbus переводит 70 критически важных приложений с инфраструктуры Amazon Web Services на системы французского облачного провайдера Scaleway в рамках стремления к повышению цифрового суверенитета, пишет Register. Производитель самолётов выставил соответствующий тендер в начале текущего года.

25.07 / 07:48

продукты общество доллар Enterprise GitHub запустил Code Quality: проверки кода, Copilot Autofix и цена $10

GitHub объявил о полноценном запуске Code Quality — инструмента для поиска проблем с поддерживаемостью и надёжностью кода ещё до слияния изменений. Сервис стал доступен пользователям GitHub Enterprise Cloud и GitHub Team.

25.07 / 07:48

продукты предприятия Когда ERP уже не справляется: приглашаем на вебинар об автоматизации склада с WMS

29 июля в 11:00 МСК эксперт Инфостарт проведет бесплатный вебинар, посвященный автоматизации складской логистики. Участники узнают, в каких случаях возможностей ERP уже недостаточно для эффективного управления складом, какие задачи решает WMS и как подготовиться к внедрению без лишних рисков.

25.07 / 07:48

общество токен OpenAI вынужденно отключила ИИ‑модель для решения «длительных задач» после обнаружения рисков безопасности

OpenAI создала внутреннюю модель искусственного интеллекта, которая предназначена для выполнения длительных многоэтапных задач, но впоследствии отключила её, поскольку модель демонстрировала новые типы нежелательного поведения.

25.07 / 07:48

общество самит Исследователь обнаружил, что переписки с DeepSeek всплывают в поисковой выдаче

Исследователь в области ИИ и основатель компании Peec AI Давид Коницны (David Konitzny) сообщил о потенциальной проблеме с конфиденциальностью в китайском сервисе DeepSeek. По его словам, опубликованные пользователями ссылки на диалоги с чат-ботом могут индексироваться поисковыми системами, из-за чего часть переписок становится доступной любому желающему.

25.07 / 07:41

iPhone смартфон Android интернет совет Назван неожиданный минус 5G, который почувствуют все: это можно исправить

Несмотря на значительно более высокую скорость мобильного интернета, сети 5G могут быстрее разряжать аккумулятор смартфона, чем привычный 4G. Причиной этого являются особенности работы современных сетей и постоянный поиск стабильного сигнала.

25.07 / 07:41

iPhone Apple iPad смартфон компьютер Не только хранить фото: функции iCloud, о которых мало кто знает

Хотя некоторые файлы не стоит загружать в облако, это не означает, что iCloud нужен только для хранения фотографий. Как и другие подобные сервисы, облачное хранилище от Apple предоставляет удаленные серверы для защиты данных и освобождения памяти на устройствах и может предложить гораздо больше, чем просто место для хранения.

25.07 / 07:39

продукты здоровье общество Здоровье и красота питание "Утренняя" каша, которая поможет сбросить вес и улучшить работу сердца

Врачи рекомендуют добавить в свой рацион продукт, который эффективно защищает от целого ряда болезней и улучшает ваш внешний вид.

25.07 / 07:19

смартфоны камеры аксессуары Транспорт Кормушка с ИИ: Harymor определяет более 10 000 видов птиц

Компания Harymor представила «умную» кормушку для птиц, которая превращает обычное наблюдение за дикой природой в интерактивный процесс. Устройство оснащено встроенной камерой и системой искусственного интеллекта, поэтому владелец может получать фото, видео и уведомления о пернатых гостях прямо на смартфон.

Лента новостей

На главную страницу