Об этом же в других СМИ

habr.com / 11 месяцев назад

Baidu до конца месяца выпустит новую ризонинг-модель

habr.com / 11 месяцев назад

В Китае создали нейроморфный компьютер, имитирующий мозг обезьяны

habr.com / 11 месяцев назад

Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

habr.com / 11 месяцев назад

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

habr.com / 11 месяцев назад

Cohere выпустила новую мультимодальную модель Command A Vision

Больше по теме

29.07.2025 - 07:25 / habr.com

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Hierarchical Reasoning Model, (HRM) — рекуррентная архитектура, которая черпает вдохновение в принципах работы человеческого мозга.

В ее основе лежат 2 взаимозависимых рекуррентных модуля:

Первый, высокоуровневый модуль (H-модуль), отвечает за медленное, абстрактное планирование, подобно тета-волнам в мозге.

Второй, низкоуровневый модуль (L-модуль), занимается быстрыми и детализированными вычислениями, аналогично гамма-волнам.

Эта структура дает модели достигать вычислительной глубины, необходимой для сложных рассуждений, при этом сохраняя стабильность и эффективность во время обучения, чего так не хватает стандартным трансформерам.

Процесс кардинально отличается от того, что происходит в обычных рекуррентных сетях, которые склонны к преждевременной сходимости, когда их скрытое состояние быстро стабилизируется, и дальнейшие вычисления практически прекращаются. В HRM все иначе:

Сначала быстрый L-модуль выполняет серию итераций, находя локальное равновесие для текущего шага задачи. Его итоговое состояние передается медленному H-модулю.

H-модуль, в свою очередь, осмысливает полученный результат, выполняет один шаг собственного, более абстрактного обновления и задает совершенно новый контекст для L-модуля.

Таким образом, вычислительный путь низкоуровневого модуля перезапускается, направляя его к новой точке локального равновесия. Механизм не дает системе застрять и позволяет ей последовательно выполнять множество различных, но взаимосвязанных этапов решения, выстраивая длинные логические цепочки.

Тестовая модель HRM с 27 млн. параметров, обученная всего на 1000 примерах без какого-либо претрейна или CoT-пар, показала неожиданно высокие результаты. На задачах, требующих глубокого поиска и перебора вариантов (Sudoku-Extreme) и поиск

технологии общество мозг Apache крипто Extreme mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Nvidia представит на SIGGRAPH 2025 ИИ-модель Queen для создания 3D-видео habr.com / 11 месяцев назад

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии habr.com / 11 месяцев назад

Horizon Alpha: загадочная модель, которую уже считают «младшим GPT-5» habr.com / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 14:53

продукты здоровье общество питание кулинария Когда солить разные виды мяса, чтобы оно не стало сухим

Время добавления соли кардинально влияет на сочность и текстуру мяса, говорят специалисты.

16.07 / 14:53

продукты здоровье продукты питания общество самит Действительно ли морская соль полезнее каменной, рассказали эксперты

Морская соль содержит минералы, но их количество слишком мало, чтобы существенно влиять на здоровье.

16.07 / 14:53

технологии ученые самит человек мозг Привычку, которая каждый день незаметно истощает мозг, назвали ученые

Ученые выяснили, что мозг может истощаться даже после полноценного сна и без серьезных физических или умственных нагрузок.

16.07 / 14:38

технологии происшествия Tesla расследование google Хакеры похитили почти $24 млн из DeFi-протокола Ostium через манипуляцию ценовым оракулом

DeFi-протокол Ostium подвергся масштабному взлому, в результате которого из публичного пула ликвидности OLP было похищено около $23,75 млн. По данным исследователей, после атаки злоумышленник обменял все похищенные 23,75 млн USDC на 12 084 ETH по средней цене около $1966 за монету. Впоследствии большую часть Ethereum перевели в криптомиксер Tornado Cash, чтобы скрыть происхождение средств. Отметим, Ostium — это платформа для синтетических деривативов, где пользователи могут открывать позиции на акции таких компаний, как Tesla, Nvidia или Meta. Хакер воспользовался уязвимостью ценового оракула По информации исследовательс

16.07 / 14:38

связь экономика самит эфир google Антон Буков заявил об увольнении из 1inch и анонсировал новый проект

Сооснователь 1inch Антон Буков рассказал, что в конце ноября 2025 года был уволен из компании. Он сохранил статус сооснователя и 50% акций, но полностью отстранен от операционной деятельности — в том числе от продуктовой архитектуры и безопасности протокола. Параллельно Буков анонсировал новый проект — Second Tier. Буков напомнил, что стал сооснователем 1inch в мае 2019 года и его роль всегда была технической: он вел архитектуру протокола, безопасность и экономический дизайн — от первого DEX-агрегатора 1inch Router до обновления Fusion, кроссчейн-свопов и готовящегося Shared Liquidity AMM. По его словам, обратная связь от пользователей и коллег за последний год дала понять, что он «больше не может оставаться в стороне от управленческой и операционной части компании».

16.07 / 14:27

Уязвимости в компоненте календаря событий DPCalendar

12 июля 2026 года команда Digital Peak получила сообщение о серьезной уязвимости в компоненте календаря событий DPCalendar, которая может привести к несанкционированному доступу к данным, хранящимся в базе данных Joomla.

16.07 / 14:27

технологии Xiaomi общество самит дефицит «Известия»: эксперты прогнозируют дефицит бюджетных смартфонов в России

Из-за роста цен на комплектующие ассортимент смартфонов в российских магазинах может сократиться уже в этом году. В результате заметно вырастет рынок б/у устройств, считают эксперты издания «Известия».

16.07 / 14:27

люди LinkedIn общество reddit Исследование: более 40% длинных постов на LinkedIn сгенерированы ИИ

ИИ-тексты всё заметнее заполняют соцсети, особенно LinkedIn и X. По данным аналитиков платформы Pangram, около 25% публикаций в соцсетях длиннее 250 слов сгенерированы искусственным интеллектом.

16.07 / 14:27

Путешествия общество Психология и отношения «ГигаЧат» научился распознавать эмоции, различать спикеров и находить нужные моменты в длинных аудио

Пользователям ИИ‑помощника «ГигаЧат» стала доступна обновлённая нейросеть GigaChat Audio — большая языковая модель, которая способна обрабатывать аудиофайлы и голосовые сообщения без предварительного преобразования речи в текст. Искусственный интеллект научился понимать интонацию пользователя и получил расширенные возможности по обработке звуковой информации, рассказали Хабру в пресс‑службе компании.

16.07 / 14:27

Samsung люди здоровье закон законодательство Samsung удалит медицинские данные пользователей, если они не разрешат использовать эту информацию для обучения ИИ

Samsung начала уведомлять пользователей Samsung Health о том, что им необходимо дать согласие на использование их личных медицинских данных для обучения новых моделей искусственного интеллекта. В противном случае владельцы рискуют потерять эти данные навсегда.

Лента новостей

На главную страницу