Об этом же в других СМИ

habr.com / 1 год назад

Google добавляет собственную генерацию изображений в языковые модели Gemini

habr.com / 1 год назад

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

habr.com / 1 год назад

Alarmo от Nintendo использует технологию, которая может решить проблему дрейфа джойстика Joy-Con

habr.com / 1 год назад

Foxconn запустила собственную большую языковую модель

cursorinfo.co.il / 1 год назад

Не ешьте это: самая опасная часть курицы, которая может испортить здоровье

Больше по теме

27.02.2025 - 12:17 / habr.com

Huginn: языковая модель, которая может углублять свои мыслительные процессы

Исследовательская группа из Института ELLIS в Тюбингене, Университета Мэриленда и Ливерморской национальной лаборатории имени Лоуренса разработала языковую модель под названием «Huginn», которая может углублять свои мыслительные процессы с помощью рекурсивной архитектуры.

В отличие от обычных моделей логического мышления, таких как o3-mini от OpenAI, которые генерируют цепочки рассуждений с помощью логических токенов, Huginn не требует специального обучения и рассуждает в скрытом пространстве своей нейронной сети, прежде чем выдать результат.

Модель была обучена на суперкомпьютере Frontier с использованием 4096 графических процессоров AMD MI250X — это один из крупнейших обучающих прогонов, когда-либо проводившихся на кластере AMD. Концепция обучения была новой, но в основе своей простой: в отличие от типичных языковых моделей, Huginn обучался с переменным количеством вычислительных итераций.

Для каждого прохода система случайным образом определяла, сколько раз нужно повторить центральный вычислительный блок — от одного до 64 раз. Специальное распределение этого случайного числа гарантировало, что, хотя модель в основном обучалась с меньшим количеством повторений, иногда она выполняла множество итераций.

Тестирование показывает, что модель особенно хорошо справляется с математическими задачами и задачами по программированию. В таких тестах, как GSM8k и MATH, она превосходит несколько протестированных моделей с открытым исходным кодом, у которых в два раза больше параметров и обучающих данных.

Исследователи задокументировали несколько новых возможностей: без специального обучения система может регулировать глубину вычислений в зависимости от сложности задачи и выстраивать цепочки рассуждений в своём скрытом пространстве.

Анализ,

AMD крипто mefdayy шт. Мэриленд

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

У Sony есть прототип ИИ версии Элой из Horizon, которая может разговаривать с человеком в реальном времени gagadget.com / 1 год назад

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях habr.com / 1 год назад

Приложение Google Find My Device получило новую функцию, которая поможет пользователям отслеживать своих близких gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

19.07 / 13:51

самит google gemini Google откладывает выпуск своей самой мощной ИИ-модели: что известно о причинах

Компания Google на несколько месяцев отстает от графика выпуска своей самой мощной флагманской модели искусственного интеллекта Gemini 3.5 Pro. Такая задержка произошла из-за того, что компания потратила время на улучшение своих возможностей, в частности в области кодирования.

19.07 / 13:46

экономика Nvidia стартап wsj инвестор Китайская модель Kimi K3 от Moonshot AI обвалила акции американских производителей чипов — WSJ

Запуск новой модели искусственного интеллекта Kimi K3 от китайского стартапа Moonshot AI на этой неделе спровоцировал распродажу акций американских технологических компаний, прежде всего производителей микрочипов. Инвесторы опасаются, что более дешевые китайские модели ИИ могут снизить спрос на дорогие вычислительные мощности, которые стали основой нынешнего бума на рынке, пишет WSJ. Китайский Moonshot представил Kimi K3: открытая ИИ-модель опередила Claude Fable 5 в программировании 18.07.2026 Читать По итогам торгов в пятницу, 17 июля, акции Nvidia, Micron Technology и других производителей микросхем оказались под давление

19.07 / 13:21

медицина ученые здоровье отдых мозг Формула долголетия – как правильно применить правило "8-8-8"

Разделение суток на три равные части помогает снизить уровень стресса, нормализовать гормональный фон и защитить организм от опасных хронических болезней.

19.07 / 13:21

связь технологии ученые общество космос Почему человечество до сих пор не нашло инопланетян - ответ ученых

Поиски разумной жизни продолжаются десятилетиями, однако ученые допускают, что проблема может быть совсем не в инопланетянах.

19.07 / 12:43

технологии экономика авиация общество пилот Британское аэротакси Vertical Aerospace Valo готовится к публичному дебюту в Фарнборо

Пока скептики продолжают рисовать мрачные картины будущего, где мы все застряли в бесконечных пробках, британская компания Vertical Aerospace решила, что время наконец показать что-то реальное. Их электрический летательный аппарат с вертикальным взлетом и посадкой (eVTOL) под названием Valo готовится к своему первому публичному выступлению. Это не очередной рендер для привлечения инвестиций, а полноценный прототип, который поднимется в воздух на международном авиасалоне в Фарнборо (Farnborough International Airshow).

19.07 / 12:30

Apple Lego может выпустить конструктор в виде iMac G3

Lego объявила, что рассматривает идею выпуска конструктора со старой моделью ПК модели iMac G3. Её предложили фанаты на сайте Lego Ideas.

19.07 / 12:21

технологии музыка история общество курс Nubia представила необычного ИИ-питомца iMoochi: робот умеет распознавать эмоции и становится «привязанным» к владельцу

Компания Nubia официально представила в Китае нового робота-компаньона iMoochi, который заметно отличается от привычных умных колонок и голосовых помощников. Новинка делает ставку не на выполнение команд, а на эмоциональное взаимодействие с человеком. Устройство оснащено искусственным интеллектом, способным анализировать настроение собеседника, запоминать владельца и постепенно формировать индивидуальную модель общения.

19.07 / 12:15

люди журналист Xbox Game Pass В XBOX зреет заговор против Game Pass: компания может отказаться от добавления в сервис флагманских игр в день их релиза

Среди сотрудников и руководства XBOX зреет все больше недовольства по поводу подписки Game Pass, а некоторые даже считают ее главной проблемой не только компании, но и всей игровой индустрии — таким инсайдом поделился журналист Bloomberg Джейсон Шрайер (Jason Schreier) в свежем выпуске подкаста Triple Click.

19.07 / 12:15

Huawei закон Qualcomm предприятия электромобиль Freelander 8: британское имя, китайская начинка и экран на всё лобовое стекло

Пока глобальный офис Jaguar Land Rover пытается разобраться со своим будущим, их совместное предприятие с Chery в Китае решило не терять времени. Они взяли хорошо знакомое имя Freelander, стряхнули с него пыль и превратили в самостоятельный бренд. Первенец этой коллаборации — кроссовер Freelander 8 — уже начал появляться в китайских автосалонах, хотя официальные продажи стартуют лишь во второй половине 2026 года.

19.07 / 12:11

связь технологии смартфон интернет общество Включенный ночью Wi-Fi может незаметно влиять на смартфон - эксперты

Эксперты объяснили, в каких случаях ночное подключение к Wi-Fi может оказаться не лучшим решением.

Лента новостей

На главную страницу