Об этом же в других СМИ

habr.com / 1 год назад

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

habr.com / 1 год назад

Возможное ограничение использования новой языковой модели OpenAI GPT-4.5 через API

habr.com / 1 год назад

OpenAI представляет GPT-4.5: новый рубеж в эволюции языковых моделей

habr.com / 1 год назад

Huginn: языковая модель, которая может углублять свои мыслительные процессы

habr.com / 1 год назад

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Больше по теме

14.02.2025 - 08:59 / habr.com

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

9 февраля на arXiv была опубликована новая научная работа "LM2: Large Memory Models", в которой исследователи описали обновление классической архитектуры LLM на базе трансформеров. LM2 превосходит как модель RMT с дополненной памятью на 37.1%, так и базовую модель Llama-3.2 на 86,3% в среднем по задачам.

Исследователи из Convergence Labs представили Large Memory Model (LM2) – новую архитектуру языковых моделей, которая преодолевает ограничения традиционных трансформеров в обработке длинного контекста.

LM2 дополняет стандартный механизм внимания отдельным модулем памяти, который взаимодействует с входными данными, отбирает важную информацию и обновляется по мере работы модели.

Ключевое отличие LM2 – дополнительный поток памяти, который дополняет стандартный поток внимания в трансформерах. Этот механизм включает:

Кросс-аттеншен между модулем памяти и входными данными.

Гейты управления (запись, забывание и извлечение данных), позволяющие динамически обновлять хранимую информацию.

Разделение процессов обработки и хранения информации, что делает модель устойчивой к длинным контекстам.

Модель тестировалась на двух ключевых наборах данных:

BABILong – сложный бенчмарк для многоступенчатых рассуждений. LM2 показала прирост точности на 37,1% по сравнению с предыдущими архитектурами с улучшенной памятью.

MMLU – тест на общие знания. LM2 улучшила результаты на 5%, демонстрируя, что модуль памяти не мешает базовой работоспособности модели на универсальных задачах.

LM2 – очередной шаг вперед в развитии ИИ. Сейчас большое количество инвестиций идёт как раз в новые архитектуры - многие ожидают, что следующие грандиозные прорывы будут следствие не просто масштабирования (увеличения кол-ва параметров), а именно смены самой архитектурной парадигмы в

бизнес экономика закон общество самит интересное

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

«Темпоральные головы» в языковых моделях: новые возможности для AI habr.com / 1 год назад

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях habr.com / 1 год назад

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 13:15

здоровье дети общество google Дом и интерьер Исследование: функции искусственного интеллекта Google могут представлять «неприемлемый риск» для детей

Речь идет не об утечке или слухах, а о результатах независимого исследования, опубликованного Common Sense Media. Организация изучила работу AI Mode и AI Overview — двух функций искусственного интеллекта, которые Google активно внедряет в свой поисковик. Авторы отчета утверждают, что эти инструменты способны не только мешать учебному процессу, но и некорректно реагировать на запросы, связанные с психическим здоровьем несовершеннолетних.

16.07 / 13:05

технологии санкции общество политика самит Эксперты: санкции ЕС против VK и Max ударят по международному сотрудничеству, а не по работе сервисов

Евросоюз ввёл санкции против холдинга VK (ему принадлежат соцсети «Вконтакте» и «Одноклассники»), разработчика национального мессенджера Max (ООО «Коммуникационная платформа», тоже принадлежит VK), а также генерального директора компании Елены Багудиной. Решение опубликовали в официальном журнале ЕС 13 июля. Представитель VK заявил «Ведомостям», что санкции ЕС не влияют на работу VK и Мax. Приложения и сервисы доступны пользователям в привычном режиме, добавил он.

16.07 / 13:05

самит GitHub перестал работать в России

GitHub перестал работать в России — пользователи жалуются, что сервис недоступен без VPN.

16.07 / 13:05

дети творчество рубль Здоровье и красота сад и огород Владислав Бакальчук: маркетплейс М.Видео по итогам первого полугодия 2026 года увеличил оборот в 4 раза год к году

По итогам первого полугодия 2026 года оборот платформы превысил 17,7 млрд рублей, увеличившись в 4 раза по сравнению с аналогичным периодом прошлого года. Рост обеспечили расширение ассортимента, развитие новых категорий, увеличение количества партнеров-продавцов и устойчивый рост спроса как на электронику и бытовую технику, так и на товары повседневного спроса. Сегодня ассортимент маркетплейса М.Видео насчитывает более 900 тыс. SKU, что почти в шесть раз больше, чем годом ранее, а покупатели все чаще используют платформу для широкого спектра ежедневных покупок.

16.07 / 13:05

банк самит nintendo Software Doom запустили на консоли Casio Loopy

Автор YouTube-канала Throaty Mumbo презентовал порт классического шутера Doom на 32-битной консоли Casio Loopy, которая выходила на японском рынке в 1995-1996 годах. Игровая система была ориентирована на девочек-геймеров и получила всего 10 игр.

16.07 / 13:05

общество google В России полностью перестал быть доступен GitHub

Как показывает сервис detector404, с 10 утра по Москве GitHub почти полностью недоступен. Не проходит почти 100% сетевых соединений. В других странах подобные проблемы отсутствуют. На хостингах сервис также недоступен.

16.07 / 13:00

продукты люди ученые здоровье общество Какой популярный продукт может разрушать ДНК - исследование

Эксперты определили продукт, который наносит непоправимый вред здоровью, если есть его часто.

16.07 / 13:00

люди общество вирус фрукты Здоровье и красота Как правильно есть цитрусовые для максимальной пользы, рассказал врач

Чтобы получить максимальную витаминов, микроэлементов и антиоксидантов от цитрусовых, не выбрасывайте кожуру.

16.07 / 12:41

самит Casio выпустила в США две новые модели ударопрочных часов G-Shock в тонком металлическом корпусе и строгом дизайне

Casio представила на американском рынке две новые модели из серии премиальных ударопрочных часов G-Shock, которые входят в линейку G-Steel — GST-B1000BD-1A и GST-B1000BD-2A и вышли в Японии в мае. Главными особенностями новинок стали черное ионное напыление на деталях корпуса, минималистичный безель и существенно уменьшенная толщина по сравнению с классическими моделями G-Shock.

16.07 / 12:34

люди общество рак самит врачи Рак легких может начинаться не с кашля: врачи назвали тревожные призна

Некоторые признаки рака легких не связаны с дыханием, поэтому их нередко принимают за симптомы других заболеваний.

Лента новостей

На главную страницу