Об этом же в других СМИ

cursorinfo.co.il / 1 год назад

Как определить, что вас обманывают - секретная методика ЦРУ

habr.com / 1 год назад

Apple Intelligence на iPhone теперь требует вдвое больше памяти

gagadget.com / 1 год назад

Новая утечка раскрыла европейские цены на смартфоны серии Samsung Galaxy S25

habr.com / 1 год назад

Новая модель LAM способна выполнять задачи в Word

cursorinfo.co.il / 1 год назад

Японская методика снятия тревожности всего за 5 минут стала вирусной в сети

Больше по теме

24.12.2024 - 11:19 / habr.com

Новая методика оптимизации LLM сокращает затраты памяти до 75%

Исследователи токийского стартапа Sakana AI разработали новую технологию, которая позволяет языковым моделям более эффективно использовать память. Это позволит предприятиям сократить расходы на создание приложений на основе больших языковых моделей (LLM) и других моделей на основе Transformer.

Метод называется « универсальной памятью трансформеров». Он использует специальные нейронные сети для оптимизации LLM с целью сохранения важных фрагментов информации и исключения избыточных деталей из контекста.

Ответы моделей Transformer, основы LLM, зависят от содержимого их «контекстного окна », то есть того, что они получают в качестве входных данных от пользователей.

Окно контекста можно считать рабочей памятью модели. Тонкая настройка содержимого контекстного окна может оказать огромное влияние на производительность модели. Это привело к появлению целой области «инженерия подсказок».

Текущие модели поддерживают очень длинные контекстные окна с сотнями тысяч или даже миллионами токенов (числовых представлений слов, частей слов, фраз, понятий и чисел, вводимых пользователями в своих подсказках).

Это позволяет пользователям втиснуть больше информации в свои подсказки. Однако более длинные подсказки могут привести к более высоким вычислительным затратам и к снижению производительности. Оптимизация подсказок для удаления ненужных токенов при сохранении важной информации может снизить затраты и увеличить скорость.

Современные методы оптимизации подсказок требуют больших ресурсов или вынуждают пользователей вручную тестировать различные конфигурации, чтобы уменьшить размер подсказок.

Универсальная память трансформеров оптимизирует подсказки с помощью модели памяти с нейронным внимание (NAMM), простых нейронных сетей, которые решают,

технологии самит предприятия стартап крипто токен

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Чем грозит миру новая вспышка метапневмовируса, предупредили в ВОЗ cursorinfo.co.il / 1 год назад

Ожидаемый результат: в Rocksteady прошла новая волна увольнений из-за провала Suicide Squad: Kill the Justice League gagadget.com / 1 год назад

OnePlus Nord 4 получает обновление OxygenOS 15 в Индии: новые функции ИИ, улучшение производительности и оптимизации системы gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

10.07 / 23:51

технологии общество отдых человек врачи Пять привычек, которые помогут быстрее заснуть

Специалисты рассказали, что стоит изменить перед сном, чтобы легче засыпать и просыпаться без чувства усталости.

10.07 / 23:36

реклама продукты технологии Disney Шоу бизнес Disney может открыть бесплатный доступ к части контента Disney+

Disney может запустить бесплатный тариф для стримингового сервиса Disney+. Об этом со ссылкой на собственные источники сообщает Business Insider. Компания пока официально не анонсировала такие изменения и не раскрыла возможные сроки их внедрения.

10.07 / 22:07

технологии Apple история самит доллар iPhone Ultra может получить почти незаметный сгиб экрана: Apple выбирает между двумя технологиями

Согласно свежей утечке, компания намерена сделать складку на гибком дисплее практически незаметной. По словам инсайдера Fixed Focus Digital, по этому показателю iPhone Ultra сможет сравниться с одним из лучших складных смартфонов на рынке — Oppo Find N6.

10.07 / 20:41

продукты здоровье общество самит человек Продукты, которые помогают печени работать эффективнее, назвали врачи

Специалисты рассказали, какие продукты стоит чаще включать в рацион, чтобы поддерживать нормальную работу печени и снизить нагрузку на нее.

10.07 / 20:11

Samsung технологии политика доллар Раскрыты цены Samsung Galaxy Z Fold8 и Galaxy Z Fold8 Ultra для США

Если ранее инсайдеры раскрыли предполагаемые цены устройств для Европы и Южной Кореи, то теперь стали известны и ожидаемые американские цены на Galaxy Z Fold8 и Galaxy Z Fold8 Ultra.

10.07 / 19:46

технологии климат самит электроэнергия Эксперт Сколько на самом деле служат солнечные панели – экспертный разбор

Очистка солнечных панелей от пыли и загрязнений является ключевым условием, позволяющим замедлить естественную потерю производительности оборудования.

10.07 / 19:31

продукты продукты питания общество отдых человек Фрукты, которые помогают уснуть без лишних усилий, назвали врачи

Исследования показали, что некоторые фрукты способны сократить время засыпания и сделать ночной отдых более качественным.

10.07 / 19:31

люди музыка общество психология интересное Почему важно записывать свои мечты - лайфхак от психолога

Записывая мечты, вы можете легче трансформировать их в цели, определить приоритеты и поддерживать мотивацию.

10.07 / 19:23

продукты продукты питания общество отдых человек Фрукты помогают уснуть без лишних усилий, назвали врачи

10.07 / 19:08

продукты технологии закон google OpenAI закрывает браузер ChatGPT Atlas: его функции перейдут в новое приложение ChatGPT

OpenAI представила браузер ChatGPT Atlas для macOS в октябре 2025 года. Он создавался как браузер, в центре которого находился ChatGPT. Однако вместо дальнейшего развития этого продукта компания решила перенести все его ключевые возможности в переработанное приложение ChatGPT для компьютеров.

Лента новостей

На главную страницу