Об этом же в других СМИ

habr.com / 1 год назад

Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров

habr.com / 1 год назад

Европейские компании объединяются, чтобы ускорить внедрение искусственного интеллекта

habr.com / 1 год назад

Hugging Face выпускает небольшую языковую модель, которая в большинстве случаев превосходит Qwen и Llama

habr.com / 1 год назад

OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini?

habr.com / 1 год назад

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

Больше по теме

25.01.2025 - 19:54 / habr.com

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

Исследовательская группа Snowflake AI представляет SwiftKV - решение, разработанное для повышения производительности LLM-выводов и снижения связанных с этим затрат. SwiftKV использует методы кэширования пар «ключ-значение» для повторного использования промежуточных вычислений во время выводов. Устраняя избыточные вычисления, оно оптимизирует процесс вывода и повышает эффективность использования LLM.

Конструкция SwiftKV ориентирована на вычислительную мощность больших языковых моделей. Обычные конвейеры логического вывода часто повторно вычисляют одни и те же операции для нескольких запросов, что приводит к неэффективности. SwiftKV представляет собой уровень кэширования, который определяет и сохраняет результаты вычислений, которые можно использовать повторно. Такой подход ускоряет логический вывод и снижает требования к ресурсам, что делает его практичным выбором для организаций, стремящихся оптимизировать свои операции с AI.

SwiftKV включает систему памяти «ключ-значение» в архитектуру LLM. Её работу можно описать следующим образом:

Кэширование пар «ключ-значение»: во время логического вывода SwiftKV фиксирует промежуточные активации (ключи) и соответствующие им результаты (значения). Для аналогичных запросов он извлекает предварительно вычисленные значения, а не пересчитывает их.

Эффективное управление хранилищем: механизм кэширования использует такие стратегии, как удаление наименее часто используемых (LRU) элементов, для эффективного управления памятью, гарантируя, что кэш остается полезным без чрезмерного потребления ресурсов.

Бесшовная интеграция: SwiftKV совместим с существующими платформами LLM, такими как Transformers от Hugging Face и LLaMA от Meta, что позволяет легко внедрять его без значительных изменений в

бизнес технологии общество предприятия mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Snap представила модель преобразования текста в изображение с помощью AI для мобильных устройств habr.com / 1 год назад

Anthropic представила новый метод защиты больших языковых моделей от взломов habr.com / 1 год назад

AI-модели, такие как Deepseek-R1 и OpenAI o1, страдают от «недомыслия»: как это можно исправить habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

14.07 / 19:36

люди закон общество политика Советская электроника. Встреча основателей двух удивительных Музеев

Сегодня состоялась знаменательная встреча двух замечательных людей. Эти два человека живут в городе Чебоксары. Оба, практически в одно и то же время, основали два музея и ничего до февраля сего года не знали друг о друге.

14.07 / 19:36

общество рубль НДС авиакомпания «Аэрофлот» закупил 200 серверов Yadro для обновления ИТ-инфраструктуры

Компания «Аэрофлот» приобрела у производителя вычислительной техники и электроники Yadro, которая входит в «ИКС Холдинг», 200 серверов Yadro V240 G3. Информация о поставке опубликована на сайте вендора.

14.07 / 19:36

технологии общество самит Специалист по ИБ показал, что копию дверного ключа можно создать за 10 минут по фотографии, опубликованной в соцсетях

Специалист по кибербезопасности и этичный хакер Эван Оттингер показал, что копию дверного ключа можно быстро воссоздать по анализу фотографии, опубликованной в социальных сетях.

14.07 / 19:36

технологии закон Telegram общество политика Дуров: Евросоюз становится банановой республикой, Telegram не будет сканировать ваши личные сообщения

Павел Дуров сравнил Евросоюз с банановыми республиками из-за закона о слежке за публикациями пользователей в интернете и сетевых сервисах.

14.07 / 19:18

люди работа общество самит астрология Идеальные коллеги: какие знаки Зодиака лучше всего работают вместе

Совместимость важна не только в любви, но и работе, говорят астрологи.

14.07 / 19:18

люди здоровье общество модель Эксперт Стоит ли израильтянам повторять за Хейли Бибер – мнение дерматолога

Израильский дерматолог оценила популярные домашние рецепты красоты. Многие модные лайфхаки из интернета вредят здоровью кожи.

14.07 / 19:18

история общество курьез интересное дети и родители 843 языка в одной стране – разбор удивительного феномена

Ученые объясняют культурное богатство сложным горным рельефом местности. Изоляция общин помогла сберечь редкие наречия от вымирания.

14.07 / 19:14

доллар Casio выпустила новые часы Baby-G BG169CMB-8 с камуфляжным дизайном и защитой до 200 метров

В основе BG169CMB-8 лежит уже знакомый корпус BG-169 с круглой формой, изготовленный из полимерного материала. Дополнительную защиту обеспечивают металлические элементы вокруг циферблата.

14.07 / 19:14

связь Samsung технологии общество расследование Владельцы Samsung Galaxy S26 Ultra пожаловались на красное пятно в центре экрана

Samsung уже подтвердила, что знает о поступающих обращениях и проводит внутреннее расследование, чтобы установить причину возникновения дефекта.

14.07 / 18:38

люди ученые животные общество климат Пять коров 130 лет жили без людей — ученые были удивлены итогом

Животные не только выжили в полной изоляции, но и создали популяцию, численность которой достигла примерно двух тысяч особей.

Лента новостей

На главную страницу