Об этом же в других СМИ

incrypted.com / 1 год назад

Криптоказино обошли блокировку и заработали более $80 млрд — исследование

incrypted.com / 1 год назад

Криптоказино обошли блокировку и заработали более $80 млрд — исследование

habr.com / 1 год назад

Исследование: какие страны больше всего выиграют от утечки мозгов из США

habr.com / 1 год назад

Исследование MIT: нерелевантные входные данные приводят к неудачам LLM

cursorinfo.co.il / 1 год назад

В каких аэропортах мира чаще всего происходят кражи багажа – исследование

Больше по теме

02.04.2025 - 06:18 / habr.com

Исследование по повышению производительности в системах RAG

Исследователи из Еврейского университета в Иерусалиме обнаружили, что количество документов, обработанных с помощью технологии расширенной генерации поиска (RAG), влияет на производительность языковой модели, даже если общая длина текста остается постоянной.

Исследовательская группа использовала набор данных проверки MuSiQue, содержащий 2417 вопросов с ответами. Каждый вопрос ссылается на 20 абзацев Википедии, при этом два-четыре абзаца содержат релевантную информацию об ответе, а остальные служат реалистичными отвлекающими факторами.

Чтобы изучить, как количество документов влияет на производительность, исследователи создали несколько разделов данных. Они постепенно сократили количество документов с 20 до 15, 10, восьми и, наконец, до двух-четырех документов, содержащих релевантную информацию. Чтобы поддерживать единообразное количество токенов и позиционирование информации, они расширили выбранные документы, используя текст из оригинальных статей Википедии.

Тестирование нескольких моделей с открытым исходным кодом, включая Llama-3.1, Qwen2 и Gemma 2, показало, что сокращение количества документов повысило производительность до 10 процентов в большинстве случаев. Qwen2 оказался исключением, возможно, более эффективно обрабатывая несколько коллекций документов. Хотя этим протестированным моделям всего несколько месяцев, более новые версии, такие как Llama-3.3, Qwen2.5 и Gemma 3, уже заменили их.

Языковые модели работали значительно лучше, когда им предоставлялись только вспомогательные документы, что означало более короткий контекст и устранение отвлекающего контента. Результаты показали, что похожие, но не связанные между собой документы, часто извлекаемые в системах RAG, могут запутать модель и снизить

технологии общество крипто dilnaz04 Иерусалим

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Исследование Microsoft показывает, что модели AI по-прежнему испытывают трудности с отладкой программного обеспечения habr.com / 1 год назад

Исследование MIT: AI не обладает стабильными ценностями, а лишь имитирует их habr.com / 1 год назад

Приложения для знакомств несут опасность детям - исследование cursorinfo.co.il / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 07:26

Samsung может отказаться от популярного бонуса при предзаказе Galaxy Z Fold8 и Z Flip8

Если сведения подтвердятся, изменения затронут все три ожидаемые новинки: Galaxy Z Flip8, Galaxy Z Fold8 и Galaxy Z Fold8 Ultra. При этом речь пока идет о слухе, основанном на публикации южнокорейского издания Chosun Biz. Официально Samsung эту информацию пока не подтверждала.

16.07 / 07:25

ТВ смартфоны бытовая техника Транспорт Компактный проектор Pixorien Z01 со встроенной подставкой

Pixorien представила необычный портативный проектор Z01, который решает одну из самых распространенных проблем — поиск подходящего места для установки.

16.07 / 07:22

промышленность предприятия 1С в промышленности: что обсуждали на ИННОПРОМ-2026

С 6 по 9 июля в Екатеринбурге прошла международная промышленная выставка ИННОПРОМ-2026. Инфостарт участвовал в выставке со стендом и обсуждал с представителями промышленных предприятий развитие ИТ-систем на базе 1С.

16.07 / 07:22

происшествия самит изоляция AI-агенты для аудита кода научились запускать вредоносное ПО вместо его поиска

Исследователи из AI Now Institute описали новую атаку Friendly Fire, которая позволяет превратить AI-агентов для анализа безопасности в — напротив — инструмент компрометации системы. Под удар попали автономные режимы Claude Code и OpenAI Codex, когда они используются для проверки стороннего кода без подтверждения каждого действия со стороны пользователя.

16.07 / 07:19

люди экономика общество инвестор google «Люди стали дешевле, чем программное обеспечение»: венчурные инвесторы пересматривают роль ИИ

Венчурная компания Andreessen Horowitz (a16z) опубликовала аналитический материал с тезисами CEO Hebbia Джорджа Сивулки о том, что искусственный интеллект не заменяет людей, а меняет подходы к управлению трудом. В своем материале a16z приводит главный вывод Джорджа Сивулки: Проблема больше не в моделях, а в управлении ими По мнению Сивулки, современные компании фактически получили «бесконечный штат» ИИ-агентов, но большинство еще не научилось эффективно ими управлять. Он п

16.07 / 07:18

продукты продукты питания Здоровье и красота полезные продукты кулинария Почему стоит добавить авокадо в свой ежедневный рацион

Регулярное употребление авокадо помогает организму получать полезные мононенасыщенные жиры и клетчатку.

16.07 / 07:18

связь экономика здоровье продукты питания еда Почему овсянка, приготовленная с вечера, полезнее – мнение ученых

Ученые выяснили, что "ночная" овсянка поддерживает связь между здоровьем кишечника и работой мозга.

16.07 / 07:04

Amazon общество visa mastercard google Linux Foundation запустила организацию x402 для развития стандарта интернет-платежей между ИИ-агентами

Некоммерческая организация Linux Foundation объявила о начале работы x402 Foundation. Это новый орган открытого управления, созданный для руководства протоколом x402. Одновременно криптобиржа Coinbase завершила передачу протокола новому фонду. В пресс-релизе отмечается, что x402 интегрирует платежные функции непосредственно во взаимодействие HTTP, позволяя искусственному интеллекту, API и приложениям автоматически осуществлять и получать платежи так же просто, как они обмениваются данными. Как новый протокол для интернет-платежей x402 может изменить Web3-экономику? 27.10.2025 Читать Протокол поддерживает карты и стейблкоины В Linux Foundation заявили, что x402 должен стать открытым стандартом для интернет-платежей без привязки

16.07 / 07:04

экономика общество самит финансирование капитал DeepSeek превратил основателя в самого богатого создателя ИИ в мире

Основатель китайского ИИ-стартапа DeepSeek Лян Вэньфэн стал самым богатым в мире предпринимателем среди создателей моделей искусственного интеллекта после завершения раунда финансирования на $7,4 млрд в июне 2026 года. По оценке Bloomberg Billionaires Index, его состояние выросло до $36 млрд, что позволило обогнать сооснователя OpenAI Грега Брокмана и сооснователя Anthropic Дарио Амодеи. DeepSeek увеличил оценку в пять раз По данным Bloomberg, оценка DeepSeek после июньского инвести

16.07 / 07:04

президент общество законопроект каникулы сенат Трамп встретится с сенаторами по поводу положений об этике в CLARITY Act

Президент США Дональд Трамп проведет встречу с группой сенаторов касательно положений об этике в законопроекте о структуре крипторынка (CLARITY). Об этом заявил республиканец Берни Морено в интервью Politico. Отметим, в числе первых о встрече сообщило издание CoinDesk. Это также подтвердила президентка организации Solana Policy Institute Кристин Смит в комментарии для The Block. По ее словам, цель собрания заключается в том, чтобы предложить Трампу несколько вариантов компромисса по этим положениям и получить его одобрение. Смит считает,

Лента новостей

На главную страницу