Об этом же в других СМИ

habr.com / 11 месяцев назад

Instella Math: языковая модель AMD с поддержкой рассуждений

habr.com / 11 месяцев назад

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

gagadget.com / 11 месяцев назад

Секреты Samsung раскрыты: инсайдер поделился подробной информацией о характеристиках, цене и дате выхода Galaxy Tab S11, S11 Ultra и S10 Lite

habr.com / 11 месяцев назад

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

habr.com / 11 месяцев назад

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

Больше по теме

26.07.2025 - 02:52 / habr.com

Перегрузка языковых моделей информацией приводит к нерелевантным ответам

Предполагается, что большие языковые модели могут обрабатывать миллионы токенов (фрагментов слов и символов, из которых состоят входные данные) одновременно. Но чем длиннее контекст, тем хуже они справляются с задачей.

Таков вывод нового исследования, проведённого Chroma Research. Компания Chroma, создающая векторную базу данных для ИИ-приложений, на самом деле выигрывает, когда моделям требуется помощь в получении информации из внешних источников. Тем не менее масштаб и методология этого исследования заслуживают внимания: исследователи протестировали 18 ведущих ИИ-моделей, включая GPT, Claude, Gemini и Qwen, в четырёх типах задач. Среди них были семантический поиск, задачи на повторение и ответы на вопросы в объёмных документах.

Исследование основано на знакомом тесте «иголка в стоге сена», когда модель должна выбрать конкретное предложение, спрятанное в длинном блоке нерелевантного текста. Команда Chroma раскритиковала этот тест за измерение только буквального совпадения строк, поэтому они изменили его, чтобы он требовал настоящего семантического понимания.

В частности, они вышли за рамки простого распознавания ключевых слов двумя основными способами. Во-первых, вместо того чтобы задавать вопрос, в котором используются те же слова, что и в скрытом предложении, они задавали вопросы, связанные с ним только семантически. Например, в задании, вдохновлённом тестом NoLiMa, может быть задан вопрос: «Кто был в Хельсинки?», если в тексте упоминается только то, что Юки живёт рядом с музеем Киасма. Чтобы дать ответ на этот вопрос, модель должна использовать свои знания об окружающем мире, а не просто искать совпадения ключевых слов.

Для моделей это оказалось гораздо более сложной задачей. При ответе на эти семантические вопросы

история самит adobe google крипто gemini mefdayy Хельсинки

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Цена, дата старта продаж и цвета корпуса Galaxy A17 — инсайдер поделился важной информацией о новом бюджетном смартфоне Samsung gagadget.com / 11 месяцев назад

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3 habr.com / 11 месяцев назад

Apple представила FastVLM — визуально-языковую модель высокой точности, которая работает на смартфоне habr.com / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

26.07 / 11:26

технологии санкции Telegram общество капитал Weekly: продвижение CLARITY Act, новые пошлины Трампа и некастодиальный кошелек в Telegram

Редакция Incrypted подготовила для вас новый выпуск еженедельного дайджеста о ключевых событиях в сферах Web3 и ИИ. В нем мы расскажем вам о продвижении законопроекта о структуре крипторынка в США (CLARITY), новых пошлинах администрации президента Дональда Трампа, анонсе некастодиального кошелька в Telegram и многом другом. Главные новости

26.07 / 11:26

экономика Apple политика финансирование дефицит Apple просит разрешение на чипы компании из Китая из «черного списка» США: демократы обвинили политику Трампа — FT

Администрация президента США Дональда Трампа может усилить дефицит памяти для электроники из-за пересмотра политики поддержки производства микрочипов, тогда как Apple просит разрешить закупку компонентов у китайской компании ChangXin Memory Technologies (CXMT). Об этом сообщает Financial Times. На этой неделе конгрессмен-демократ Ро Ханна направил письмо министру торговли США Говарду Лютнику, в котором обвинил администрацию Трампа в подрыве усилий по созданию собственного производства памяти в США. Он также попросил администрацию объяснить, разрешат ли американским компаниям закупать

26.07 / 11:25

бизнес общество политика ликвидация школы За полгода 2026 года появилось на 64% больше ИТ‑компаний, чем за 6 месяцев 2025 года

В первом полугодии 2026 года в России было создано 37 тысяч новых компаний и индивидуальных предпринимателей в IT‑сфере. Это на 64% больше, чем за аналогичный период 2025 года, когда было зарегистрировано 13,3 тысячи новых субъектов. Такие данные привела компания Rusprofile. Всего на конец июня в стране было зарегистрировано 273 тысяч субъектов бизнеса в сфере IT. Из них 68% приходится на индивидуальных предпринимателей, а 5 тысяч организаций находятся в процессе ликвидации, реорганизации или банкротства.

26.07 / 11:08

технологии Apple самит Эксперт телевидение Ревизия в ящике с проводами – какие кабели пора выбросить

Прежде чем выкидывать легендарный ящик со старыми проводами, проверьте, какие из них еще пригодятся для работы или продажи.

26.07 / 11:08

люди ученые общество мужчина женщина Почему мы правши – эволюционная тайна доминирующей руки

Предпочтение правой руки формируется еще на 10-й неделе беременности и связано с древнейшими эволюционными процессами.

26.07 / 11:08

продукты медицина здоровье продукты питания самит 5 углеводов, которые поддерживают здоровье мозга

Хлеб, рис и картофель могут быть полезны. Все зависит от вида продукта и того, как вы его едите каждый день.

26.07 / 10:47

СМИ закон история коалиция Matrix Двенадцать штатов празднуют победу: слияние Paramount Skydance и Warner Bros. Discovery заморожено на год

Коалиция из 12 штатов, а также примкнувшая к ним Гильдия сценаристов США добились важного решения в их борьбе против слияния крупнейших медиагигантов Paramount Skydance и Warner Bros. Discovery.

26.07 / 10:28

технологии Apple закон история самит Apple готовит самый защищенный iPad mini в истории: планшет впервые может получить влагозащиту и OLED-дисплей

Сведения о сроках выхода и новых возможностях устройства появились сразу из нескольких источников. Ранее Марк Гурман сообщал, что Apple работает над полностью переработанным корпусом, способным выдерживать попадание воды. Дополнительным подтверждением подготовки к релизу стало июньское сообщение южнокорейского издания ETNews о начале массового производства OLED-дисплеев для нового iPad mini компанией Samsung Display. Хотя Apple пока официально не раскрывает характеристики устройства, совокупность утечек указывает на то, что анонс действительно может состояться этой осенью.

26.07 / 10:23

технологии экономика журналист google Подорожание неизбежно: серия смартфонов Pixel 11 выйдет с новой ценой

На фоне дефицита памяти практически все производители смартфонов подняли цены на свою продукцию, однако Google пока не пошла на этот шаг. 12 августа в Нью-Йорке компания представит линейку, о которой уже появлялось немало информации. Инсайдеры говорили, что серия значительно подорожает по сравнению с предыдущей и теперь Google косвенно подтвердила это.

26.07 / 10:16

происшествия ученые животные самит профессор Неожиданный эффект: ученые привязали мусор к сетям и спасли дельфинов

Ученые выяснили, что привязанные к рыболовным сетям пластиковые бутылки работают как звуковые отражатели для эхолокации дельфинов.

Лента новостей

На главную страницу