Об этом же в других СМИ

habr.com / 1 год назад

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях

habr.com / 1 год назад

Podcastle запускает модель преобразования текста в речь с более чем 450 голосами ИИ

habr.com / 1 год назад

ИИ учится играть в Super Mario Bros.: какие модели показали лучшие результаты

habr.com / 1 год назад

Cisco и Nvidia предлагают решения для преодоления технических барьеров при внедрении ИИ

habr.com / 1 год назад

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

Больше по теме

17.02.2025 - 08:05 / habr.com

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было установлено, что современные языковые модели искусственного интеллекта имеют ограничения при обработке и анализе больших объёмов текстовой информации.

Команда протестировала 12 ведущих моделей, включая GPT-4o, Gemini 1.5 Pro и Llama-3.3-70B, каждая из которых способна обрабатывать не менее 128 000 токенов.

Тест NOLIMA (No Literal Matching) проверяет, насколько хорошо модели AI могут связывать информацию и делать выводы, не полагаясь на совпадающие слова. В тесте используются вопросы и текстовые отрывки, составленные таким образом, чтобы избежать использования общей лексики, что заставляет модели понимать концепции и устанавливать связи.

Вот как это работает: в тексте может быть фраза «Юки на самом деле живёт рядом с Земпер-оперой». Соответствующий вопрос будет звучать так: «Кто из персонажей уже бывал в Дрездене?» Чтобы дать правильный ответ, модель должна понять, что Земпер-опера находится в Дрездене, и выбрать Юки в качестве ответа.

Результаты показывают, что модели испытывают трудности при увеличении длины текста. Производительность значительно снижается в диапазоне от 2000 до 8000 токенов. При 32 000 токенов 10 из 12 моделей работают вполовину медленнее, чем обычно, по сравнению с более короткими текстами.

Исследователи указывают на ограничения базового механизма внимания моделей, который не справляется с более длинными контекстами. Без подсказок в виде совпадающих слов моделям сложно находить и связывать релевантную информацию.

Производительность снижается ещё больше, когда требуется больше шагов для принятия решения (скрытых переходов). Порядок информации тоже

общество самит adobe крипто gemini mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Возможное ограничение использования новой языковой модели OpenAI GPT-4.5 через API habr.com / 1 год назад

Что думают эксперты и пользователи о выпуске модели GPT-4.5? habr.com / 1 год назад

ElevenLabs представил автономную модель преобразования речи в текст Scribe habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 18:38

люди общество самит психология Психология и отношения Как вежливо поставить на место токсичного человека - 10 лучших фраз

Вероятно, каждому из нас доводилось сталкиваться с грубым и неприятным собеседником. Как правильно поставить его на место, не опускаясь до грубости?

17.07 / 18:38

связь люди здоровье климат самоубийство Как глобальное потепление связано с самоубийствами - ответ ученых

Ученые проанализировали последствия глобального потепления, связанные с самоубийствами.

17.07 / 18:38

экономика общество интересное магнит планшеты Ультратонкий ASUS Pad (2026) с Tandem OLED-дисплеем и эргономичной подставкой-”оригами” дебютирует на первом рынке уже 6 августа

В июне на выставке Computex 2026 ASUS представила свой первый за девять лет перерыва планшет — ASUS Pad (2026).

17.07 / 18:38

люди ученые общество роды возраст Ученые выяснили когда чаще всего рождаются долгожители

Люди, которые переживают 100-летний юбилей, чаще всего празднуют день рождения осенью. Ученые выяснили почему.

17.07 / 18:38

происшествия люди семья дождь человек Фатальную ошибку людей во время грозы назвали эксперты

Специалисты объяснили, какие привычки во время грозы могут представлять опасность для жизни.

17.07 / 18:38

люди ученые животные общество самит Что умеют змеи на самом деле: мифы, в которые не стоит верить

Большинство популярных представлений о змеях оказались ошибочными, однако некоторые особенности этих рептилий способны удивить даже ученых.

17.07 / 17:29

экономика искусственный интеллект общество журналист электроэнергия ИИ уже начинает разрушать планету - новое исследование

Развитие инфраструктуры искусственного интеллекта становится не только технологическим прорывом, но и серьезным экологическим вызовом.

17.07 / 17:25

технологии общество мода и стиль Первое городское пространство «Яндекса» откроется в Москве в ноябре 2026 года

В ноябре 2026 года в галерее «Чкалов» на площади Курского вокзала откроется «Яндекс 01» — первое городское офлайн‑пространство «Яндекса». Его главная особенность — персональные рекомендации: на основе интересов посетителя технологии компании предложат маршрут по пространству и помогут подобрать подходящие события, магазины и развлечения. Вход на большинство мероприятий будет свободным.

17.07 / 17:24

технологии экономика Apple общество самит TSMC увеличила инвестиции в производство чипов в США: это может повлиять на будущие процессоры Apple

Тайваньская компания TSMC, являющаяся главным производственным партнером Apple, официально объявила о масштабном расширении своей инвестиционной программы в США. Производитель микросхем направит еще 100 млрд долларов (около 4,16 трлн гривен по актуальному курсу), благодаря чему общий объем вложений в американские предприятия достигнет 265 млрд долларов (примерно 11,02 трлн гривен).

17.07 / 17:05

общество самит психология дети и родители Психология и отношения Как понять, что извинения не были искренними - главные признаки

Психолог рассказал, как понять, что человек, который перед вами извиняется, неискренен и преследует свои цели.

Лента новостей

На главную страницу