Об этом же в других СМИ

cursorinfo.co.il / 1 год назад

Как уменьшить талию за неделю: эффективные методы от экспертов

cursorinfo.co.il / 1 год назад

Как бороться с потерей смысла жизни – израильские психологи раскрыли эффективный метод

cursorinfo.co.il / 1 год назад

Прогрессивный метод производства топлива из воды и солнечной энергии разработали ученые

gagadget.com / 1 год назад

Mercedes-Benz запускает метод окрашивания автомобилей PixelPaint — аналог струйной печати для индивидуальных заказов

Больше по теме

18.11.2024 - 17:39 / habr.com

Разработан метод оценки нейросетей в работе с длинными текстами

Исследователи из Института AIRI, МФТИ и Лондонского института математических наук (LIMS) разработали бенчмарк BABILong для оценки производительности языковых моделей при работе с большими текстами. Бенчмарк включает 20 задач, ориентированных на поиск и анализ разрозненных фактов в крупных текстах, включая индукцию, дедукцию, связывание информации, простейшие вычисления и работу со списками. BABILong опубликован в публичном репозитории для поддержки научного сообщества и будет представлен на конференции NeurIPS 2024 в Ванкувере.

Длина контекста — объем информации, удерживаемой нейросетью для выполнения задачи. Несмотря на увеличение этого параметра в современных моделях, фактическое использование данных часто ограничено 10–20%, и модели преимущественно обращают внимание на первые и последние абзацы текста. Производительность существенно снижается с увеличением сложности задач.

BABILong измеряет качество ответа модели и зависимость точности от длины контекста. Основой послужил набор задач из BABI, ориентированный на базовые операции логики и арифметики, дополненный данными художественной литературы. Первоначально рассчитанные на короткие тексты задачи были распределены по литературным произведениям, требуя от моделей не просто находить информацию, но и анализировать её для получения верного ответа.

В ходе экспериментов исследователи использовали бенчмарк для анализа производительности популярных моделей при контексте длиной от тысячи до 50 миллионов токенов. Результаты показали, что модели теряют точность, когда объем данных превышает 25% от заявленной длины контекста, что подчеркивает необходимость улучшения обработки информации.

Команда также разработала адаптацию бенчмарка для русского языка — Libra, в сотрудничестве с R&D

конференция крипто LexxNimofff Лондон

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Японские учёные разработали метод предсказания успеха операции на спине chudo.tech / 1 год назад

Неужели DC снова может удивлять? Мультсериал Джеймса Ганна Creature Commandos об отряде чудовищ, выполняющих опасные миссии, получил очень высокие оценки от критиков gagadget.com / 1 год назад

Пользователи жалуются, что Word и Excel собирают данные для обучения нейросетей, но Microsoft отрицает это habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

27.07 / 10:29

бизнес люди экономика общество политика Власти обсуждают интеграцию в «Госуслуги» элементов соцсетей и агрегатора событий

В правительстве обсуждают стратегию развития «Госуслуг» до 2035 года. В числе идей — интегрировать в портал соцсеть с локальными сообществами, агрегатор событий и семейные чаты. Об этом пишут «Известия» со ссылкой на два источника, участвующих в обсуждении. Сейчас рассматривают несколько концепций развития. В приоритете — трансформация единого портала в универсальную цифровую платформу для жизни, общения и получения услуг. Разработку стратегии ведёт аппарат правительства.

27.07 / 10:29

продукты технологии Apple санкции СМИ Загрузки приложений VK через RuStore и другие магазины для Android за неделю выросли более чем в полтора раза

По информации СМИ, анализ статистики установки приложений VK через RuStore и другие магазины для Android с 16 по 19 июля показал рост более чем в полтора раза относительно аналогичного периода с 9 по 12 июля. Также веб-версию Max для сохранения пуш-уведомлений на iPhone установили более 7 млн пользователей, добавили в VK.

27.07 / 10:29

экономика Nvidia общество банк финансирование Nvidia начала страховать по кредитам сдающих в аренду ИИ-мощности провайдеров

Nvidia нашла способ стимулировать продажи своих GPU на фоне конкуренции. Теперь компания выступает страховщиком по кредитам для специализированных провайдеров, сдающих в аренду ИИ-мощности.

27.07 / 10:13

люди Sony самит звезда “Дайте геймерам то, чего они хотят”: сооснователь Rockstar Games Дэн Хаузер высказался о смерти физических изданий игр

Многие звезды игровой индустрии выразили свое мнение по поводу отказа Sony от производства дисков и в целом по глобальному переходу к цифровой дистрибуции. Свои мысли озвучил и один из самых знаменитых разработчиков — сооснователь Rockstar Games Дэн Хаузер (Dan Houser), который был сценаристом всех основных частей GTA, а также Bully, Red Dead Redemption и Max Payne 3.

27.07 / 09:57

люди закон общество семья mastercard Пользователь ChatGPT из Нью-Йорка подал в суд на норвежскую авиакомпанию и получил почти $5 тысяч компенсации

Специалист по информатике Панос Иперойтис использовал ChatGPT, чтобы из Нью-Йорка подать в суд на норвежскую авиакомпанию Norse Atlantic Airways и получить компенсацию в размере почти $5 тыс.

27.07 / 09:52

Nvidia общество электроэнергия финансирование wsj Nvidia ведет переговоры о гарантиях на $250 млрд для дата-центра OpenAI мощностью 10 ГВт

Компания Nvidia ведет переговоры о предоставлении финансовых гарантий примерно на $250 млрд для OpenAI в рамках масштабного проекта строительства дата-центра. Об этом сообщает WSJ со ссылкой на собственные источники. В сообщении говорится, что гарантии позволят OpenAI арендовать объект мощностью 10 ГВт, который энергетическое подразделение SoftBank развивает на юге штата Огайо. Общая стоимость проекта, включая чипы для дата-центров, может превысить $500 млрд — это будет крупнейший дата-центр, о создании которого когда-либо объявляли, сказано в сообщении. Гарантия на $250 млрд будет покрывать аренду дата-центра и долг, необходимый для его строительства, но не сами чипы Nvidia. Отдель

27.07 / 09:48

самит жара Эксперт Секрет бедуинов: почему в жару стоит надеть именно черное

Свободная черная одежда может охлаждать в жару лучше белой, так как она создает естественную циркуляцию воздуха.

27.07 / 09:48

продукты продукты питания общество Здоровье и красота еда Четыре свойства овсянки, которые защитят ваше сердце – кардиолог

Благодаря высокому содержанию клетчатки и уникальных антиоксидантов, регулярное употребление овсянки помогает снизить уровень «плохого» холестерина.

27.07 / 09:42

технологии Huawei Nvidia самит AMD AMD Helios: 72 ускорителя Instinct MI455X в единой стойке против NVL72

20 июля AMD раскрыла полные характеристики своей ИИ-стойки Helios™ и одновременно объявила о крупной сделке. Microsoft начнет разворачивать эти стойки в дата-центрах Azure® во второй половине 2026 года. Чуть более формальная и официальная премьера состоится на днях — на мероприятии Advancing AI. Но главное в новости то, что AMD впервые выходит на рынок не с отдельными ускорителями, а с готовой стойкой целиком. В этой стойке свои GPU, свои CPU, своя сеть и свой софт. Сейчас это отчасти умеет делать Huawei, а основным игроком на рынке выступает, конечно, NVIDIA с их стоечными системами.

27.07 / 09:42

бизнес связь технологии экономика Газпром Совместное решение от Т1 и Luxms сокращает операционные расходы в закупках

Оперативный анализ более 150 тысяч компаний способна проводить система «Сканер контрагентов», разработанная ИТ-холдингом Т1 и ГК Luxms. Использование сканера помогает наращивать базу надежных поставщиков, снижать риски для бизнеса и сокращать операционные затраты на закупки.

Лента новостей

На главную страницу