Об этом же в других СМИ

hitechexpert.top / 1 год назад

Трамп утверждает, что «очень богатая» группа купит TikTok

habr.com / 1 год назад

Meta* нанимает ключевого исследователя OpenAI для работы над моделями рассуждений ИИ

habr.com / 1 год назад

Дания будет бороться с дипфейками, предоставляя гражданам авторские права на их тело, черты лица и голос

habr.com / 1 год назад

Федеральный судья поддержал Meta* в иске о обучении ИИ на книгах, защищенных авторским правом

habr.com / 1 год назад

Федеральный судья встал на сторону Anthropic в судебном процессе об авторском праве

Больше по теме

16.06.2025 - 06:20 / gagadget.com

Исследователи разоблачили, что ИИ-модель Meta Llama 3.1 нарушает авторские права - она может вспомнить 42 процента первой книги о Гарри Поттере

Недавно исследование Stanford, Cornell и West Virginia University показало, что модель Meta Llama 3.1 (70B), выпущенная в июле 2024 года, сознательно запомнила 42% первой книги о Гарри Поттере так, что может воспроизвести отрывки по 50 токенов с вероятностью более 50%. То есть, мродель не просто помнит сюжет - она может воспроизвести целые куски текста, если ей дать первое предложение. Для сравнения, старая модель помнила всего 4.4 %.

Что произошло

Группа исследователей проверила, насколько сильно новая Llama "залипла" на книгах. Оказалось, если текст очень популярен (типа "Гарри Поттера" или "Хоббита"), то ИИ может повторить большие куски. А вот менее известные книги (например, "Sandman Slim") - не вызывали у него особого энтузиазма: там модель помнила менее 1 %.

Учёные использовали специальный метод, который показывает, насколько модель уверена в каждом следующем слове - и эта уверенность была так высока, что стало понятно: она это точно видела раньше.

Как это измеряли

Использовали метод анализа вероятностей следующих токенов: если, подложив первые 50 токенов из отрывка, модель воспроизводит следующие - это считалось признаком запоминания

Почему это важно

Почему так произошло?

Потому что Meta обучала эту модель на 15 триллионах слов - это очень-очень много. Возможно, в тренировку попали не просто книги, а форумы, фан-сайты и рецензии с цитатами - чем чаще текст появлялся в датасете, тем чаще его влияние на модель.

И что теперь?

Если юристы докажут, что ИИ воспроизводит тексты почти дословно - это может означать большие проблемы для Meta. Особенно потому, что их модель открыта, и все могут это проверить. Закрытые языковые модели (OpenAI, Anthropic и Google) тоже могут иметь аналогичные проблемы, но доказать это гораздо

закон книги интересное крипто Гарри Поттер

Читать на gagadget.com

Все новости от gagadget.com

Об этом же в других СМИ

Жители Дании получат авторское право на тело, голос и лицо для защиты от ИИ itc.ua / 1 год назад

Производители ПК обманывали строки авторских прав в BIOS для получения полных версий пробного ПО habr.com / 1 год назад

Meta добавляет в WhatsApp сводки, созданные с помощью искусственного интеллекта hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 19:47

продукты люди здоровье общество Здоровье и красота Две лучшие крупы для похудения назвали ученые

Эксперты рассказали, в каких случаях лучше выбрать гречку, а в каких рис.

15.07 / 19:47

технологии общество рубль электромобиль пресс-служба UMO объявила о старте предзаказов электрического кроссовера UMO 5 для частных покупателей в России

Компания UMO объявила о старте приёма предзаказов на электрический кроссовер UMO 5 для частных покупателей и раскрыла цены и комплектации модели. Автомобиль будет доступен в двух версиях. Комплектацию «Про» оценили в 2,59 млн рублей, а версию «Макс» — в 2,79 млн рублей. Цены действуют с учётом субсидии при покупке электромобиля, рассказали Хабру в пресс-службе компании.

15.07 / 19:23

технологии AOC представила необычный портативный монитор с цветным E Ink-дисплеем

Вместо привычной LCD- или OLED-матрицы новинка получила цветной экран на основе электронной бумаги E Ink. Продажи уже стартовали в Китае, где устройство оценили в 4599 юаней (около 679 долларов).

15.07 / 19:18

продукты здоровье общество женщина Здоровье и красота Три продукта, которые необходимы всем женщинам после 40 лет

Какие продукты позитивно влияют на женский организм, поддерживают гормональный баланс и продлевают молодость.

15.07 / 19:18

люди здоровье общество самит сон Шесть недель недосыпания могут изменить тело - ученые

Даже незначительное недосыпание может повлиять на тело быстрее, чем кажется.

15.07 / 19:12

продукты OpenAI OpenAI представила Codex Micro — компактный девайс для удобного программирования и управления AI-агентами

OpenAI представила Codex Micro — компактное настольное устройство, созданное совместно с производителем механических клавиатур Work Louder. Это первый аппаратный продукт компании, ориентированный на программистов, которые используют в своей работе AI-платформу Codex.

15.07 / 18:38

технологии происшествия ученые искусственный интеллект В ChatGPT обнаружили опасную уязвимость, позволявшую обойти защиту

Обычный на первый взгляд запрос помог выявить неожиданную особенность работы защитных механизмов ChatGPT.

15.07 / 18:36

семья Sony playstation В следующую подборку PlayStation Plus Extra и Premium войдут семь игр, включая Avatar: Frontiers of Pandora и Rise of the Ronin

Sony раскрыла список игр, которые уже на следующей неделе будет предложены подписчикам PlayStation Plus Extra и Premium.

15.07 / 17:55

продукты люди продукты питания общество еда Популярные гарниры по уровню опасности сравнил диетолог

Скорость усвоения популярных углеводных продуктов зависит от двух факторов – молекулярной структуры и сопутствующих компонентов блюда.

15.07 / 17:55

происшествия люди Путешествия здоровье общество Чем опасны частые путешествия, рассказали врачи

Многие люди любят путешествовать и летать на самолетах, но важно помнить, что частые путешествия могут негативно отразиться на здоровье.

Лента новостей

На главную страницу