Meta использует пиратские материалы для обучения искусственного интеллекта Ламы
Мета сознательно использовал пиратские материалы для обучения своих моделей искусственного интеллекта Llama — с благословения генерального директора Марка Цукерберга — согласно продолжающемуся иску о нарушении авторских прав против компании. По данным TechCrunch, истцы в деле Kadrey против Meta подали в суд документы, утверждая, что компания использовала набор данных LibGen для обучения ИИ.
LibGen обычно описывается как «теневая библиотека», которая предоставляет файлообменный доступ к академическим и общедоступным книгам, журналам, изображениям и другим материалам. Адвокат истцов, включая писателей Сару Сильверман и Та-Нехиси Коутс, обвинил Цукерберга в одобрении использования LibGen в образовательных целях, несмотря на опасения руководителей и сотрудников компании, которые описали его как «набор данных, которые, как они знают, являются пиратскими».
Компания удалила информацию об авторских правах из материалов LibGen, говорится в жалобе, прежде чем передать их Llama. В документе, поданном в суд, Мета По-видимому, компания признала, что «удали все абзацы об авторских правах из начала и конца» статей в научных журналах. Один из инженеров компании даже создал скрипт для автоматического удаления информации об авторских правах. Юрист утверждал, что Meta сделала это, чтобы скрыть от общественности свою деятельность по нарушению авторских прав. Кроме того, юрист упомянул, что Meta признала, что она скачивала материалы LibGen через торрент, хотя ее инженеры не хотели делиться ими «с корпоративного ноутбука [Meta]».
В 2023 году Сильверман вместе с другими авторами подал в суд на Meta и OpenAI за нарушение авторских прав. Они обвинили компании в использовании пиратских материалов из теневых библиотек для обучения своих моделей
Читать на hitechexpert.top


