OpenAI случайно удалила потенциальные доказательства в иске NY Times об авторских правах
Юристы The New York Times и Daily News, которые подали в суд на OpenAI за то, что она якобы копировала их работы для обучения своих моделей ИИ без разрешения, говорят, что инженеры OpenAI случайно удалили данные, потенциально имеющие отношение к делу.
Ранее этой осенью OpenAI согласилась предоставить две виртуальные машины, чтобы адвокаты The Times и Daily News могли выполнять поиск своего защищённого авторским правом контента в обучающих наборах ИИ.
Теперь адвокаты издателей заявили, что с 1 ноября они и нанятые ими эксперты потратили более 150 часов на поиск обучающих данных OpenAI. Однако 14 ноября инженеры компании удалили все поисковые данные, хранящиеся на одной из виртуальных машин. OpenAI попыталась восстановить данные — и в основном успешно. Однако, поскольку структура папок и имена файлов были «безвозвратно» утеряны, восстановленные данные «не могут использоваться для определения того, где скопированные статьи истцов из новостных агентств использовались для построения моделей».
«Истцы были вынуждены воссоздавать свою работу с нуля. Только вчера они узнали, что восстановленные данные непригодны для использования и что целая неделя работы их экспертов и юристов ушла впустую», — написал адвокат The Times и Daily News.
Однако он отмечает, что не считает удаление преднамеренным. При этом, по мнению защиты, у OpenAI больше возможностей отыскать в своих собственных наборах данных потенциально нарушающий авторские права контент, если компания будет использовать собственные инструменты.
Ранее OpenAI утверждала, что обучение моделей с использованием общедоступных данных, включая статьи из The Times и Daily News, является добросовестным. Компания считает, что ей не требуется лицензировать или иным образом платить за такой
Читать на habr.com



