

СМИ: Apple и Nvidia использовали YouTube для обучения ИИ без согласия авторов
- СМИ узнали о копировании материалов YouTube для обучения ИИ-моделей.
- Такие компании, как Apple, Nvidia, Anthropic и Salesforce, использовали данные видеороликов без согласия авторов.
- Набор данных, преимущественно состоящий из субтитров к видео, является частью глобального сборника информации Pile.
Крупные технологические компании, среди которых Apple, Nvidia, Anthropic и Salesforce, использовали «десятки тысяч видеороликов» с YouTube для обучения ИИ-моделей. Эти действия совершались без согласия авторов видео, говорится в отчете, опубликованном Proof News.
По утверждению СМИ, некоторые компании могли нарушить правила YouTube, запрещающие сбор и копирование материалов платформы без разрешения авторов. Журналистское исследование показало, что фирмы использовали субтитры в 173 536 видеороликах, взятые с более чем 48 000 YouTube-каналов.
Набор данных под названием YouTube Subtitles включал в себя трансляции и записи с образовательных каналов, в том числе Khan Academy, MIT и Harvard. Кроме того, для обучения ИИ-моделей использовались видеоролики популярных блогеров: MrBeast (289 млн подписчиков), Jacksepticeye (почти 31 млн подписчиков), Marques Brownlee (19 млн подписчиков) и некоторых других.
Аудитория Пакмана превышает 2 млн человек, а его ролики набирают сотни тысяч просмотров. Между тем, почти 160 авторских записей Пакмана включили в обучающий набор данных для ИИ, утверждает источник.
Генеральный директор потокового сервиса Nebula Дэйв Вискус назвал действия Apple и других компаний воровством. По его словам, использование сторонних материалов без согласия авторов демонстрирует неуважение к их творчеству.
Представители EleutherAI — разработчика наборов данных для ИИ — не ответили на просьбу журналистов Proof News
Читать на incrypted.com