Creative Commons представляет CC signals — платформу для открытой экосистемы ИИ
Некоммерческая организация Creative Commons, которая возглавила движение за лицензирование, позволяющее авторам делиться своими работами, сохраняя при этом авторские права, теперь готовится к эпохе ИИ. В среду организация объявила о запуске нового проекта CC signals, который позволит владельцам наборов данных подробно описывать, как их контент может или не может быть повторно использован машинами, например, для обучения моделей ИИ.
Идея заключается в том, чтобы найти баланс между открытостью интернета и потребностью в ещё большем количестве данных для подпитки ИИ.
Как объясняет Creative Commons в посте в блоге, продолжающийся сбор данных может подорвать открытость интернета и привести к тому, что организации будут закрывать свои сайты или защищать их платным доступом вместо того, чтобы делиться своими данными.
С другой стороны, проект CC signals направлен на создание юридического и технического решения, которое обеспечит основу для обмена наборами данных между теми, кто контролирует данные, и теми, кто использует их для обучения ИИ.
Спрос на такой инструмент растёт по мере того, как компании пытаются изменить свою политику и условия предоставления услуг, чтобы либо ограничить обучение ИИ на своих данных, либо объяснить, в какой степени они будут использовать данные пользователей в целях, связанных с ИИ.
Например, компания X сначала внесла изменение, которое позволяло третьим лицам обучать свои модели на её общедоступных данных, а затем отменила это. Reddit использует файл robots.txt, который предназначен для того, чтобы сообщать автоматическим поисковым роботам, могут ли они получить доступ к сайту, чтобы запретить ботам собирать данные для обучения ИИ. Cloudflare ищет решение, которое будет взимать плату с ботов за сбор
Читать на habr.com