Reddit ограничивает доступ к интернет-архиву Wayback Machine
Wayback Machine из Internet Archive стала очередной жертвой жёстких мер Reddit по ограничению доступа к данным. Компания начала вводить новые ограничения на доступ к архивному сайту, которые значительно ограничат возможности Wayback Machine сохранять информацию из Reddit..
С этим изменением Wayback Machine, проект некоммерческой организации Internet Archive, сможет сканировать только главную страницу Reddit. У него больше не будет доступа к комментариям, страницам сабреддитов, информации о публикациях, профилям и другим данным.
Этот шаг — очередной шаг Reddit в стремлении ограничить возможности компаний, занимающихся искусственным интеллектом, использовать его данные для обучения больших языковых моделей без уплаты лицензионных сборов. Это также существенное отступление от позиции компании, занятой в прошлом году, когда она чётко заявила, что не будет ограничивать «добросовестных участников», включая Internet Archive. Неясно, что изменилось с тех пор. Reddit, по всей видимости, считает, что компании, занимающиеся искусственным интеллектом, обходят его правила, собирая данные с помощью Wayback Machine. Мы обратились в Internet Archive за комментариями.
Лицензирование данных стало важным направлением деятельности Reddit. Компания заключила многомиллионные соглашения с OpenAI и Google, что позволяет им использовать публикации Reddit для обучения моделей искусственного интеллекта. В то же время Reddit занимает всё более жёсткую позицию в отношении компаний, которые пытаются использовать его данные без таких соглашений. Ранее в этом году компания подала иск против Anthropic, обвинив её в многолетнем сборе данных Reddit без разрешения.
Читать на hitechexpert.top

