



EFF: блокировка контента для интернет-архивов не остановит ИИ, но сотрёт исторические записи
Старший аналитик по вопросам политики Фонда электронных рубежей (Electronic Frontier Foundation, EFF) Джо Маллин затронул проблему защиты контента издателей от ИИ-ботов в контексте сохранения цифрового наследия.
«Представьте себе, что издатель газеты объявляет о том, что больше не позволит библиотекам хранить копии своей газеты», — пишет он.
По мнению Маллина, именно это и начало происходить в интернете в последние несколько месяцев.
Аналитик напомнил, что Интернет-архив — крупнейшая в мире цифровая библиотека — хранит цифровые копии газет с момента своего запуска в середине 1990-х годов.
Но в последние месяцы The New York Times начала блокировать индексацию своего веб-сайта со стороны архива, используя технические меры, выходящие за рамки традиционных правил robots.txt. Другие газеты, включая The Guardian, похоже, следуют этому примеру, отмечает Маллин.
«На протяжении почти трёх десятилетий историки, журналисты и широкая публика полагались на Интернет-архив для сохранения новостных сайтов в том виде, в котором они были опубликованы в сети. Эти архивные страницы часто являются единственным надёжным свидетельством того, как статьи были опубликованы изначально. Во многих случаях статьи редактируются, изменяются или удаляются — иногда открыто, иногда нет. Интернет-архив часто становится единственным источником для просмотра этих изменений. Когда крупные издательства блокируют поисковые роботы архива, эта историческая запись начинает исчезать», — пишет аналитик.
Газета The Times объясняет свои шаги защитой от веб-скрейперов, которые действуют в интересах ИИ-компаний. СМИ уже подали не один иск в суды по поводу нарушений прав на свой контент.
«Каким бы ни был исход этих судебных процессов, блокировка некоммерческих архивистов —
Читать на habr.com