
Википедия в эпоху LLM: когда ИИ начинает влиять на коллективный разум
Большие языковые модели (LLM), которые буквально за последние пару лет научились писать тексты почти как человек, теперь начинают активно взаимодействовать с крупнейшей онлайн-энциклопедией в мире — Википедией. Исследователи из Китая решили разобраться, что происходит, когда ИИ встречается с коллективным разумом тысяч добровольцев.
"Самое интересное здесь — это своего рода замкнутый круг", — поясняют авторы исследования. LLM учатся на статьях Википедии, а затем начинают сами влиять на ее контент. Это создает риск того, что качество знаний может пострадать из-за "гомогенизации" или внедрения специфических для ИИ предубеждений. А ведь именно Википедия лежит в основе множества современных задач на естественном языке, от машинного перевода до систем генерации ответов.
Что выяснили исследователи?
Команда ученых провела масштабный анализ влияния LLM на Википедию за период с 2020 по 2025 год. Они сосредоточились на нескольких ключевых аспектах:
Лексические изменения. Оказалось, что частота использования некоторых слов, таких как "crucial" и "additionally", заметно увеличилась. Эти термины часто встречаются в текстах, написанных или отредактированных LLM. По оценкам, это влияние составляет от 1% до более чем 2% в отдельных категориях.
Дело в том, что такие изменения могут сигнализировать о постепенной трансформации языка Википедии под влиянием ИИ. Например, если раньше статьи писались живым языком с использованием разговорных оборотов, то теперь тексты становятся более формализованными и структурированными.
Лингвистический стиль. Тексты, обработанные LLM, стали немного менее удобочитаемыми по традиционным формулам, например, по индексу Флеша-Кинкейда. Также наблюдается снижение использования вспомогательных глаголов — это
Читать на habr.com
