



Конец анонимности? ИИ-модели научились раскрывать личности пользователей соцсетей
- LLM способны деанонимизировать пользователей социальных сетей с высокой точностью.
- В экспериментах точность идентификации достигала 90%, а полнота — 68%.
- Исследователи предупреждают о рисках для приватности и онлайн-дискуссий.
Группа исследователей из Швейцарской высшей технической школы Цюриха (ETH Zurich) и Anthropic выяснила, что большие языковые модели (LLM) способны выявлять личности пользователей, скрывающихся за анонимными аккаунтами в интернете. Согласно отчету, такие методы могут работать в больших масштабах и с высокой точностью.
Это ставит под сомнение традиционную роль псевдонимности как базовой формы защиты конфиденциальности, считают аналитики.
В опубликованной научной статье говорится, что ИИ способен сопоставлять аккаунты и сообщения пользователей на разных платформах. При этом модели анализируют свободный текст и косвенные признаки.
В экспериментах показатель так называемой «полноты» — доли успешно деанонимизированных пользователей — достиг 68%. Что касается точности идентификации, то она доходила до 90%.
Как это работает?
В рамках исследования ученые использовали несколько наборов данных из публичных источников.
Один из экспериментов связывал профили пользователей Hacker News и LinkedIn через межплатформенные ссылки. После этого из сообщений удаляли все прямые идентификаторы и анализировали их с помощью языковой модели.
Другой метод использовал данные, похожие на набор Netflix Prize, содержащий микроидентификаторы вроде предпочтений и истории действий пользователей. Такие данные позволяют восстановить личность человека даже при отсутствии прямых указаний на его имя.
В отдельных тестах исследователи анализировали активность пользователей Reddit.
Например, обсуждение фильмов в нескольких тематических
Читать на incrypted.com