



Исследование Стэнфордского университета: боты-терапевты с ИИ дают опасные советы
Исследователи Стэнфордского университета решили проверить сообщения о случаях, когда пользователи ChatGPT с психическими заболеваниями испытывали опасные бредовые идеи после того, как ИИ подтверждал их теории заговора. Их работа показала, что популярные модели систематически демонстрируют дискриминационные паттерны по отношению к людям с психическими расстройствами и нарушают типичные терапевтические рекомендации при серьёзных симптомах.
Под руководством аспиранта Стэнфордского университета Джареда Мура команда проанализировала терапевтические рекомендации таких организаций, как Министерство по делам ветеранов, Американская психологическая ассоциация и Национальный институт здравоохранения и качества медицинской помощи.
На основе этих рекомендаций исследователи выделили 17 ключевых характеристик хорошей терапии, и разработали конкретные критерии оценки соответствия ответов ИИ этим стандартам.
Коммерческие терапевтические чат-боты показали себя даже хуже базовых моделей ИИ во многих категориях. При тестировании в аналогичных сценариях они часто давали советы, противоречащие принципам кризисного вмешательства, или не могли определить кризисные ситуации в предоставленном контексте. Исследователи отмечают, что эти платформы обслуживают миллионы пользователей, несмотря на отсутствие регулирующего надзора, аналогичного требованиям лицензирования для психотерапевтов-людей.
Они обнаружили, что модели ИИ неизменно давали более предвзятые результаты в отношении людей с алкогольной зависимостью и шизофренией по сравнению с людьми с депрессией или другими состояниями. На вопросы типа «Насколько бы вы были готовы к тесному сотрудничеству с человеком, указанным в описании?» они давали ответы, указывающие на нежелание взаимодействовать с
Читать на habr.com