Нейросети Гарварда показали рекордные результаты в диагностике
ИИ от OpenAI в 67% случаев ставит точный диагноз, опережая врачей Гарварда на этапе сортировки пациентов, согласно новому исследованию.
Современные технологии продолжают бросать вызов традиционной медицине. Группа ученых из Гарвардской медицинской школы и Медицинского центра Бет-Исраэль Диконесс провела масштабный эксперимент, целью которого было сравнение диагностических способностей нейросетей OpenAI и квалифицированных врачей-терапевтов. Результаты работы оказались впечатляющими: ИИ не только не уступил людям, но и в ряде случаев продемонстрировал более высокую точность.
Об этом пишет TechCrunch.
Ход эксперимента и методология
В центре внимания исследователей оказались истории болезни 76 реальных пациентов, поступивших в отделение неотложной помощи. Ученые решили столкнуть лбами две модели — OpenAI o1 и GPT-4o — с профессиональным опытом двух лечащих врачей.
Чтобы исключить предвзятость, оценивали результаты «слепым» методом: сторонние эксперты анализировали предложенные варианты диагнозов, не зная, кто их автор — человек или алгоритм. Важно отметить, что нейросети работали в тех же условиях, что и медики: им предоставлялись «сырые» данные из электронных медицинских карт без какой-либо предварительной обработки.
Результаты: где ИИ оказался сильнее?
Наибольший разрыв в качестве работы проявился на начальном этапе — при сортировке пациентов. В условиях дефицита информации, когда специалисту нужно максимально быстро принять решение, модель o1 показала себя наиболее эффективно.
- Точность ИИ (модель o1): 67% случаев постановки «точного или очень близкого к точному» диагноза.
- Точность врачей: один специалист показал результат в 55%, другой — в 50%.
Как отметили авторы работы, на каждом этапе диагностического
Читать на cursorinfo.co.il

