«Виртуальные пациенты»: Microsoft учится создавать цифровых двойников для моделирования рака
Microsoft Research опубликовала в журнале Cell статью о GigaTIME — мультимодальной AI-системе, которая переводит обычные гистологические слайды (H&E, стоимостью $5-10) в виртуальные изображения с мультиплексной иммунофлуоресценцией (mIF, обычно стоящие тысячи долларов за образец). Система обучена на 40 миллионах клеток из базы Providence и способна генерировать данные по 21 протеиновому каналу — от CD3 и CD8 до PD-L1 и Caspase 3. Это позволяет увидеть, как опухоль взаимодействует с иммунной системой, что критично для предсказания ответа на иммунотерапию.
Исследователи применили GigaTIME к 14 256 пациентам из 51 больницы сети Providence и получили виртуальную популяцию из примерно 300 000 mIF-изображений, охватывающую 24 типа рака и 306 подтипов. Это первое популяционное исследование микроокружения опухоли на основе пространственной протеомики такого масштаба — раньше подобное было невозможно из-за высокой стоимости mIF. Один H&E-слайд обходится в $5-10 и доступен рутинно в онкологической практике, тогда как mIF для пары десятков протеиновых каналов стоит тысячи долларов, и даже самые продвинутые лаборатории едва могут масштабировать его на небольшую часть доступных образцов.
Анализ виртуальной популяции выявил 1 234 статистически значимых ассоциации между активациями белков и ключевыми клиническими атрибутами: биомаркерами (TMB, KRAS, KMT2D), стадированием и выживаемостью пациентов. Независимая валидация на 10 200 пациентах из базы The Cancer Genome Atlas (TCGA) подтвердила результаты — корреляция между виртуальными популяциями Providence и TCGA составила 0.88 по активациям белков на уровне подтипов рака. То есть система не просто подстроилась под конкретные данные подстроилась под конкретные данные Providence, а
Читать на habr.com