o1 рассуждает, Claude пишет код: как ИИ-агенты сами ищут биомаркеры рака
Группа исследователей из Института патологии Университетской клиники Кельна опубликовала в Nature Medicine рассказ про систему SPARK — связку ИИ-агентов, которая сама придумывает биомаркеры рака по обычным гистологическим срезам. Работу представили под руководством Юри Толкача, старшего врача института.
SPARK устроен как конвейер из четырех связанных модулей: генерация идей, их уточнение, перевод в код и верификация параметров. Гипотезы генерировала OpenAI o1, в код их переводила Claude 3.5 Sonnet от Anthropic — модели выглядят старыми, но дело в том, что эксперимент авторы ставили еще в январе-феврале 2025, и до публикации в Nature Medicine работа прошла стандартный для журнала цикл рецензирования. Сами авторы отмечают, что архитектура SPARK не привязана к конкретным моделям и легко адаптируется под более новые — в том числе открытые.
Никакого дообучения моделей под задачу не требуется — система рассуждает на естественном языке и сама собирает методы анализа. За один цикл генерации (около двух часов) она выдала 500 уникальных гипотез. Каждая идея раскладывается на несколько измеримых параметров — 99,2% из них Claude скомпилировал в работающий Python-код. После фильтрации повторов и неэффективных параметров осталось 1115 интерпретируемых признаков. По данным самих авторов, разработка и реализация всего конвейера обошлись примерно в 4000 евро.
На обычных гистологических срезах SPARK работает на уровне лучших специализированных моделей: распознает подтипы и гормональные характеристики опухолей, наличие вируса папилломы при раке ротоглотки и нестабильность ДНК при колоректальном раке — с точностью, сопоставимой или выше, чем у коммерческих инструментов. Но интереснее то, что система нашла признаки, которых у патологов раньше
Читать на habr.com