Google представляет MedGemma — набор моделей ИИ с открытым исходным кодом для медицинских приложений
Google Research и DeepMind выпустили MedGemma — коллекцию моделей искусственного интеллекта с открытым исходным кодом, созданных специально для использования в медицине.
Семейство MedGemma включает в себя модель 4B, которая может работать с текстом, изображениями или с тем и другим одновременно, а также более крупную версию 27B, которая работает только с текстом и поддерживает мультимодальные форматы. Компания Google представила эту коллекцию на конференции I/O в этом году.
MedGemma предназначена для использования в различных областях медицины, включая радиологию, дерматологию, гистопатологию и офтальмологию. По словам представителей Google, эти модели могут служить основой для новых инструментов искусственного интеллекта в здравоохранении и работать как самостоятельно, так и в составе систем на основе агентов.
В техническом отчёте указано, что MedGemma обеспечивает значительные улучшения по сравнению с базовыми моделями аналогичного размера. При решении специализированных медицинских задач модели обеспечивают на 10% более высокую точность в мультимодальных вопросах и ответах, на 15,5–18,1% более высокие результаты при классификации рентгеновских снимков и на 10,8% более высокую точность при сложных оценках на основе агентов.
Об этом свидетельствуют результаты тестов. На платформе MedQA, где проверяются вопросы для медицинских экзаменов, модель 4B достигает точности в 64,4% по сравнению с 50,7% у базовой модели. Версия 27B набирает 87,7% по сравнению с 74,9%.
MedGemma также превосходит базовую модель по результатам медицинских тестов. При тестировании на наборе данных MIMIC-CXR, содержащем рентгеновские снимки и отчёты, версия 4B показала макропоказатель F1 88,9 по сравнению с 81,2 у оригинальной модели Gemma 3 4B. Показатель
Читать на habr.com