Cisco выпустила открытый инструмент «для отслеживания происхождения моделей ИИ»
Компания Cisco выпустила инструмент с открытым исходным кодом для отслеживания происхождения моделей ИИ и сравнения их сходств, что обеспечивает высокую прозрачность цепочки поставок ИИ.
Инструмент Model Provenance Kit представляет собой набор инструментов на языке Python и интерфейс командной строки (CLI), который анализирует такие сигналы, как метаданные и веса, для создания «отпечатка» моделей ИИ. Затем его можно сравнить с отпечатками других моделей, чтобы определить потенциальное общее происхождение.
«Представьте Model Provenance Kit как ДНК-тест для моделей ИИ. Подобно тому, как ДНК-тест выявляет биологическое происхождение, Model Provenance Kit анализирует как метаданные, так и фактические параметры модели, прошедшие обучение (подобно уникальному геному, из которого состоит модель), чтобы оценить, имеют ли модели общее происхождение, и выявить признаки модификации», — отметили исследователи Cisco.
Инструмент призван устранить пробелы в прозрачности цепочки поставок моделей ИИ. Например, многие организации используют модели с открытым исходным кодом из таких репозиториев, как HuggingFace, где модели потенциально могут быть загружены с неполной или вводящей в заблуждение документацией.
Инструментарий работает в два этапа и имеет два разных режима: сравнение и сканирование. В режиме сравнения пользователь может выбрать две модели для сравнения и получить разбивку оценок сходства по метрикам, включая метаданные, структуру токенизатора и сигналы уровня весов, а также итоговую сводную оценку; если эта итоговая оценка превышает определенный порог, модели считаются связанными.
В режиме сканирования одна модель может быть сравнена с базой данных известных отпечатков для примерно 150 различных базовых моделей из более чем 45
Читать на habr.com