Что такое Open Source AI: новая версия определения OSI
Open Source Initiative уже какое-то время работает над определением того, что можно называть Open Source AI. На днях вышла обновлённая версия документа — v. 0.0.9. В ней появились абзац, объясняющий термин «ИИ-система», и уточнение того, что открытость данных для обучения — параметр необязательный, но крайне полезный.
На текущий момент нет зафиксированной договорённости по тому, что считать за Open Source в отношении ИИ (Open Source AI Definition). Золотое правило из манифеста GNU, гласящее «если мне нравится программа, то я должен обмениваться ею с другими людьми, которым она нравится», смутно подходит современным AI-системам. Что должно быть «открыто», чтобы ИИ-продукт считался Open Source? Достаточно ли доступа к уже обученной модели, как в случае с Llama 2? Или нужно публиковать данные, на которых обучалась модель?
Разработчикам и пользователям ИИ-инструментов важны беспрепятственное переиспользование уже готовых решений, возможность их совместного улучшения и другие преимущества Open Source. Наличие чёткого определения, что подходит под эту характеристику, а что нет, поможет обеспечить нужную индустрии ясность.
У OSI уже есть документ, определяющий термин Open Source, и подборка лицензий, которые ему соответствуют. Но Open Source AI Definition определено не до конца. Для разработки термина OSI привлекла большую группу исследователей, активистов, юристов и представителей больших технологических компаний. Также идеи для каждой итерации обсуждаются с сообществом на конференциях и открытых встречах.
Команда OSI посчитала, что Open Source-сообщество не должно придумывать своё определение термина «AI-система». После рассмотрения существующих вариантов была выбрана формулировка Организации экономического сотрудничества и
Читать на habr.com
