ИИ-агент OpenCUA против Anthropic и OpenAI: опенсорс подбирается вплотную
Новый исследовательский проект специалистов из Гонконгского университета (ГУ) и их партнеров предлагает открытую программную платформу для создания надежных ИИ‑агентов, способных управлять компьютером. Этот фреймворк, получивший название OpenCUA, объединяет инструменты, массивы данных и методики, позволяющие масштабировать разработку computer‑use agents (CUA) — агентов, осваивающих компьютер так же свободно, как человек.
Модели, обученные в рамках OpenCUA, демонстрируют впечатляющие результаты на специализированных тестах: они не только обходят существующие опенсорс‑решения, но и практически вплотную приближаются к закрытым системам лидеров индустрии — OpenAI и Anthropic.
Computer‑use agents изначально задумывались как автономные помощники, которые могут выполнять на компьютере любые задачи — от серфинга по сайтам до работы в сложных программах. Они способны брать на себя рутину и автоматизировать корпоративные процессы. Но самые мощные из таких систем остаются закрытыми: их архитектуры, данные для обучения и методы разработки держатся в секрете.
«Недостаток прозрачности сдерживает прогресс и порождает вопросы безопасности. Научному сообществу необходимы по‑настоящему открытые CUA‑фреймворки, чтобы исследовать их возможности, слабые места и потенциальные риски», — пишут авторы статьи.
Однако и в открытом мире хватает проблем: до сих пор не существовало масштабируемой инфраструктуры для сбора больших и разнообразных массивов данных, необходимых для обучения агентов. Открытые датасеты для графических интерфейсов оказывались слишком малы, а исследования часто описывали методы так скупо, что их невозможно было воспроизвести.
Авторы отмечают: «Все эти ограничения вместе замедляют развитие универсальных CUA и мешают полноценному
Читать на habr.com