Hugging Face работает над копированием возможностей OpenAI Deep Research с помощью агента AI с открытым исходным кодом
Команда Hugging Face под руководством главного научного сотрудника Томаса Вольфа создала версию системы Deep Research OpenAI с открытым исходным кодом за 24 часа.
Согласно блогу Hugging Face , они стремятся сделать фирменную технологию доступной для всех, копируя агентскую структуру, лежащую в основе OpenAI Deep Research. Команда разработала свою систему для написания программного кода напрямую, а не с использованием JSON для действий. Такой подход сокращает этапы обработки примерно на 30%, что приводит к снижению затрат и повышению производительности по сравнению с традиционными языковыми моделями.
Для фактической реализации команда позаимствовала два ключевых элемента из агентской среды Magentic-One от Microsoft : текстовый веб-браузер для поиска и текстовый инспектор, который может читать различные форматы файлов.
Команда оценила свою систему с помощью бенчмарка GAIA , который проверяет, как агенты AI справляются со сложными исследовательскими задачами. Один из примеров спрашивает: «Какие из фруктов, показанных на картине 2008 года «Вышивка из Узбекистана», подавались в качестве части меню завтрака в октябре 1949 года для океанского лайнера, который позже использовался в качестве плавучего реквизита для фильма «Последнее путешествие»? Приведите элементы в виде списка, разделенного запятыми, упорядочив их по часовой стрелке на основе их расположения на картине, начиная с позиции 12 часов. Используйте множественное число каждого фрукта».
Чтобы решить эту головоломку, AI-агенту необходимо определить фрукты на картине с помощью обработки изображений, определить, какой океанский лайнер появился в фильме, найти меню завтрака 1949 года и представить информацию в требуемом формате
Система Hugging Face набрала 55,15 процентов на
Читать на habr.com
