

Galileo предлагает инструменты для оценки работы AI-агентов
Galileo, стартап из Сан-Франциско, делает ставку на то, что будущее искусственного интеллекта зависит от доверия. Сегодня компания выпустила новый продукт Agentic Evaluations, чтобы решить растущую проблему в мире AI: обеспечить, чтобы всё более сложные системы, известные как AI-агенты, действительно работали по назначению.
AI-агенты набирают популярность во всех отраслях. Но их быстрое внедрение поднимает важный вопрос: как компании могут убедиться, что эти системы остаются надёжными после внедрения? Генеральный директор Galileo Викрам Чаттерджи считает, что его компания нашла ответ.
«За последние шесть-восемь месяцев мы начали замечать, что некоторые из наших клиентов пытаются внедрить агентские системы, — сказал Чаттерджи в интервью. — Теперь LLM можно использовать в качестве интеллектуального маршрутизатора, чтобы выбирать правильные вызовы API для выполнения задачи. Переход от простого генерирования текста к выполнению задачи - это очень большой шаг вперёд».
Крупные предприятия, такие как Cisco и Ema, уже внедрили платформу Galileo. Эти компании используют AI-агентов для автоматизации задач, от поддержки клиентов до финансового анализа, и сообщают о значительном повышении производительности.
«В противном случае торговому представителю, который пытается наладить контакт с потенциальными клиентами, потребовалось бы на это около недели, в то время как с помощью некоторых из этих агентов он делает это за два дня или даже меньше», — объяснил Чаттерджи, подчеркнув окупаемость инвестиций для предприятий.
Новая платформа Galileo оценивает качество выбора инструментов, выявляет ошибки в вызовах инструментов и отслеживает общую успешность сеанса. Она также отслеживает основные показатели для крупномасштабного внедрения AI, включая
Читать на habr.com
