Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных
Расширенная генерация на основе поиска (RAG) по-прежнему является неотъемлемой частью современного увлечения агентским ИИ. Воспользовавшись сохраняющимся интересом к агентам, Cohere выпустила последнюю версию своей модели встраивания с более длинными контекстными окнами и большей мультимодальностью.
Cohere’s Embed 4 основан на мультимодальных обновлениях Embed 3 и добавляет больше возможностей для работы с неструктурированными данными. Благодаря контекстному окну на 128 000 токенов организации могут создавать вложения для документов объемом около 200 страниц.
«Существующие встраиваемые модели не способны изначально понимать сложные мультимодальные бизнес-материалы, из-за чего компаниям приходится разрабатывать громоздкие конвейеры предварительной обработки данных, которые лишь незначительно повышают точность, — написал Кохере в своём блоге. — Embed 4 решает эту проблему, позволяя предприятиям и их сотрудникам эффективно находить идеи, скрытые в горах информации, которую невозможно найти с помощью поиска».
Предприятия могут развернуть Embed 4 в частных виртуальных облаках или локальных технологических стеках для дополнительной защиты данных.
Компании могут генерировать вложения для преобразования своих документов или других данных в числовые представления для обычных случаев. Затем агенты могут ссылаться на эти вложения, чтобы отвечать на запросы.
По словам компании, Embed 4 «превосходит конкурентов в регулируемых отраслях», таких как финансы, здравоохранение и производство. Компания Cohere, которая в основном специализируется на корпоративных сценариях использования ИИ, заявила, что её модели учитывают потребности в безопасности регулируемых отраслей и хорошо понимают бизнес.
Компания обучила Embed 4 «устойчивости к помехам в
Читать на habr.com