Сбер в два раза увеличил контекст GigaChat Lite и GigaChat Pro
Модели GigaChat Pro и GigaChat Lite стали умнее и мощнее по всем основным метрикам для решения задач всех пользователей. Также теперь бизнесу доступна новая модель GigaChat Lite+ с заметно увеличенным контекстом, рассказали в Сбере.
Команда разработчиков обновила и расширила обучающие датасеты, что значительно повысило качество ответов моделей в таких областях, как экономика, право и медицина. Также модели прошли обучение на базе знаний реальных экспертов, в том числе редакторов и художников, благодаря чему улучшился навык создания изображений с помощью Kandinsky.
Размер контекста GigaChat Lite и GigaChat Pro увеличен в два раза — с 4 тыс. до 8 тыс. токенов. Если раньше в один запрос можно было загрузить объём текста, сопоставимый с шестью страницами A4 (шрифт 14 pt), то теперь максимальный объём запроса вырос до 12 страниц. Увеличение контекста позволяет моделям поддерживать более длинные диалоги с пользователем и получать в одном запросе больший объём полезной информации.
GigaChat Lite подойдёт для решения более тривиальных задач, требующих при этом максимальной скорости работы модели и меньших требований к «железу». Новая модель GigaChat Lite+ по всем метрикам совпадает с GigaChat Lite, но размер её контекста расширен до 32 тыс. токенов. GigaChat Pro лучше следует сложным инструкциям и может выполнять более комплексные задачи.
В GigaChat API появилась возможность формировать векторное представление текстов — эмбеддинги. Эмбеддинги используются для оценки смысловой схожести текстов, повышения точности ответов языковой модели и упрощения решения задач поиска и классификации информации.
Модель GigaChat Pro бесплатно доступна всем пользователям через веб-версию, Telegram и «ВКонтакте». Разработчикам и бизнесу все модели
Читать на habr.com

