Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek
- Alibaba Qwen представила флагманскую модель Qwen2.5-Max.
- Она превосходит по производительности ряд других решений, включая GPT-4o и DeepSeek-V3.
- Однако повторного обвала на рынках не произошло.
Подразделение компании Alibaba Group — Alibaba Qwen — представило новую ИИ-модель под названием Qwen2.5-Max. В организации заявили, что она превосходит по показателям такие решения, как GPT-4o, DeepSeek-V3, Llama-3.1-405B и Claude 3.5 Sonnet.
Согласно официальному релизу, это модель была обучена на более чем 20 трлн токенов с использованием методик supervised fine-tuning (SFT) и подкрепления на основе отзывов (RLHF).
Для оценки производительности решения разработчики использовали ряд бенчмарков. Это, в частности, MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Результаты оценки новой ИИ-модели представлены ниже:
Новая модель уже доступна в интерфейсе Qwen Chat. API решения можно использовать через сервис Alibaba Cloud Model Studio.
Отметим, ранее компания представила еще одну модель — Qwen2.5-VL. Она предназначена для анализа текста и изображений. Она также доступна в Qwen Chat.
Qwen2.5-Max уже не вызвала такой реакции фондового и криптовалютного рынков, как DeepSeek-R1. В частности, акции NVIDIA никак не отреагировали на событие после обвала 27 января 2025 года.
При подготовке этого материала они торгуются по $129:
Читать на incrypted.com