
Alibaba представила семейство гибридных ИИ-моделей Qwen3
- Alibaba выпустила Qwen3 — серию ИИ-моделей с открытым кодом, включающую архитектуру MoE и поддержку 119 языков.
- Крупнейшая модель Qwen3 превосходит o3-mini от OpenAI и Gemini 2.5 Pro от Google в тестах рассуждения.
- Модели доступны на Hugging Face и GitHub, но версия с 235 млрд параметров пока не вышла в релиз.
Компания Alibaba представила новое семейство больших языковых моделей (LLM) Qwen3, охватывающее модели от 0,6 до 235 млрд параметров. Представители фирмы утверждают, что в ключевых задачах ИИ демонстрирует сравнимые или лучшие результаты по сравнению с решениями от OpenAI и Google.
Большинство моделей распространяются под открытой лицензией и размещены на платформах Hugging Face и GitHub. Они включают в себя гибридный режим рассуждения. Другими словами, модели могут обрабатывать как простые запросы, так и выполнять глубинные вычисления при необходимости, оптимизируя использование ресурсов.
Некоторые версии LLM построены по архитектуре MoE (Mixture of Experts), распределяющей задачи между специализированными подмоделями. По заявлению компании, объем обучающих данных составил почти 36 трлн токенов, включая учебные материалы, код, Q&A и синтетические данные.
Согласно результатам тестирования на Codeforces и AIME крупнейшая модель Qwen3 обошла o3-mini и Gemini 2.5 Pro. Однако версия с 235 млрд параметров пока недоступна. На открытом рынке главной моделью остается Qwen3-32B, которая превосходит o1 от OpenAI в ряде кодинговых бенчмарков.
Что такое машинное обучение? Все, что вам нужно знать 07.10.2023 37 мин 6402 читатьМодели Qwen3 уже доступны через облачные платформы Fireworks AI и Hyperbolic, отметили в компании. Аналитики считают, что несмотря на экспортные ограничения, китайские разработчики ИИ все чаще выходят на
Читать на incrypted.com
