Об этом же в других СМИ

habr.com / 1 год назад

OpenAI использует стандарт конкурирующей компании Anthropic для подключения моделей AI к данным

habr.com / 1 год назад

Показатели лучших моделей OpenAI рухнули в новом бенчмарке ARC-AGI-2

habr.com / 1 год назад

Google представляет новое поколение моделей рассуждений Gemini 2.5

habr.com / 1 год назад

Open-Sora 2.0: новая система в видео-AI снижает стоимость обучения при сохранении качества

habr.com / 1 год назад

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

Больше по теме

10.03.2025 - 18:20 / habr.com

Новая модель Alibaba с открытым исходным кодом QwQ-32B: конкурент DeepSeek?

Qwen Team , подразделение китайского гиганта электронной коммерции Alibaba , разрабатывающее растущее семейство моделей большого языка (LLM) Qwen с открытым исходным кодом, представило QwQ-32B — новую модель рассуждений с 32 миллиардами параметров, предназначенную для повышения производительности при решении сложных задач с помощью обучения с подкреплением (RL).

Модель доступна как open-weight на Hugging Face и ModelScope по лицензии Apache 2.0. Это означает, что она доступна для коммерческого и исследовательского использования, поэтому предприятия могут немедленно использовать ее для питания своих продуктов и приложений (даже тех, за использование которых они взимают плату с клиентов).

Напомним, предыдущая модель - QwQ была впервые представлена Alibaba в ноябре 2024 года как модель рассуждений с открытым исходным кодом, призванная конкурировать с o1-preview от OpenAI.

Первоначальная версия QwQ, выпущенная еще в ноябре 2024 года (называемая просто «QwQ»), также имела 32 миллиарда параметров и длину контекста в 32 000 токенов. Alibaba подчеркнула свою способность превосходить o1-preview в математических бенчмарках, таких как AIME и MATH, а также в задачах на научное рассуждение, таких как GPQA.

Несмотря на свои сильные стороны, ранние итерации QwQ боролись с такими бенчмарками программирования, как LiveCodeBench, где модели OpenAI сохраняли преимущество. Кроме того, как и многие новые модели рассуждений, QwQ столкнулся с такими проблемами, как смешивание языков и периодические циклические рассуждения.

Однако решение Alibaba выпустить модель под лицензией Apache 2.0 гарантировало разработчикам и предприятиям возможность свободно адаптировать и коммерциализировать ее, что отличало ее от проприетарных альтернатив, таких как o1 от

продукты Nvidia общество предприятия Apache крипто dilnaz04 eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Pruna AI создает свой фреймворк оптимизации открытым исходным кодом habr.com / 1 год назад

Nvidia представляет Groot N1 — базовую модель для гуманоидной робототехники habr.com / 1 год назад

Новая модель искусственного интеллекта Stability AI превращает фотографии в 3D-сцены habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

07.07 / 11:47

продукты люди недвижимость ликвидация гигиена Зона риска – на что на кухне обратить особое внимание

Для мытья подходят стандартные обезжиривающие составы или мыльная вода. Метод безопасен для конструкций из ламината и натурального дерева.

07.07 / 11:47

продукты здоровье общество самит питание Продукты, которые разрушают вашу печень, назвали эксперты

Как сохранить печень здоровой и избежать опасных болезней, рассказали специалисты.

07.07 / 11:39

футбол самит Здоровье и красота мозг валюта Секретная комната Claude: ученые нашли, где ИИ «думает» перед тем, как выдать ответ

Мы привыкли воспринимать большие языковые модели как очень продвинутый «Т9» — статистическую машину, которая просто угадывает следующее слово. Однако свежее исследование внутренних процессов Claude от компании Anthropic доказывает, что внутри нейросетей формируются значительно более сложные структуры. Ученые выявили так называемое J-space — специфический набор нейронных состояний, который выполняет роль «внутреннего черновика» или рабочего пространства для размышлений, скрытого от глаз пользователя.

07.07 / 11:39

технологии экономика интересное Британский взгляд на бюджетный смартфон: представлен Nothing Phone (4b) со скромными характеристиками, но интересным дизайном и привлекательной ценой

Компания Nothing провела презентацию своего ультрабюджетного (по меркам западного рынка) смартфона Phone (4b), о котором в последнее время появлялось много информации. По сути, он является заменой недавно отмененного смартфона аналогичной категории от суббренда CMF и вполне может получить большую популярность на фоне стремительного подорожания флагманов и субфлагманов.

07.07 / 11:39

связь технологии Стильно, ярко и недорого: Nothing выпустила бюджетные наушники ear (3a) со встроенной памятью и возможностью записи звонков

Одновременно с презентацией бюджетного смартфона Phone (4b), компания Nothing представила и TWS-наушники этой же ценовой категории. Новинка получила название Nothing ear (3a), доступна в ярких цветах и предлагает базовые функции, не сравнимые с премиальными моделями, но их будет вполне достаточно для повседневного использования.

07.07 / 11:13

технологии общество отдых депрессия врачи Почему после 40 лет многие начинают просыпаться раньше - ответ врачей

Врачи объяснили, какие процессы в организме влияют на режим сна с возрастом и когда стоит обратиться за помощью.

07.07 / 11:13

политика выплаты финансирование криптовалюта инвестор Grayscale: продажа биткоинов компанией Strategy может помочь рынку сформировать более устойчивое дно

Аналитики Grayscale прокомментировали недавние действия компании Strategy, которая продала биткоины на сумму около $216 млн. По их мнению, этот шаг должен восстановить доверие рынка и может способствовать формированию более устойчивого дна для первой криптовалюты. Оценка новой финансовой политики Strategy В компании отметили, что в целом финансовое состояние Strategy остается сильным. Она владеет биткоинами примерно на $52 млрд при наличии около $7 млрд долга, а ежегодные дивидендные обязательства по привилегированным акциям состав

07.07 / 11:11

происшествия расследование Для выделенных серверов Selectel стал доступен IPMI-мониторинг

IPMI (Intelligent Platform Management Interface) — это мониторинг серверов аппаратного уровня, который работает независимо от операционной системы и позволяет удаленно следить за состоянием сервера.

07.07 / 11:11

самит The University of Silicon Valley запустил стипендию, учитывающую ачивки в играх

The University of Silicon Valley теперь рассматривает ваши платины в стиме как академическое достижение: университет запустил стипендию, для получения которой нужно предъявить самые высокие ачивки в разных играх. Учитываются аккаунты в Steam, PSN, Xbox, а в некоторых случаях — собственные платформы игр, например Hoyolab для Genshin Impact.

07.07 / 11:11

дети общество Sony В GitHub в ответ на отказ Sony от дисков предложили разработчикам выслать их код из репозиториев на CD

Платформа GitHub отреагировала на отказ Sony от выпуска физических дисков для PlayStation. Администрация IT-ресурса предложила заполнить специальную форму разработчикам, чтобы выслать их исходные коды из репозиториев на компакт-дисках. Проект GitHub CD будет доступен к выполнению только для 1000 «подходящих заявок».

Лента новостей

На главную страницу