Об этом же в других СМИ

gagadget.com / 2 месяца назад

Alibaba слила секрет Samsung: на платформе обнаружены защитные чехлы для широкоформатного складного флагмана Galaxy Z Fold8 Wide

habr.com / 2 месяца назад

Почему собственный DevSecOps обходится дороже, чем кажется

gagadget.com / 2 месяца назад

Очки Alibaba Qwen AI Glasses S1 научились давать советы без вопросов

ilenta.com / 2 месяца назад

Почему ремонт Samsung обходится дороже iPhone даже со страховкой

gagadget.com / 2 месяца назад

Ремонт Samsung обходится на 60% дороже чем iPhone: цифры, заставляющие задуматься

Больше по теме

21.04.2026 - 15:43 / habr.com

Alibaba vs Google: Qwen3.6-35B-A3B обходит Gemma 4-31B в кодинге, эрудиции и математике

Опенсорсная модель Qwen3.6-35B-A3B, которая имеет архитектуру mixture-of-experts и была опубликована Alibaba 15 апреля, уверенно обошла недавнюю новинку от Google, Gemma 4-31B, в ключевых бенчмарках на агентное программирование и математическую логику.

На данный момент исходники и веса модели опубликованы на профильных площадках вроде Hugging Face и ModelScope с лицензией Apache 2.0.

Главная фишка Qwen3.6-35B-A3B кроется в её невероятной эффективности: во время каждого отдельного этапа генерации из 35 млрд параметров модель активирует всего 3. Такой подход радикально снижает требования к вычислительным мощностям.

Инженеры Alibaba приложили наглядные результаты тестирования. Если столкнуть Qwen3.6 и Gemma 4-31B в испытаниях для ИИ-агентов, китайская модель забирает лидерство буквально в каждом пункте:

На SWE-bench Verified (проверка способности ИИ самостоятельно фиксить реальные баги из GitHub-репозиториев) Qwen3.6 выбивает 73,4 балла, против скромных 52,0 у Gemma 4.

В тесте Terminal-Bench 2.0, заточенном на работу в терминале и автономное выполнение консольных задач, счёт составляет 51,5 против 42,9 в пользу новинки от Alibaba.

Помимо написания кода, Qwen3.6-35B-A3B неплохо прокачалась в сложных “мыслительных” дисциплинах. В строгом аспирантском тесте на эрудицию GPQA модель набирает 86 баллов (против 84,3 у Gemma), а в математическом турнире AIME26 доходит до отметки 92,7 (против 89,2). Более того, по заявлениям самих разработчиков, в задачах, связанных с распознаванием и анализом изображений и видео, нейросеть вполне уверенно держится на одном уровне с признанным лидером в этом сегменте – Claude Sonnet 4.5.

Особенностью архитектуры является поддержка двух режимов работы: полноценного “думающего” (когда ИИ выстраивает длинную

технологии спорт самит Apache google крипто dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Ask YouTube – Google учит видеоплатформу давать пошаговые ответы с фрагментами роликов habr.com / 2 месяца назад

OpenAI снова убила Codex – GPT-5.5 навсегда поглотила отдельную модель для кодинга habr.com / 2 месяца назад

Google инвестирует 40 млрд $ в Anthropic, оценивая её в 350 млрд $ habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 17:13

технологии Xiaomi закон Android обновления Без сюрпризов, но с Android 17: Xiaomi начала глобальное развертывание обновления HyperOS 3.3

Xiaomi начала публичное развертывание обновления HyperOS 3.3 для некоторых своих флагманских смартфонов, переводя их на операционную систему Android 17. Тестовый период данной версии, судя по всему, завершен. В числе первых устройств, получающих апдейт, оказались модели серий Xiaomi 17 и Xiaomi 15T Pro.

15.07 / 17:13

спорт общество nintendo FromSoftware приглашает владельцев Nintendo Switch 2 на публичное тестирование экспериментального PvPvE-экшена The Duskbloods

Студия FromSoftware обещала провести публичное тестирование экспериментального PvPvE-экшена The Duskbloods и сегодня японские разработчики сообщили, когда пользователи Nintendo Switch 2 смогут опробовать новый эксклюзив.

15.07 / 17:10

продукты люди здоровье дети общество Сколько яиц нужно обязательно съедать в неделю и зачем

Яйца снабжают организм качественным белком, витаминами, минералами и антиоксидантами, а потому отказываться от них нельзя ни на одной диете.

15.07 / 17:10

здоровье спорт общество семья мозг Как моментально улучшить работу мозга - лучшие дыхательные упражнения

Дыхательная гимнастика может не только улучшить ваше здоровье и работу внутренних органов, но и "подстегнуть" умственную деятельность.

15.07 / 17:09

бизнес продукты технологии экономика льготы В GlowByte состоялась встреча экспертного сообщества BGP Litigation

30 июня в офисе GlowByte состоялась встреча резидентов IP-клуба BGP Litigation. Участниками мероприятия стали руководители юридических подразделений, ведущие юристы и признанные эксперты в области права из числа системообразующих компаний различных отраслей российской экономики, в том числе ритейла, фармацевтики, информационных технологий, финансов.

15.07 / 17:09

Facebook общество Meta* удалила спорную функцию, которая позволяла генерировать ИИ‑изображения на основе чужих фото в Instagram**

Meta* удалила функцию ИИ‑генератора Muse Image, позволявшую пользователям редактировать и использовать фотографии из публичных аккаунтов Instagram* без каких‑либо уведомлений авторам снимков.

15.07 / 17:09

реклама связь дети общество политика Минцифры РФ предложило блокировать услуги связи на детских сим-картах при нулевом балансе

Минцифры России подготовило проект постановления правительства об ограничениях для детских сим-карт. Документ опубликован на портале проектов нормативных правовых актов. Проект вводит автоматическую блокировку услуг связи при нулевом балансе. Правило будет действовать для номеров, которые оформлены на ребёнка младше 18 лет, а также для сим-карт, которые родитель передал несовершеннолетнему. Мера касается авансовой системы расчётов. В этом случае абонент сначала пополняет счёт, а затем расходует средства.

15.07 / 17:09

связь технологии Путешествия экспедиция ликвидация Индийский телеком‑оператор BSNL представил спутниковый телефон стоимостью около $1400

Государственный телеком‑оператор Индии BSNL представил спутниковый телефон стоимостью 134 166 рупий (~$1400 с учётом налогов). Устройство рассчитано на использование в местах, где нет покрытия обычных сотовых сетей.

15.07 / 17:08

Samsung технологии семья самит FLEX Samsung представила технологию Flex Titanium: складные смартфоны станут прочнее, тоньше и почти избавятся от складки на экране

В прошлом году Galaxy Z Fold7 получил шарнир третьего поколения Armor FlexHinge, который оказался на 27% тоньше и на 43% легче по сравнению с механизмом Galaxy Z Fold6. Теперь Samsung делает следующий шаг, совершенствуя уже не только шарнир, но и саму конструкцию дисплея.

15.07 / 16:36

люди ученые общество вирус человек Малоизвестные факты о комарах, которые удивили ученых

Комары скрывают немало удивительных особенностей, которые долгое время оставались неизвестны большинству людей.

Лента новостей

На главную страницу