Об этом же в других СМИ

habr.com / 1 год назад

Skyworth представил G7F Pro: умный телевизор со встроенным DeepSeek

habr.com / 1 год назад

Регулятор из Южной Кореи: когда пользователи получали доступ к DeepSeek, их информация также передавалась в ByteDance

habr.com / 1 год назад

DeepSeek удивляет мир AI моделями, работающими с меньшими затратами, чем у конкурентов

habr.com / 1 год назад

Xiaomi внедрит в своего голосового ассистента поддержку DeepSeek-R1

habr.com / 1 год назад

Регулятор Южной Кореи временно заблокировал доступ к DeepSeek на территории страны

Больше по теме

01.02.2025 - 12:46 / habr.com

Не DeepSeek'ом единым: вышел Qwen2.5-Max от Alibaba

В последние дни мы наблюдаем уже не столько за битвой OpenAI и DeepSeek, сколько за баталиями DeepSeek против Qwen. И вот Qwen наносят новый удар. И это после того, как уже был релиз Qwen2.5-VL и релиз Qwen2.5 с контекстом в 1 миллион токенов.

Вчера была выпущена LLM-модель Qwen2.5-Max. Он превосходит DeepSeek V3 в таких бенчмарках, как Arena-Hard, LiveBench, LiveCodeBench и GPQA-Diamond, а также демонстрирует близкие результаты в других бенчмарках, как к примеру MMLU-Pro.

Qwen2.5-Max - это крупномасштабная модель Mixture of Experts, которая была предварительно обучена на более чем 20 триллионах токенов и дополнительно обучена с использованием Supervised-Fine-Tuning (то есть - с участием человека) и обучения на основе фидбека от людей (RLHF).

В отличие от своих более открытых коллег из DeepSeek, Qwen не выложили данные по Qwen2.5-Max ни на GitHub, ни на HuggingFace. Это несколько нестандартно для них - детальное описание предыдущих моделей обычно выкладывалось сразу на обе площадки, а в этом случае мы увидели только доступ к API и демку (ну и модель добавлена в QwenChat, конечно же).

Отсюда я могу сделать вывод, что модель выкладывали в бешенной спешке, чтобы успеть перетянуть на себя одеяло, и бахнуть сочный инфоповод пока ИИ-шумиха приуроченная к китайскому нового году ещё горяча.

Судя по тому, что Qwen2.5-1M вчера обновили на HuggingFace, я могу сделать осторожное предположение, что Qwen2.5-Max основан именно на этой модели. Если это так, то это здорово, как я уже писал в статье про Qwen2.5-1M, настолько большим окном контекста из моделей в проде сейчас обладают только Gemini от Google (1M-2M) и MiniMax-01 (4M).

Ребята из Qwen опубликовали пачку результатов для своей новой модели, но я бы относился к этим результатам с

люди здоровье самит google крипто gemini eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

За последний месяц китайский рынок привлёк $1,3 трлн новых средств от инвесторов из-за популярности проекта DeepSeek habr.com / 1 год назад

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет forbes.ua / 1 год назад

Южная Корея приостанавливает загрузку DeepSeek AI hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 19:15

технологии Apple общество курс планшеты WhatsApp получил сразу четыре полезных обновления: приложение стало удобнее на iPad, в автомобиле и при работе с PDF

Все нововведения уже начали поэтапно становиться доступными пользователям по всему миру. Как обычно, распространение происходит постепенно, поэтому некоторые функции могут появиться не сразу после установки последней версии приложения.

24.07 / 19:06

бизнес связь общество В России число подключений к публичному WiFi выросло в 3,5 раза за полгода

В России продолжает расти популярность WiFi в общественных местах на фоне проблем с мобильным интернетом. В первом полугодии 2026 года по сравнению с первым полугодием 2025-го количество подключений в публичных городских интернет-сетях увеличилось в 3,5 раза, до 4,1 млрд сессий. К такому выводу пришли аналитики оператора публичного WiFi Hot-WiFi, проанализировав динамику подключений пользователей в центральных районах Москвы. Тенденцию подтвердили крупные провайдеры: «Ростелеком», «Билайн» и «Транстелеком».

24.07 / 19:02

люди недвижимость здоровье семья tiktok «Отрыжка дома»: простая привычка для свежего воздуха в квартире

Эксперты рекомендуют открывать окна на 10–15 минут каждый день для борьбы с аллергенами и плесенью.

24.07 / 18:34

бизнес люди экономика общество самит Как строится первый в мире небоскреб высотой более километра

В Саудовской Аравии активно продолжается строительство первого в мире километрового небоскреба Jeddah Tower, который уже достиг 106 этажа.

24.07 / 18:10

продукты экономика недвижимость общество техника 11 привычек, которые избавят от генеральной уборки

Автор делится простыми ежедневными привычками, которые помогают держать дом в чистоте и откладывать генеральную уборку без лишнего стресса и затрат времени.

24.07 / 18:10

происшествия ученые археология захоронения болезнь Битва или болезнь – ученые нашли странные могилы римских солдат

В Словакии археологи раскопали редкий лагерь времен Марка Аврелия с множеством спешно захороненных легионеров и их снаряжения.

24.07 / 18:05

технологии Выпуск обновления Media Player Classic — Home Cinema 2.7.4

21 июля 2026 года состоялся релиз открытого медиаплеера Media Player Classic — Home Cinema 2.7.4 (MPC‑HC). Исходный код решения написан на С++ и С и опубликован на GitHub под лицензией GNU General Public License v3.0. Версия MPC‑HC 2.0 вышла в январе 2023 года.

24.07 / 17:38

происшествия рубль предприятия TS Solution — первый в России контракт на совместную техническую поддержку UserGate

Компания TS Solution, сертифицированный партнер российского разработчика решений в области кибербезопасности UserGate, объявляет о заключении первого в России контракта с клиентом из финансового сектора на оказание совместной технической поддержки межсетевых экранов UserGate NGFW в рамках проекта вендора «Совместная техническая поддержка».

24.07 / 17:38

реклама бюджет OpenAI официально запустила рекламный сервис в ChatGPT

OpenAI запустила в ChatGPT сервис нативной рекламы, позволяющий рекламодателям показывать релевантные объявления в тот момент, когда пользователи изучают варианты, сравнивают предложения и принимают решения.

24.07 / 17:30

продукты происшествия ученые общество жизнь Новый секрет долгой жизни раскрыли ученые

Ученым удалось обнаружить максимальный срок человеческой жизни, который станет реальным в будущем.

Лента новостей

На главную страницу