Об этом же в других СМИ

habr.com / 1 год назад

Вышел отчёт Ookla о скорости интернета в разных странах

gagadget.com / 1 год назад

Хуже, чем Холодная война: Дания объявит о "массовом" перевооружении из-за угрозы со стороны России

habr.com / 1 год назад

Firefly Aerospace: зонд Blue Ghost М1 вышел на лунную орбиту и прислал валентинку из космоса

ilenta.com / 1 год назад

Виниловый проигрыватель Cosmo Solar Edition вышел в трех новых цветах

habr.com / 1 год назад

Вышел Go 1.24

Больше по теме

31.01.2025 - 05:06 / habr.com

Вышел Qwen2.5-VL от Alibaba: распознавание часовых видео, агенты, структурные данные

Астрологи объявили неделю китайских нейросетей. На этот раз у нас апдейт Qwen2.5-VL.

Это модель, умеющая принимать на вход на текст, так и изображения, обладает более развитой способностью "понимать" нарисованное на картинках, в том числе прекрасно справляется с обработкой видео длительности до 1 часа.

Ссылка на официальный блог: https://qwenlm.github.io/blog/qwen2.5-vl/

Взято из https://huggingface.co/Qwen/Qwen2.5-VL-72B-Instruct и переведено на русский с небольшой редактурой для понятности:

Визуальное понимание

Модель Qwen2.5-VL не только умеет распознавать привычные объекты (цветы, птицы, рыбы, насекомые), но и способна анализировать тексты, диаграммы, иконки, графику и макеты внутри изображений.

Работа в формате ИИ-агента:

Qwen2.5-VL может напрямую выступать в роли визуального агента, который умеет рассуждать и динамически использовать различные инструменты, в том числе компьютер или телефон. [Привет, OpenAI Operator!]

Понимание длинных видео и фиксация событий:

Qwen2.5-VL способна разбирать видео длительностью более 1 часа.

Новая возможность — находить конкретные события, выделяя нужные фрагменты видео.

Точная локализация в разных форматах:

Модель умеет точно находить объекты на изображении, создавая bounding-box или указывая точки.

Она также может выдавать JSON с координатами и характеристиками объектов.

Генерация структурированных данных:

При работе со сканами счетов, форм, таблиц и т.п. Qwen2.5-VL поддерживает структурированный вывод их содержимого, что полезно в финансах, торговле и других сферах.

Динамическое разрешение и частота кадров при обучении видео:

Была расширена идея динамического разрешения, было добавлено временное измерение, и переменная частота кадров (FPS). Это помогает модели понимать видео с разными

финансы самит животный мир

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Дания передала Украине почти все обещанные истребители F-16 gagadget.com / 1 год назад

Вышел открытый проект Typeconf — инструмент TypeScript, добавляющий типы в конфигурации habr.com / 1 год назад

Вышел новый трейлер Atomfall с демонстрацией функций игрового процесса, мира и врагов gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

24.07 / 20:03

медицина здоровье история общество прогноз В какой стране женщины будут жить дольше всех в мире

Благодаря развитому здравоохранению и здоровому образу жизни южнокорейские женщины имеют все шансы установить мировой рекорд долголетия.

24.07 / 20:03

люди дети общество психология психика Как распознать нарцисса — 5 вещей, от которых он получает удовольствие

Психологи рассказали, от чего эгоистичные люди получают настоящее удовольствие и почему они так себя ведут.

24.07 / 19:15

технологии Apple общество курс планшеты WhatsApp получил сразу четыре полезных обновления: приложение стало удобнее на iPad, в автомобиле и при работе с PDF

Все нововведения уже начали поэтапно становиться доступными пользователям по всему миру. Как обычно, распространение происходит постепенно, поэтому некоторые функции могут появиться не сразу после установки последней версии приложения.

24.07 / 19:06

бизнес связь общество В России число подключений к публичному WiFi выросло в 3,5 раза за полгода

В России продолжает расти популярность WiFi в общественных местах на фоне проблем с мобильным интернетом. В первом полугодии 2026 года по сравнению с первым полугодием 2025-го количество подключений в публичных городских интернет-сетях увеличилось в 3,5 раза, до 4,1 млрд сессий. К такому выводу пришли аналитики оператора публичного WiFi Hot-WiFi, проанализировав динамику подключений пользователей в центральных районах Москвы. Тенденцию подтвердили крупные провайдеры: «Ростелеком», «Билайн» и «Транстелеком».

24.07 / 19:02

люди недвижимость здоровье семья tiktok «Отрыжка дома»: простая привычка для свежего воздуха в квартире

Эксперты рекомендуют открывать окна на 10–15 минут каждый день для борьбы с аллергенами и плесенью.

24.07 / 18:34

бизнес люди экономика общество самит Как строится первый в мире небоскреб высотой более километра

В Саудовской Аравии активно продолжается строительство первого в мире километрового небоскреба Jeddah Tower, который уже достиг 106 этажа.

24.07 / 18:10

продукты экономика недвижимость общество техника 11 привычек, которые избавят от генеральной уборки

Автор делится простыми ежедневными привычками, которые помогают держать дом в чистоте и откладывать генеральную уборку без лишнего стресса и затрат времени.

24.07 / 18:10

происшествия ученые археология захоронения болезнь Битва или болезнь – ученые нашли странные могилы римских солдат

В Словакии археологи раскопали редкий лагерь времен Марка Аврелия с множеством спешно захороненных легионеров и их снаряжения.

24.07 / 18:05

технологии Выпуск обновления Media Player Classic — Home Cinema 2.7.4

21 июля 2026 года состоялся релиз открытого медиаплеера Media Player Classic — Home Cinema 2.7.4 (MPC‑HC). Исходный код решения написан на С++ и С и опубликован на GitHub под лицензией GNU General Public License v3.0. Версия MPC‑HC 2.0 вышла в январе 2023 года.

24.07 / 17:38

происшествия рубль предприятия TS Solution — первый в России контракт на совместную техническую поддержку UserGate

Компания TS Solution, сертифицированный партнер российского разработчика решений в области кибербезопасности UserGate, объявляет о заключении первого в России контракта с клиентом из финансового сектора на оказание совместной технической поддержки межсетевых экранов UserGate NGFW в рамках проекта вендора «Совместная техническая поддержка».

Лента новостей

На главную страницу