Об этом же в других СМИ

habr.com / 1 год назад

Логические модели OpenAI получили два полезных обновления

habr.com / 1 год назад

OpenAI меняет стратегию в области разработки с открытым исходным кодом: что ждать дальше?

habr.com / 1 год назад

Aomni привлекает $4 миллиона, доказывая, что AI может увеличить продажи, не заменяя людей

habr.com / 1 год назад

Исследователи обнаружили, что больше не нужна тонна данных, чтобы обучить LLM выполнению логических задач

habr.com / 1 год назад

OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения

Больше по теме

03.02.2025 - 01:49 / habr.com

Alibaba заявляет, что её новая модель Qwen2.5-VL является полезным «визуальным агентом»

В рамках своей серии Qwen2.5 компания Alibaba представила новую мультимодальную визуальную языковую модель, которая стала ещё одним шагом на пути к развитию искусственного интеллекта в коммерческой сфере.

Основываясь на модели Qwen2-VL с открытым исходным кодом, выпущенной осенью 2024 года, новая версия обещает более эффективную обработку различных типов данных, включая текст, изображения и часовые видео. Команда говорит, что они добились особого прогресса в работе с диаграммами, иконками, графикой и макетами. Модель доступна в трёх вариантах: 3, 7 и 72 миллиарда параметров.

По словам компании, эти улучшения также делают модель полезной в качестве визуального помощника. В нескольких демонстрационных версиях Alibaba показывает, как Qwen2.5 анализирует содержимое экрана и предоставляет инструкции для таких задач, как бронирование авиабилетов, проверка прогнозов погоды и навигация по сложным интерфейсам, таким как Gimp.

Хотя Qwen2.5 не является специализированной моделью агента, как недавно представленная OpenAI CUA, он отлично справляется с анализом интерфейсов, определением нужных кнопок и планированием рабочих процессов. Эта возможность может сделать его ценным в качестве основы для открытой системы, подобной оператору.

Модель может распознавать конкретные объекты и их компоненты — например, определять, есть ли на мотоциклисте шлем. При обработке документов, таких как счета-фактуры и формы, она может выводить информацию в структурированных форматах, таких как JSON, для удобства повторного использования.

По данным Alibaba, самая большая версия, Qwen2.5-VL-72B, по различным тестам сравнима с GPT-4o от OpenAI, Claude 3.5 Sonnet и Gemini 2.0 Flash, а иногда и превосходит их в таких областях, как понимание текста и визуальная

погода закон прогноз самит крипто gemini mefdayy

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Perplexity AI запускает новую сверхбыструю поисковую модель с искусственным интеллектом habr.com / 1 год назад

Исследование показывает, что энергопотребление ChatGPT меньше, чем многие думают habr.com / 1 год назад

Европейские компании объединяются, чтобы ускорить внедрение искусственного интеллекта habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

04.07 / 18:26

продукты технологии происшествия история общество Китайская ИИ-модель GLM-5.2 приблизилась к Claude Mythos в поиске уязвимостей. Что это меняет для ИБ

13 июня китайская компания Zhipu AI представила открытую языковую модель GLM-5.2. Вскоре после релиза результаты независимых тестов привлекли внимание специалистов по информационной безопасности: в одной из задач поиска программных уязвимостей модель показала результаты, сопоставимые с Claude Mythos от Anthropic.

04.07 / 18:26

экономика общество политика Microsoft может уволить около 5500 сотрудников, в том числе подразделения Xbox

Microsoft готовится к очередному раунду сокращений, который может затронуть менее 2,5% мирового штата компании — около 5,5 тысячи сотрудников. По данным Business Insider, об увольнениях могут объявить уже в ближайшие дни, хотя сроки еще могут измениться.

04.07 / 18:26

самит VIP-билет даром: исследователь с помощью Claude взломал компанию по продаже билетов на фестивали США

Исследователь Иэн Кэрролл в апреле получил доступ уровня суперадминистратора к системе Front Gate Tickets — компании, которая продает билеты почти на все крупные музыкальные фестивали США, от Lollapalooza до Bonnaroo. Помог ему в этом Claude Opus 4.7: Кэрролл мог одним кликом бесплатно выписать себе билет любой стоимости — вплоть до $4000 за штуку. Подробности взлома он описал в материале WIRED.

04.07 / 18:24

продукты здоровье общество человек мозг Неподходящая подушка может незаметно подрывать здоровье - врачи

Специалисты объяснили, как качество подушки влияет на сон, восстановление мозга и риск развития серьезных заболеваний.

04.07 / 17:56

продукты происшествия самит полезные продукты животный мир Лучшее масло для жарки назвал нутрициолог - и это не оливковое

Определенные масла имеют низкую точку дымления, поэтому при жарке представляют угрозу для организма.

04.07 / 17:56

продукты семья Здоровье и красота похудение питание Сколько калорий надо получать за ужином, чтобы худеть

Как и сколько нужно есть по вечерам тем, кто пытается сбросить лишний вес, рассказали эксперты.

04.07 / 17:23

люди экономика деньги общество банк Одна ошибка в отпуске может стоить всех денег — что важно знать

Финансовый эксперт рассказал, какие привычные ошибки чаще всего приводят к потере денег во время отдыха за границей.

04.07 / 17:23

Samsung технологии евро самит Утекли европейские цены Samsung Galaxy Z Fold8, Fold8 Ultra, Flip8 и новых Galaxy Watch

По слухам, компания представит сразу несколько новых устройств, включая смартфоны Galaxy Z Fold8, Galaxy Z Fold8 Ultra, Galaxy Z Flip8, а также умные часы Galaxy Watch9 и Galaxy Watch Ultra 2.

04.07 / 17:10

технологии общество семья вода лечение Чем нельзя запивать таблетки - "черный список" напитков

Исследования выяснили, какие напитки могут снизить или даже полностью разрушить действие лекарств.

04.07 / 17:10

магия самит биологи бактерии Магия или химия – ученые создали форму жизни из «неживых» компонентов

Синтетическая форма жизни крайне примитивна и требует постоянной поддержки извне.

Лента новостей

На главную страницу