Об этом же в других СМИ

cursorinfo.co.il / 11 месяцев назад

Что приводит к ожирению - ученые развенчали популярный миф

ilenta.com / 11 месяцев назад

Google Gemini будет работать и на старых часах Samsung Galaxy Watch

habr.com / 1 год назад

Злоумышленник использовал ИИ, чтобы выдать себя за министра и связаться с высокопоставленными чиновниками

ilenta.com / 1 год назад

Apple разрабатывает новую версию Apple TV

habr.com / 1 год назад

Gemini научили читать переписки и заметки на Android, опцию можно отключить

Больше по теме

27.06.2025 - 11:58 / gagadget.com

Apple с University of Washington протестировали ИИ-агентов на Gemini и ChatGPT, вывод: технология еще не готова

Пока мы все активно тестируем, как ИИ может писать эссе, код или генерировать картинки, исследователи из Apple и University of Washington задались куда более практичным вопросом: а что будет, если дать искусственному интеллекту полный доступ к управлению мобильными приложениями? И главное - поймет ли он последствия своих действий?

Что известно

В исследовании под названием "From Interaction to Impact: Towards Safer AI Agents Through Understanding and Evaluating Mobile UI Operation Impacts", опубликованном для конференции IUI 2025, команда ученых обнаружила серьезный пробел:

современные большие языковые модели (LLM) довольно неплохо понимают интерфейсы, но катастрофически плохо осознают последствия собственных действий в этих интерфейсах.

Например, для ИИ нажать кнопку "Удалить аккаунт" выглядит почти так же, как "Поставить лайк". Разницу между ними ему еще надо объяснить. Чтобы научить машины различать важность и риски действий в мобильных приложениях, команда разработала специальную таксономию, которая описывает десять основных типов влияния действий на пользователя, интерфейс, других людей, а также учитывает обратимость, долгосрочные последствия, проверку выполнения и даже внешние контексты (например, геолокацию или статус аккаунта).

Исследователи создали уникальный датасет из 250 сценариев, где ИИ должен был понять, какие действия безопасны, какие требуют подтверждения, а какие лучше вообще не выполнять без человека. По сравнению с популярными датасетами AndroidControl и MoTIF, новый набор значительно богаче на ситуации с реальными последствиями - от покупок и смены паролей до управления умными домами.

В исследовании тестировали пять языковых моделей (LLM) и мультимодальных моделей (MLLM), а именно:

Эти модели тестировали в

технологии люди Apple конференция общество gemini Washington Washington

Читать на gagadget.com

Все новости от gagadget.com

Об этом же в других СМИ

Apple Music представил плейлист «10 лет с Apple Music: главные хиты» habr.com / 1 год назад

Gemini 7 июля получит доступ к WhatsApp, сообщениям и звонкам на Android-устройствах habr.com / 1 год назад

Google запускает Veo 3 Fast в 159 странах, теперь пользователи Gemini Pro могут создавать видео в разрешении до 720p habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 19:47

продукты люди здоровье общество Здоровье и красота Две лучшие крупы для похудения назвали ученые

Эксперты рассказали, в каких случаях лучше выбрать гречку, а в каких рис.

15.07 / 19:47

технологии общество рубль электромобиль пресс-служба UMO объявила о старте предзаказов электрического кроссовера UMO 5 для частных покупателей в России

Компания UMO объявила о старте приёма предзаказов на электрический кроссовер UMO 5 для частных покупателей и раскрыла цены и комплектации модели. Автомобиль будет доступен в двух версиях. Комплектацию «Про» оценили в 2,59 млн рублей, а версию «Макс» — в 2,79 млн рублей. Цены действуют с учётом субсидии при покупке электромобиля, рассказали Хабру в пресс-службе компании.

15.07 / 19:23

технологии AOC представила необычный портативный монитор с цветным E Ink-дисплеем

Вместо привычной LCD- или OLED-матрицы новинка получила цветной экран на основе электронной бумаги E Ink. Продажи уже стартовали в Китае, где устройство оценили в 4599 юаней (около 679 долларов).

15.07 / 19:18

продукты здоровье общество женщина Здоровье и красота Три продукта, которые необходимы всем женщинам после 40 лет

Какие продукты позитивно влияют на женский организм, поддерживают гормональный баланс и продлевают молодость.

15.07 / 19:18

люди здоровье общество самит сон Шесть недель недосыпания могут изменить тело - ученые

Даже незначительное недосыпание может повлиять на тело быстрее, чем кажется.

15.07 / 19:12

продукты OpenAI OpenAI представила Codex Micro — компактный девайс для удобного программирования и управления AI-агентами

OpenAI представила Codex Micro — компактное настольное устройство, созданное совместно с производителем механических клавиатур Work Louder. Это первый аппаратный продукт компании, ориентированный на программистов, которые используют в своей работе AI-платформу Codex.

15.07 / 18:38

технологии происшествия ученые искусственный интеллект В ChatGPT обнаружили опасную уязвимость, позволявшую обойти защиту

Обычный на первый взгляд запрос помог выявить неожиданную особенность работы защитных механизмов ChatGPT.

15.07 / 18:36

семья Sony playstation В следующую подборку PlayStation Plus Extra и Premium войдут семь игр, включая Avatar: Frontiers of Pandora и Rise of the Ronin

Sony раскрыла список игр, которые уже на следующей неделе будет предложены подписчикам PlayStation Plus Extra и Premium.

15.07 / 17:55

продукты люди продукты питания общество еда Популярные гарниры по уровню опасности сравнил диетолог

Скорость усвоения популярных углеводных продуктов зависит от двух факторов – молекулярной структуры и сопутствующих компонентов блюда.

15.07 / 17:55

происшествия люди Путешествия здоровье общество Чем опасны частые путешествия, рассказали врачи

Многие люди любят путешествовать и летать на самолетах, но важно помнить, что частые путешествия могут негативно отразиться на здоровье.

Лента новостей

На главную страницу