Об этом же в других СМИ

habr.com / 11 месяцев назад

Исследователи представили Bang — нейросеть для декомпозиции 3D-моделей

habr.com / 11 месяцев назад

Инструмент Google использовали для удаления из поиска информации о гендиректоре одной компании

cursorinfo.co.il / 11 месяцев назад

Как в мультике: краб использует медузу как такси (ВИДЕО)

habr.com / 11 месяцев назад

Исследователи Яндекса раскрыли принципы работы нейросети для распознавания голосовых команд на фоне шума

habr.com / 11 месяцев назад

Китайские университеты хотят, чтобы студенты использовали ИИ больше, а не меньше

Больше по теме

16.07.2025 - 14:17 / habr.com

Исследователи использовали видео c YouTube, чтобы показать, как модели ИИ справляются с неожиданными ситуациями

Видео с провалами на YouTube показывают, что у ведущих моделей искусственного интеллекта есть серьёзный недостаток: они не справляются с неожиданными ситуациями и редко пересматривают свои первоначальные оценки. Даже такие продвинутые системы, как GPT-4o, спотыкаются на простых сюжетных поворотах.

Исследователи из Университета Британской Колумбии, Института искусственного интеллекта Vector и Наньянского технологического университета протестировали лучшие модели искусственного интеллекта на более чем 1600 неудачных видео с YouTube из набора данных Oops!

Команда создала новый эталонный тест под названием BlackSwanSuite, чтобы проверить, насколько хорошо эти системы справляются с непредвиденными событиями. Как и людей, модели ИИ сбивают с толку неожиданные моменты, но, в отличие от людей, они отказываются менять своё мнение даже после того, как видят, что произошло на самом деле.

Один из примеров: мужчина размахивает подушкой возле рождественской ёлки. ИИ предполагает, что он целится в кого-то поблизости. На самом деле подушка сбивает с ёлки украшения, которые затем падают на женщину. Даже после просмотра всего видео ИИ остаётся при своём первоначальном неверном предположении.

Видеоролики охватывают широкий спектр тем, среди которых чаще всего встречаются дорожно-транспортные происшествия (24%), несчастные случаи с детьми (24%) и несчастные случаи в бассейне (16%). Все их объединяет непредсказуемый поворот событий, который часто ускользает от внимания даже людей.

Каждое видео разделено на три сегмента: установка, сюрприз и последствия. Тест ставит перед LLM разные задачи на каждом этапе. В задаче «Прогнозист» ИИ видит только начало видео и пытается предсказать, что будет дальше. Задача «Детектив» показывает только начало и

люди общество YouTube самит происшествие gemini mefdayy Колумбия

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

На уровне KLING 2.0, но open source — представлены модели создания видео Wan 2.2 habr.com / 11 месяцев назад

Исследователи: нейроредактор кода Trae от ByteDance потребляет слишком много ОЗУ habr.com / 11 месяцев назад

Презентация уже не нужна: инсайдер показал макеты всех моделей iPhone 17 в разных цветах gagadget.com / 11 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 09:25

продукты здоровье общество рак самит Привычные вещи на кухне могут повышать риск рака - онколог

Опасность может скрываться не только в продуктах, но и в том, как вы готовите и храните пищу каждый день.

16.07 / 09:25

продукты промышленность общество самит кровь В крови "зашкаливает" холестерин - названы необычные признаки

Врачи рекомендуют обратить внимание на свои ноги и, в случае выявления опасных симптомов, обязательно проконсультироваться с врачом.

16.07 / 09:25

продукты медицина люди здоровье общество Что нужно есть по утрам, чтобы дольше жить - выводы ученых

Завтрак обязательно должен быть не просто полезным, но и сытным, и вкусным.

16.07 / 09:21

связь экономика смартфоны прочее животный мир Ошейник для собак Fi Ultra со спутниковой связью Starlink

Компания Fi представила трекер для собак Fi Ultra, главной особенностью которого стала поддержка спутниковой сети Starlink.

16.07 / 09:19

технологии экономика смартфон совет лайфхак Как обновить медленный смартфон всего за 10 минут: простой способ

Если ваш смартфон на Android стал работать медленнее, это ещё не значит, что пришло время покупать новый. Чаще всего причиной ухудшения работы гаджета является накопление ненужных файлов, кэша и неиспользуемых приложений, которые перегружают систему.

16.07 / 09:17

продукты Apple нейросети Grok Build становится открытым: Илон Маск убирает лимиты и выкладывает код в паблик

Илон Маск (Elon Musk) продолжает свою игру в «открытость», пока конкуренты из OpenAI обносят собственные модели всё более высокими заборами. Компания SpaceXAI объявила об открытии исходного кода Grok Build и — что значительно приятнее для активных пользователей — полном снятии лимитов на использование инструмента. Теперь каждый, кто имеет доступ к Grok, может использовать ИИ-агента без страха увидеть сообщение о превышении лимита запросов.

16.07 / 09:12

технологии Toyota общество работодатель honda Honda ввела экзамены по ИИ и денежные премии для сотрудников

Honda Motor запустила корпоративную программу сертификации по искусственному интеллекту, которая позволяет сотрудникам подтвердить уровень владения ИИ‑инструментами и получить денежное вознаграждение. Компания рассчитывает таким образом ускорить внедрение ИИ в повседневные рабочие процессы, сообщает Nikkei Asia.

16.07 / 09:12

технологии самит google В Google AI Studio завезли импорт с GitHub

В Google AI Studio официально запустили функцию «Import from GitHub». Об этом сообщил Логан Килпатрик, старший продакт-менеджер Google DeepMind, отвечающий за AI Studio и Gemini API.

16.07 / 09:12

технологии закон Telegram самит Дом и интерьер Приостановлено делегирование домена t.me

Делегирование домена t.me (который используется мессенджером Telegram для коротких ссылок) неожиданно было приостановлено. Судя по статусу serverHold, решение принято не регистратором GoDaddy, а самим оператором доменной зоны .me

16.07 / 09:09

технологии музыка общество политика курс Edifier представила новые колонки R1000TC II с Bluetooth 6.0 и управлением со смартфона

Компания Edifier официально представила новое поколение активных полочных колонок R1000TC II. Модель ориентирована на пользователей, которым нужна компактная акустика для рабочего стола, домашнего кабинета или небольшой комнаты. Главными нововведениями стали поддержка Bluetooth 6.0, возможность одновременного подключения двух устройств, встроенная USB-звуковая карта и управление через фирменное мобильное приложение.

Лента новостей

На главную страницу