Об этом же в других СМИ

cursorinfo.co.il / 1 месяц назад

Какое печенье лучше всего подходит для макания в чай - ответ ученых

cursorinfo.co.il / 1 месяц назад

Когда собаки подружились с людьми - новое исследование

cursorinfo.co.il / 1 месяц назад

Как чай влияет на скорость старения - исследование

habr.com / 1 месяц назад

Исследование: работа по ночам убивает и уменьшает мозг

focus.ua / 1 месяц назад

Украденное наследие. Пять выдающихся женщин-ученых, чья слава досталась мужчинам

Больше по теме

22.05.2026 - 10:49 / 24tv.ua

ИИ не способен адекватно оценивать тексты, написанные человеком — исследование ученых из Кембриджа

Как сообщает научный портал Phys.org, ученые обнаружили странную закономерность в том, как именно машины начисляют баллы и на что они обращают внимание в первую очередь. И это плохие новости для тех, кого уже оценивает искусственный интеллект.

Смотрите также Ни одной живой души: местная газета в США оказалась искусственным интеллектом, имитирующим журналистов

Алгоритм vs человек: кто побеждает

Современное высшее образование все чаще сталкивается с вызовами, которые приносят новейшие технологии. Стремясь упростить и автоматизировать процесс проверки знаний, ученые решили протестировать возможности современных технологий в роли экзаменаторов.

Команда психологов и экспертов по искусственному интеллекту под руководством Кембриджского университета провела масштабное исследование, результаты которого изложены в отчете OpRaise под названием "ИИ в университетском оценивании: оценка возможностей и рисков автоматизированной маркировки".

Не полагайтесь на случай в ленте Добавьте 24 Канал в избранное в Google Добавить

Исследователи протестировали три передовые системы, включая последние версии Claude, ChatGPT (GPT–5.4) и Gemini 3 Flash, на базе 761 эссе студентов-психологов из трех университетов Великобритании – Кембриджского, Ноттингемского и Университета Манчестер Метрополитен.

Результаты оказались неутешительными:

ИИ совпадал с оценками преподавателей только в 35 – 65% случаев.
Самую высокую точность зафиксировали в Кембридже (63%).
В Манчестер Метрополитен она упала до критических 35%.

Основной проблемой стала так называемая "предвзятость центральной тенденции". Алгоритмы склонны ставить "средние" баллы всем подряд, искусственно завышая оценки слабым студентам и существенно занижая их лучшим. Например, эссе, которое человек оценил на

технологии искусственный интеллект общество Психология и отношения Техно США Англия

Читать на 24tv.ua

Все новости от 24tv.ua

Об этом же в других СМИ

Почему люди часто слышат вибрации в ушах - исследование cursorinfo.co.il / 1 месяц назад

«Биологическая угроза». Двоих ученых обвинили в контрабанде смертельного вируса tech.onliner.by / 1 месяц назад

Магнитные бури в ближайшие дни – ученые обновили прогноз cursorinfo.co.il / 1 месяц назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

28.07 / 06:51

здоровье курение Здоровье и красота еда похудение Здоровье из 90-х: какие привычки стоит вернуть, а какие забыть

Американские врачи оценили влияние трендов прошлого на организм. Часть рекомендаций из девяностых сохранила свою актуальность.

28.07 / 06:51

происшествия экономика ученые животные общество Ученые прицепили камеры к акулам: результат превзошел ожидания (ВИДЕО)

Исследователи впервые смогли заглянуть в тайную жизнь китовых акул. Специалисты закрепили камеры на плавниках гигантских рыб.

28.07 / 06:51

технологии смартфон общество самит жара Как охладить смартфон без перезагрузки – 9 работающих способов

Чтобы защитить гаджет от перегрева на солнце и во время ресурсоемких игр, мало просто защитить его от прямых лучей.

28.07 / 06:51

связь люди общество психология психика 10 привычек, которые выдают глубокую любовь в отношениях

Простые привычки помогают сохранить близость, даже когда отношения становятся спокойнее и сложнее.

28.07 / 06:34

общество семья Здоровье и красота курс Психология и отношения Qwen-Audio-3.0-TTS: что в релизе Alibaba уже работает, а что пока обещание

Команда Qwen выкатила Qwen-Audio-3.0-TTS - облачную модель Alibaba для синтеза речи, сразу в двух версиях: Flash под низкую задержку и Plus под качество тембра. В анонсе много громких чисел: 16 языков с русским, первое место в Artificial Analysis, клонирование по шумной записи, три минуты аудио за один проход. Ниже - разбор релиза так, как его стоит читать перед внедрением: где заявленная возможность уже подтверждена документацией и API, а где это пока маркетинговая формулировка, за которой не стоит готовой инфраструктуры. Расхождений между блогом, техстраницей и API-справкой хватает, и часть из них важно поймать заранее.

28.07 / 06:34

происшествия общество Дом и интерьер правительство Сэм Альтман покажет властям США следующее поколение моделей OpenAI: при чем тут GPT-6 и AGI

На следующей неделе генеральный директор OpenAI Сэм Альтман проведет серию закрытых брифингов для представителей администрации США и законодателей. По данным Bloomberg, речь пойдет о следующем поколении моделей OpenAI и их потенциальном влиянии на рынок труда и вопросы безопасности. Встречи проходят на фоне подготовки новой государственной системы оценки передовых ИИ-моделей, которую Белый дом планирует представить в ближайшие недели.

28.07 / 06:34

бизнес экономика общество законодательство политика Флагманская модель Сбера GigaChat 3.5 Ultra теперь доступна в Evolution Foundation Models

Cloud.ru стал первым облачным провайдером, предоставившим бизнесу коммерческий доступ к GigaChat 3.5 Ultra — свежей флагманской модели Сбера с открытыми весами, которая используется в ИИ-помощниках ГигаЧат. Модель уже доступна в каталоге Evolution Foundation Models и подключается по OpenAI-совместимому API. Цена составляет 96 ₽ за 1 млн входных и 289 ₽ за 1 млн выходных токенов.

28.07 / 06:26

продукты Audi самит Дом и интерьер Waters ABT RS3 630: Когда компактная Audi решила, что она — суперкар

В мире заряженных хэтчбеков обычно царит определенный здравый смысл: добавить немного мощности, перенастроить подвеску и установить несколько спойлеров. Однако немецкое ателье ABT Sportsline решило, что здравый смысл — это скучно, особенно когда компании исполняется 130 лет. Результатом праздничного настроения стал ABT RS3 630 — автомобиль, который выводит привычную Audi RS 3 Sportback на территорию, где обычно обитают гораздо более дорогие и пафосные суперкары.

28.07 / 05:51

продукты общество самит вода Эксперт Как уберечь почки от камней: секреты правильного питья

Образование камней в почках связано с концентрацией минералов в урине. Регулярное питье помогает эффективно разбавлять эти опасные соли.

28.07 / 05:49

бизнес продукты общество банк капитал Альфа-Банк в шесть раз ускорил оценку кредитных рисков благодаря решениям Т1

C помощью продуктов ИТ‑холдинга Т1 Альфа‑Банк ускорил расчет величины риск‑взвешенных активов — Risk‑Weighted Assets (RWA). Это показатель, который оценивает надежность активов банка с учетом их рисков. Этого удалось достичь с помощью решений на основе платформы риск‑менеджмента ИТ‑холдинга Т1: RWA‑калькулятора для расчета риск‑взвешенных активов по ПВР‑подходу и системы расчета дефолтов физических лиц.

Лента новостей

На главную страницу