Об этом же в других СМИ

cursorinfo.co.il / 5 месяцев назад

Сколько весит душа человека - ученые удивили открытием

habr.com / 5 месяцев назад

The information: OpenAI купила медицинский стартап Torch из четырёх человек за $100 млн акциями

cursorinfo.co.il / 5 месяцев назад

Почему человек не может устоять перед сладким - ответ ученых

cursorinfo.co.il / 5 месяцев назад

Открытие ученых приоткрыло истинное происхождение человека

tech.onliner.by / 5 месяцев назад

«Самый полный из когда-либо найденных» скелетов предка человека раскрыл его сильные руки

Больше по теме

04.01.2026 - 05:45 / habr.com

GPT-4 обгоняет среднего человека в креативности, но проигрывает лучшим 10%

В журнале Nature Human Behaviour вышло масштабное исследование креативности людей и больших языковых моделей. Ученые из Гонконгского университета и Северо-Западного университета сравнили 9198 человек с восемью LLM на тесте дивергентного мышления — в общей сложности 215 542 прогона моделей. Результаты неоднозначные: GPT-4 Turbo набрал 81.78 балла и обошел средний человеческий результат (78–80 баллов), Claude 3.5 Sonnet показал 80.01, а китайская Ernie 4.0 оказалась худшей с 76.17 балла. Но когда исследователи сравнили верхние 10% людей с лучшими 10% ответов GPT-4 Turbo, люди победили со статистической значимостью p < 0.001.

Для оценки использовался Divergent Association Task — тест, где нужно назвать 10 существительных, максимально непохожих друг на друга. Креативность измеряется алгоритмически через семантическую дистанцию между словами, без субъективных оценок жюри. Это принципиально: впервые ни люди, ни LLM не оценивают друг друга. Главное различие оказалось не в средних баллах, а в распределении. Дисперсия у людей значимо выше — есть и слабые, и выдающиеся результаты, тогда как модели выдают стабильную середину. При этом люди генерируют значимо больше уникальных слов: модели между сессиями повторяют одни и те же ответы вроде happiness и freedom.

Авторы вводят термин креативная мимикрия для описания того, как LLM симулируют оригинальность. Модели используют две стратегии: вытаскивают редкие слова из корпуса или полагаются на параметр температуры для внесения случайности. Но это не понимание смысла, а статистическая манипуляция. Показателен пример Claude: при низкой температуре модель 485 раз из 750 прогонов выдавала слово zephyr, при высокой — всего 38 раз, переключаясь на банальное freedom. GPT-модели при росте

люди общество Дом и интерьер runawayllm Гонконг

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Как полет в космос влияет на мозг человека - интересное исследование cursorinfo.co.il / 5 месяцев назад

109% роста при полумиллиардных убытках: MiniMax показал, как выглядит IPO в эпоху ИИ-хайпа habr.com / 5 месяцев назад

Странные руки: обнаружен самый полный скелет предка человека, жил 2 млн лет назад (фото) focus.ua / 5 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

03.07 / 16:27

бизнес реклама продукты технологии общество «Рейтинг Рунета» опубликовал 49 рейтингов-2026 по услугам в маркетинге, диджитале и ИТ

Сервис подбора диджитал‑подрядчиков «Рейтинг Рунета» опубликовал рейтинги подрядчиков — 2026. В этот проект вошли 1 094 компании, оказывающие экспертные услуги в маркетинге, диджитале и ИТ. Рейтинги платформы призваны помочь любому заказчику найти исполнителя, наиболее подходящего под его задачу, бюджет и требования.

03.07 / 16:27

технологии экономика общество самит Три направления цифровизации девелопмента: команда Sminex на «Большом BIM Просвете — 2026»

Как работает BIM на практике, поговорили на «Большом BIM Просвете — 2026» в Москве. Это ежегодный форум по цифровизации проектирования и строительства, где лидеры рынка делятся кейсами и перенимают лучшее из опыта коллег. Более 50 спикеров рассказали о применении технологий на стройке, среди них — три эксперта Sminex с выступлениями о внедрении нейросетей и BIM-моделей в бизнес-процессы девелопмента.

03.07 / 16:14

общество семья гонки Forza Horizon 6 обогнала всех конкурентов в промежуточном топе лучших игр 2026 года по версии Metacritic

Агрегатор Metacritic подвел промежуточные итоги 2026 года и опубликовал топ-20 лучших игр, которые вышли за первое полугодие.

03.07 / 15:24

продукты происшествия ученые общество климат Кофе может стать роскошью — ученые назвали причину

Новые исследования показали, что мировую кофейную индустрию в ближайшие десятилетия ждут серьезные испытания.

03.07 / 15:24

самит жара интересное квартира похолодание Как эффективно охладить комнату с помощью вентилятора - эксперты

Специалисты поселились необычным лайфхаком, благодаря которому можно добиться наилучшего охлаждения комнаты, используя вентилятор.

03.07 / 15:24

люди общество вирус лечение болезнь Ранний признак гипертонии, который важно вовремя заметить

Высокое артериальное давление очень опасно, однако долгое время люди могут его не замечать.

03.07 / 15:24

здоровье теннис общество самит Здоровье и красота Какой спорт может на самом деле оздоровить сердце

Врачи уверяют, что физические активности способствуют расширению кровеносных сосудов и повышению эластичности сердечной мышцы.

03.07 / 15:24

здоровье общество самит питание напитки Как напитки во время еды на самом деле влияют на здоровье

Правда ли, что пить во время еды вредно или напитки наоборот могут улучшить пищеварение?

03.07 / 15:24

продукты люди здоровье Здоровье и красота мозг Сколько яиц нужно есть людям после 50 лет, чтобы избежать Альцгеймера

Исследования подтвердили, что регулярное употребление яиц может снизить риски развития возрастных проблем.

03.07 / 15:24

животные общество самит кошка животный мир Пять признаков того, что кошка чувствует себя счастливой рядом с вами

Кошки известны своей независимостью и сдержанностью в проявлении эмоций, однако по определенным сигналам можно легко установить, что ваш питомец счастлив.

Лента новостей

На главную страницу