Об этом же в других СМИ

chudo.tech / 1 год назад

Кастомный электропикап-трансформер Slate теперь представлен официально

gagadget.com / 1 год назад

Официально: расширение Battle For Brooklyn для The Division 2 выйдет 27 мая — Ubisoft раскрыла подробности DLC

gagadget.com / 1 год назад

Официально: Ghost of Yotei выйдет 2 октября — Sony представила зрелищный трейлер нового эксклюзива PlayStation 5

ilenta.com / 1 год назад

Huawei официально представила смартфон Enjoy 80

gagadget.com / 1 год назад

Официально: мощный смартфон Turbo 4 Pro от REDMI с процессором Snapdragon 8s Gen 4 представят 24 апреля

Больше по теме

06.04.2025 - 06:17 / habr.com

ИИ впервые официально прошел строгий тест Тьюринга

Исследователи из университета Сан-Диего опубликовали статью, в которой впервые эмпирически доказали устойчивое прохождение ИИ-системой классического теста Тьюринга: Win Rateновой модели OpenAI GPT-4.5 составил 73%.

Может показаться, что тест Тьюринга в наше время устарел, и языковые модели уже давно его "победили". Поэтому сразу сделаем важную оговорку: статьи с некоторыми замерами способностей ИИ на тесте Тьюринга действительно выходили уже много раз. Но, во-первых, если модели и выбивали результат выше 50%, он все еще был нестабилен и близок к случайному угадыванию. И, во-вторых, часто в этих работах рассматривался не оригинальный трехсторонний вариант испытания, а какие-то упрощенные суррогаты.

Что подразумевает трехсторонний вариант теста? Это значит, что в каждом эксперименте участвуют два человека и бот. Участник-интеррогатор получает в руки две параллельные переписки с человеком и ботом, 5 минут задает любые вопросы и использует любые стратегии, чтобы понять, где кто, а затем – голосует.

Именно таким образом исследователи из Сан-Диего тестировали модели. Они ставили эксперименты с GPT-4.5, LLaMa-3.1-405B, GPT-4o и самой древней языковой моделью ELIZA.

Лирическое отступление: ELIZA, несмотря на то, что она родом еще из 60-х годов прошлого века, – очень интересная модель. Даже в этом исследовании она (осторожно, спойлер) показывала себя лучше современной GPT-4o. Если хотите почитать о ней подробнее, то приглашаем вас в наш тг-канал Data Secrets: мы выкладывали целую серию иллюстрированных постов про историю ИИ и NLP.

А еще в канале мы (а мы – это команда действующих ML-инженеров) каждый день делимся прикладными конспектами по ML, разборами ключевых свежих статей и вот такими интересными новостями. Так

люди закон история общество самит роды интересное Сан-Диего

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Суд США официально признал Google монополистом в сфере интернет-рекламы habr.com / 1 год назад

В Китае официально представили Volkswagen ID. Unyx 06 с большим дисплеем и батареей до 80,2 кВт·ч gagadget.com / 1 год назад

Cyberpunk 2077 на Nintendo Switch 2 стала первой игрой с официально подтвержденной поддержкой Nvidia DLSS gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 14:53

продукты здоровье общество питание кулинария Когда солить разные виды мяса, чтобы оно не стало сухим

Время добавления соли кардинально влияет на сочность и текстуру мяса, говорят специалисты.

16.07 / 14:53

продукты здоровье продукты питания общество самит Действительно ли морская соль полезнее каменной, рассказали эксперты

Морская соль содержит минералы, но их количество слишком мало, чтобы существенно влиять на здоровье.

16.07 / 14:53

технологии ученые самит человек мозг Привычку, которая каждый день незаметно истощает мозг, назвали ученые

Ученые выяснили, что мозг может истощаться даже после полноценного сна и без серьезных физических или умственных нагрузок.

16.07 / 14:38

технологии происшествия Tesla расследование google Хакеры похитили почти $24 млн из DeFi-протокола Ostium через манипуляцию ценовым оракулом

DeFi-протокол Ostium подвергся масштабному взлому, в результате которого из публичного пула ликвидности OLP было похищено около $23,75 млн. По данным исследователей, после атаки злоумышленник обменял все похищенные 23,75 млн USDC на 12 084 ETH по средней цене около $1966 за монету. Впоследствии большую часть Ethereum перевели в криптомиксер Tornado Cash, чтобы скрыть происхождение средств. Отметим, Ostium — это платформа для синтетических деривативов, где пользователи могут открывать позиции на акции таких компаний, как Tesla, Nvidia или Meta. Хакер воспользовался уязвимостью ценового оракула По информации исследовательс

16.07 / 14:38

связь экономика самит эфир google Антон Буков заявил об увольнении из 1inch и анонсировал новый проект

Сооснователь 1inch Антон Буков рассказал, что в конце ноября 2025 года был уволен из компании. Он сохранил статус сооснователя и 50% акций, но полностью отстранен от операционной деятельности — в том числе от продуктовой архитектуры и безопасности протокола. Параллельно Буков анонсировал новый проект — Second Tier. Буков напомнил, что стал сооснователем 1inch в мае 2019 года и его роль всегда была технической: он вел архитектуру протокола, безопасность и экономический дизайн — от первого DEX-агрегатора 1inch Router до обновления Fusion, кроссчейн-свопов и готовящегося Shared Liquidity AMM. По его словам, обратная связь от пользователей и коллег за последний год дала понять, что он «больше не может оставаться в стороне от управленческой и операционной части компании».

16.07 / 14:27

Уязвимости в компоненте календаря событий DPCalendar

12 июля 2026 года команда Digital Peak получила сообщение о серьезной уязвимости в компоненте календаря событий DPCalendar, которая может привести к несанкционированному доступу к данным, хранящимся в базе данных Joomla.

16.07 / 14:27

технологии Xiaomi общество самит дефицит «Известия»: эксперты прогнозируют дефицит бюджетных смартфонов в России

Из-за роста цен на комплектующие ассортимент смартфонов в российских магазинах может сократиться уже в этом году. В результате заметно вырастет рынок б/у устройств, считают эксперты издания «Известия».

16.07 / 14:27

люди LinkedIn общество reddit Исследование: более 40% длинных постов на LinkedIn сгенерированы ИИ

ИИ-тексты всё заметнее заполняют соцсети, особенно LinkedIn и X. По данным аналитиков платформы Pangram, около 25% публикаций в соцсетях длиннее 250 слов сгенерированы искусственным интеллектом.

16.07 / 14:27

Путешествия общество Психология и отношения «ГигаЧат» научился распознавать эмоции, различать спикеров и находить нужные моменты в длинных аудио

Пользователям ИИ‑помощника «ГигаЧат» стала доступна обновлённая нейросеть GigaChat Audio — большая языковая модель, которая способна обрабатывать аудиофайлы и голосовые сообщения без предварительного преобразования речи в текст. Искусственный интеллект научился понимать интонацию пользователя и получил расширенные возможности по обработке звуковой информации, рассказали Хабру в пресс‑службе компании.

16.07 / 14:27

Samsung люди здоровье закон законодательство Samsung удалит медицинские данные пользователей, если они не разрешат использовать эту информацию для обучения ИИ

Samsung начала уведомлять пользователей Samsung Health о том, что им необходимо дать согласие на использование их личных медицинских данных для обучения новых моделей искусственного интеллекта. В противном случае владельцы рискуют потерять эти данные навсегда.

Лента новостей

На главную страницу