Об этом же в других СМИ

gagadget.com / 4 дня назад

Развитие Game Pass провалилось: за последние годы Xbox не удалось нарастить интерес к сервису — не помогла даже Call of Duty

habr.com / 1 неделю назад

«Лаборатория Касперского» раскрыла результаты ESG-работы за 2024–2025 годы и отчиталась о помощи НКО и киберзащите

incrypted.com / 1 неделю назад

Окончательный тест на прочность перед ралли — в Glassnode проанализировали ситуацию на крипторынке

cursorinfo.co.il / 1 неделю назад

Простой тест на долголетие, который каждый может провести прямо сейчас

cursorinfo.co.il / 1 неделю назад

Время сна выдает ваш интеллект — результаты свежего исследования

Больше по теме

20.06.2026 - 13:31 / cursorinfo.co.il

ИИ провалил тест по математике - результаты эксперимента

Даже самые продвинутые модели ИИ не смогли справиться со всеми задачами в одном из самых сложных тестов по математике.

Современные системы ИИ не смогли справиться с самым сложным математическим испытанием, подготовленным для проверки их способностей к решению исследовательских задач.

Об этом пишет "WION".

Речь идет о проекте First Proof, в рамках которого ведущим ИИ-моделям предложили десять сложных математических задач высокого уровня. Особенность эксперимента заключалась в том, что эти задачи ранее не использовались при обучении нейросетей, поэтому модели не могли опираться на готовые решения или запомненные шаблоны.

В тестировании участвовали разработки OpenAI, включая ChatGPT 5.5 Pro, а также системы, созданные исследовательскими группами Калифорнийского университета, Принстонского университета и Швейцарского федерального института технологий в Цюрихе.

Во время испытания модели работали автономно. Для проверки использовались специальные автоматизированные механизмы, которые заставляли искусственный интеллект неоднократно анализировать и перепроверять собственные ответы. Полученные результаты дополнительно оценивали независимые математики.

Несмотря на использование самых современных технологий, ни одна система не смогла показать безупречный результат. Лучший показатель составил шесть правильно решенных задач из десяти.

Авторы проекта отмечают, что все предложенные задачи ранее уже были решены профессиональными математиками. Тем не менее результаты показали, что искусственный интеллект по-прежнему испытывает трудности при работе с новыми исследовательскими проблемами, где требуется нестандартный подход и глубокое математическое понимание.

Ранее "Курсор" писал, что в ChatGPT обнаружили новую уязвимость.

технологии ученые искусственный интеллект самит Швейцария

Читать на cursorinfo.co.il

Все новости от cursorinfo.co.il

Об этом же в других СМИ

Известный «зеркальный тест» переделали под ИИ — и получили странный результат habr.com / 1 неделю назад

xAI запустила Grok 4.5 в закрытый бета-тест внутри SpaceX и Tesla habr.com / 1 неделю назад

Китайская ПВО «убийца Patriot» провалила дебют – эксперты разочарованы cursorinfo.co.il / 1 неделю назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

11.07 / 17:13

NASA интересное Для фанатов космоса: LEGO анонсировала новый набор, который позволит собрать телескоп Hubble Space Telescope

Космический телескоп Hubble, запущенный в 1990 году, внес неоценимый вклад в исследование вселенной и ее понимание. LEGO решила почтить этот важный для науки объект и выпустила второй тематический набор. Напомним, первый конструктор вышел в 2021 году и был значительно меньше.

11.07 / 16:49

люди здоровье общество самит Здоровье и красота В жару отекают ноги - как быстро облегчить состояние, рассказал врач

Часто люди в случае появления отечности пьют меньше воды, что является распространенной ошибкой.

11.07 / 16:49

продукты связь вода Здоровье и красота болезнь Как употребление газированной воды влияет на ваши почки

Урологи рассказали, есть ли фактическая связь между газированной водой и камнями в почках, или это просто миф.

11.07 / 16:49

iPhone Samsung технологии Apple интересное Больше чем просто обновление – девять главных фишек грядущей iOS 27

Грядущая iOS 27 сделает использование iPhone комфортнее благодаря появлению интересных функций.

11.07 / 16:46

Samsung технологии экспорт общество семья Samsung Galaxy S26 установил рекорд продаж в Южной Корее и помог нарастить экспорт страны

Для сравнения, серии Galaxy S25 потребовалось около шести месяцев, чтобы достичь той же отметки. Еще раньше Galaxy S24 шла к этому результату примерно на два месяца дольше.

11.07 / 16:31

люди депрессия Знаменитости шутеры doom Проблемы в id Software не поставят точку на DOOM: в разработке уже находится новая часть серии

Многочисленные новости о масштабных увольнениях в id Software и уже промелькнувшая информация об отказе от движка id Tech могли ввести в депрессию фанатов игр знаменитого американского разработчика, известного по Doom, Wolfenstein и Quake. Казалось парадоксальным, что глава XBOX Аша Шарма (Asha Sharma) упоминает эти франшизы, как приоритетные для развития компании, но увольняет людей, которые могли бы их создать.

11.07 / 16:09

Состоялся минорный релиз серверной операционной системы SELECTOS 1.4

8 июля вышла минорная версия SELECTOS Mega 1.4. Под катом рассказываю про важное изменение для пользователей.

11.07 / 15:52

экономика общество женщина врачи дефицит Лицо выдаст нехватку железа – пять тревожных сигналов

Внешние изменения на лице, включая темные круги под глазами, могут быть скрытыми сигналами организма о серьезной нехватке железа.

11.07 / 15:52

продукты люди здоровье общество вредные продукты Три продукта, из-за которых вы быстро стареете, назвали врачи

Эксперты назвали три вида продуктов, которые негативно отражаются на состоянии, самочувствии и здоровье.

11.07 / 15:29

связь люди здоровье общество депрессия Не только бодрость: ученые выяснили, как кофе влияет на организм

Оказалось, что любимый напиток не творит чудес с психикой, однако способен защитить печень от опасных заболеваний.

Лента новостей

На главную страницу