Об этом же в других СМИ

habr.com / 6 месяцев назад

Новые подробности о рекламе в ChatGPT: OpenAI обсуждает приоритет объявлений в ответах

incrypted.com / 6 месяцев назад

СМИ: OpenAI выпустит аудиомодель для физических устройств и ChatGPT

habr.com / 6 месяцев назад

Нейросеть для 3D-аниматоров: Tencent открывает код HY-Motion 1.0 для оживления персонажей через промпт

habr.com / 6 месяцев назад

В платформе Mistral обнаружен бета-интерфейс для создания рабочих процессов

habr.com / 6 месяцев назад

Научный прорыв: ИИ доказал способность усиливать, а не подавлять человеческую креативность

Больше по теме

18.12.2025 - 19:03 / habr.com

FrontierScience: OpenAI выпустила бенчмарк PhD-сложности для проверки научного мышления ИИ

Компания OpenAI решила проверить, на что действительно способны её модели в сфере научного прогресса, и поделилась интересными результатами, которые сочетают в себе как теоретические тесты, так и реальную лабораторную работу.

Чтобы понять, насколько модель может рассуждать как эксперт, нужны и соответствующие задачи. Команда OpenAI выпустила новый бенчмарк под названием FrontierScience. Его цель — измерить научное мышление на уровне PhD в физике, химии и биологии.

В FrontierScience вошли сложные, написанные экспертами задачи (как олимпиадного стиля, так и более длинные исследовательские задания), призванные выявить сильные и слабые стороны моделей. Как заявляют разработчики, данный бенчмарк — шаг к более сложным и значимым тестам, которые нужны этой области.

Новейшая GPT-5.2 показала наилучший результат в этом испытании. Но что важно: сам бенчмарк выявил любопытный разрыв. Модели могут хорошо справляться со структурированными проблемами, но открытое, итеративное мышление, необходимое в реальных исследованиях, — это пока другой уровень сложности.

OpenAI пошли дальше тестов и попробовали силы модели в реальных условиях.

Они сотрудничали с биотехкомпанией Red Queen Bio, чтобы проверить, как модели могут оптимизировать лабораторные протоколы. Суть эксперимента: GPT-5.2 получал задачу, предлагал, запускал (через контролируемую среду) и итеративно улучшал эксперименты.

Фокус был на молекулярном клонировании — одном из фундаментальных инструментов биологии. И здесь результаты впечатляют: модель смогла повысить эффективность стандартного протокола в 79 раз, применяя набор методик, в числе которых — подход, основанный на использовании ферментов.

Ссылки по теме:

Анонс FrontierScience на сайте OpenAI;

Статья об ускорении биологических

технологии самит биологи интересное крипто dmitrifriend

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Шестое чувство: Google готовит ИИ-подсказки для Android, предугадывающие действия пользователя habr.com / 6 месяцев назад

Alibaba анонсировала Qwen3-TTS-VD-Flash и Qwen3-TTS-VC-Flash: модели для синтеза и клонирования голоса habr.com / 6 месяцев назад

«Вы — креативный дебаггер»: OpenAI осторожно скопировала самую популярную фичу декабря habr.com / 6 месяцев назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 00:50

здоровье продукты питания общество самит правильное питание Вместо кофе — почему перед спортзалом нужно понюхать шоколад

Новое исследование показало, что вдыхание аромата горького шоколада помогает сделать тренировку эффективнее и одновременно снижает чувство голода.

17.07 / 00:39

продукты YouTube reddit google gemini Google интегрировала Canva, YouTube Music и Instacart в режим AI Mode в своём поисковом сервисе

Google объявила о новых возможностях режима AI Mode в своём поисковом сервисе. Теперь пользователи в США могут подключать к нему Canva, YouTube Music и Instacart, чтобы выполнять различные задачи с помощью ИИ через поиск. Интеграции начали внедрять на этой неделе.

16.07 / 23:19

связь люди здоровье общество самит Количество кофе, которое может продлить жизнь, назвали ученые

Ученые проанализировали данные почти 450 тысяч человек и определили оптимальную ежедневную норму кофе

16.07 / 23:17

продукты Amazon экспорт Nvidia самит Google открыла k8s-aibom — контроллер Kubernetes для инвентаризации ИИ-нагрузок

Google Cloud опубликовала исходный код k8s-aibom — контроллера Kubernetes, который обнаруживает запущенные в кластере ИИ-компоненты и автоматически формирует ведомости компонентов машинного обучения в формате CycloneDX 1.6 ML-BOM. Инструмент собирает данные из фактического состояния кластера, поэтому способен находить в том числе нагрузки, которые не были зарегистрированы во внутренних системах компании.

16.07 / 22:38

технологии экономика общество В последнее время многие современные ноутбуки стали выходить без HDMI-порта

Производители ноутбуков стали чаще исключать порты HDMI из-за желания уменьшить размеры лэптопа и расширения возможностей USB-C, пишет журнал SlashGear.

16.07 / 21:57

Sony Разработчикам эмулятора KytyPS5 удалось запустить GTA V, Quake II и другие трёхмерные игры

Разработчики эмулятора PlayStation 5 KytyPS5 выпустили обновление, в котором им впервые удалось запустить GTA V, QuakeII и другие трёхмерные игры. Проекты запускаются с разной производительностью, но разработчики считают, что сейчас важно добиться максимальной совместимости.

16.07 / 20:25

технологии происшествия Apple вирус самит На Mac обнаружили опасный вирус CrashStealer, который маскируется под системную утилиту Apple

Специалисты Jamf Threat Labs обнаружили новое вредоносное ПО для macOS под названием CrashStealer, которое выдает себя за встроенную систему отправки отчетов об ошибках Apple. По данным исследователей, вирус способен незаметно похищать конфиденциальную информацию пользователя, включая пароли, данные браузеров и криптовалютных кошельков.

16.07 / 19:57

здоровье общество депрессия лечение антидепрессанты Какие лекарства нельзя принимать на ночь - предупреждение медиков

Некоторые препараты могут слабо проявлять свое действие. если пить их на ночь, а некоторые и вовсе нанести вред здоровью.

16.07 / 19:57

связь здоровье алкоголь общество болезнь Какое количество алкоголя резко увеличивает риск болезней

Безопасной дозы спиртного не существует, говорят врачи, но есть смертельно опасная доза.

16.07 / 19:48

технологии Яндекс Telegram общество политика «Солар»: злоумышленники используют спрос на инструменты для обхода блокировок Telegram

С февраля 2026 года Роскомнадзор ограничивает работу мессенджера Telegram на территории России. Пользователи пытаются обойти ограничения и ищут доступные способы на просторах интернета. Этим начали пользоваться злоумышленники. Эксперты центра исследования киберугроз Solar 4RAYS ГК «Солар», ведущего провайдера комплексной кибербезопасности в России, обнаружили в топе поисковой выдачи вредоносные клоны популярных прокси-сервисов. Причем размещены они как на официальной платформе для хостинга ИТ-проектов GitHub, так и на ее зеркалах.

Лента новостей

На главную страницу