Об этом же в других СМИ

forbes.ua / 1 год назад

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет

gagadget.com / 1 год назад

Поддержка GTA Online может продолжаться даже после релиза GTA VI, - Take-Two

habr.com / 1 год назад

Google Gemini теперь может запоминать прошлые чаты для более точных ответов

habr.com / 1 год назад

Anthropic готовит новую гибридную модель Claude, превосходящую o3-mini-high в кодинге

habr.com / 1 год назад

ИИ-модель DeepSeek превысила 20 млн ежедневных активных пользователей через 21 день после запуска

Больше по теме

31.01.2025 - 08:07 / habr.com

AI-модель o1-mini продолжает улучшаться после критики и нескольких циклов обратной связи

Исследователи из Китайского университета Гонконга в Шэньчжэне, а также представители компаний Qwen от Alibaba и Шэньчжэньского научно-исследовательского института больших данных провели исследование и выявили интересную особенность в работе модели o1-mini от OpenAI. В то время как большинство систем искусственного интеллекта ухудшают свои результаты при попытке исправить собственные ошибки, o1-mini обычно улучшает свою производительность.

В ходе решения математических задач на уровне колледжа o1-mini были отмечены значительные улучшения. В частности, показатель самокритики вырос на 24%, а выполнение заданий ARC стало эффективнее на 19,4%. Исследователи протестировали его в сравнении с некоторыми другими LLM, такими как GPT-4o, модели Qwen2.5, Mistral Large и Llama 3.1, но не включили более крупную модель o1, o1-Pro или какие-либо модели Claude.

Специалисты разработали инновационный подход к тестированию, который получил название RealCritic. Этот метод не только позволяет оценить способность AI выявлять ошибки, но и обеспечивает возможность их исправления. Процесс тестирования представляет собой цикл обратной связи: AI получает задачу и решение, анализирует их, а затем должен предложить более эффективное решение. Критика учитывается только в том случае, если новый ответ действительно лучше исходного.

Это отличается от более ранних тестов, которые просто проверяли, может ли AI указывать на ошибки, не доказывая, что он может их исправлять. По словам исследователей, «признавая, что критика является качественной, если она вносит значимый вклад в самосовершенствование больших языковых моделей, мы предлагаем оценивать качество критики непосредственно по исправлениям, которые она позволяет вносить».

В исследовании рассматривались

связь самит интересное mefdayy Китай Гонконг

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini? habr.com / 1 год назад

В серии Oppo Find X9 появится модель Plus, а Find X8 Mini будет выпущен под другим именем, сообщил известный инсайдер gagadget.com / 1 год назад

Google дополнила Gemini экспериментальными моделями версии 2.0 gagadget.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

17.07 / 20:44

Samsung технологии reddit Samsung объяснила странный дефект экрана Galaxy S26 Ultra: проблема оказалась не такой серьезной, как опасались владельцы

Некоторые владельцы Samsung Galaxy S26 Ultra обратили внимание на необычную особенность дисплея нового флагмана. При использовании смартфона на максимальной яркости под прямыми солнечными лучами в центральной части экрана может появляться легкий красноватый оттенок. Сначала пользователи предположили, что речь идет о серьезной аппаратной неисправности, однако Samsung уже выступила с официальным разъяснением и подтвердила, что готовит программное исправление.

17.07 / 20:12

продукты медицина общество самит жара Как охладить кровать за 10 минут - простой трюк, спасающий от жары

Жаркие летние ночи часто становятся настоящим испытанием, но есть способ с этим справиться.

17.07 / 20:12

туризм общество евро курорт пляж Популярные курорты атакует рыба-монстр - может раздробить кости

На опасное существо начали жаловаться рыбаки, ее уже замечают туристы на популярных пляжах.

17.07 / 20:12

связь люди книги психология Психология и отношения Ученый раскрыл "секрет счастья" - все проще, чем кажется

Известный ученый рассказал, что его жизнь буквально разделилась на две части и после 50 лет он стал счастливым.

17.07 / 20:12

здоровье общество самит Здоровье и красота полезные продукты Какие грибы могут обеспечить надежную защиту от рака

Врачи и диетологи советуют чаще включать в свой рацион грибы - особые элементы в их составе могут надежно защитить от развития раковых клеток.

17.07 / 19:26

самит дети и родители MacRumors 1Password получил интеграцию с Claude: ИИ теперь может входить на сайты без доступа к вашим паролям

Компания 1Password официально объявила о запуске интеграции с ИИ-платформой Claude от Anthropic. Новая функция позволяет искусственному интеллекту использовать сохраненные в менеджере паролей учетные данные для выполнения действий в браузере, при этом сами пароли остаются недоступными как для Claude, так и для серверов Anthropic.

17.07 / 19:26

СМИ общество самит doom Software Аша Шарма не выпотрошила id Software: глава студии призвал не верить пессимистичным заголовкам

id Software стала одной из самых пострадавших студий в ходе “большой перезагрузки” XBOX, запущенной Ашей Шармой (Asha Sharma). Авторы культовых шутеров Doom, Wolfenstein и Quake потеряли 136 человек (из 185) и даже утверждалось, что в студии не осталось никого, кто умеет работать с движком id Tech и другим специфическим инструментарием.

17.07 / 18:47

люди общество болезнь деменция симптомы Эффективная профилактика деменции - как уберечь себя и близких

Эксперты рассказали, как уберечь себя и своих родных от тяжелого возрастного заболевания.

17.07 / 18:38

люди общество самит психология Психология и отношения Как вежливо поставить на место токсичного человека - 10 лучших фраз

Вероятно, каждому из нас доводилось сталкиваться с грубым и неприятным собеседником. Как правильно поставить его на место, не опускаясь до грубости?

17.07 / 18:38

связь люди здоровье климат самоубийство Как глобальное потепление связано с самоубийствами - ответ ученых

Ученые проанализировали последствия глобального потепления, связанные с самоубийствами.

Лента новостей

На главную страницу