Об этом же в других СМИ

OpenAI блокирует китайские аккаунты за слежку в социальных сетях

habr.com / 1 год назад

Google удаляет Gemini из основного поискового приложения на iOS

forbes.ua / 1 год назад

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет

habr.com / 1 год назад

Google Gemini теперь может запоминать прошлые чаты для более точных ответов

hitechexpert.top / 1 год назад

OpenAI отклонила предложение Маска о покупке компании

Больше по теме

05.02.2025 - 09:52 / habr.com

Технологический баттл: OpenAI o3-mini против DeepSeek-R1

Вчера OpenAI выпустила o3-mini — усовершенствованную и более экономичную модель для решения сложных задач в математике, науке и программировании. Модель уже доступна в ChatGPT (включая бесплатную версию) и через API.

Основные улучшения:

• Ускоренное вычисление и сниженная цена. По оценкам OpenAI, o3-mini на 24% быстрее предшественницы o1-mini и обходится дешевле примерно на 63%. Это делает новую модель более выгодной в использовании, учитывая ее высокие «когнитивные» способности.

• Глубина рассуждений. Впервые в линейке рассуждающих моделей OpenAI реализовала три уровня сложности рассуждений — низкий, средний и высокий. В зависимости от уровня запроса и требуемой точности разработчик может либо сэкономить на токенах и времени отклика, либо максимально усилить логику решения.

• Математика и код. По внутренним тестам o3-mini на среднем уровне рассуждений практически не уступает модели o1 при решении олимпиадной математики (например, AIME) и задач на код (Codeforces, SWE-Bench). При высоком уровне рассуждений o3-mini порой превосходит o1, но с чуть большей задержкой (на AIME точность o3-mini — около 83,6%, опережая o1). В задачах соревновательного программирования (Codeforces) o3-mini с высоким уровнем рассуждений достигает 2073 Elo и заметно превосходит o1-mini.

• Безопасность. Разработчики добавили механизм «делиберативного согласования» (deliberative alignment), при котором модель явно анализирует инструкции по безопасности перед выдачей ответа. Это повышает устойчивость к «jailbreak»-атакам.

Модель o3-mini в среднем быстрее и дешевле, чем o1, сохраняя при этом близкий уровень точности в STEM-задачах (задачи из науки, технологий, инжиниринга и математике), а опция выбора уровня рассуждений дает возможность адаптировать

технологии экономика общество семья биологи крипто eps

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

OpenAI удаляет некоторые предупреждения о содержании из ChatGPT hitechexpert.top / 1 год назад

OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini? habr.com / 1 год назад

Илон Маск хочет купить OpenAI за $97.4 млрд hitechexpert.top / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

16.07 / 15:42

продукты банк еда организм Дом и интерьер Дата роли не играет - консервы могут быть опасными для организма

Срок годности, который написан на крышке консервы, не всегда является определяющим фактором пригодности продукта.

16.07 / 15:24

технологии вирус расследование заражение google Жителя Флориды арестовали за распространение зловредного ПО и кражу криптоактивов

Агенты Федерального бюро расследований (ФБР) арестовали 21-летнего жителя Флориды. Его подозревают в расспространении вредоносного ПО через компьютерные игры для доступа к персональным данным, включая ключи к криптокошелькам, сообщает WPLG Local 10. По данным ФБР, арестованный Зайир Донтаевиус Замарион Уилкинс и его сообщники использовали для своей схемы некую «популярную компанию по цифровой дистрибуции программного обеспечения», вероятно, Steam. Они распространяли через нее зараженные игры. Среди тех, что фигурируют в обвинительном постановлении, указаны: BlockBlasters, Chemia, Dashverse/DashFPS, Lampy, Lunara, PirateFi и Tokenova. Отметим, эти игры фигурировали

16.07 / 15:24

экономика закон доллар Tether usdt Circle выиграла арбитражное дело против связанного с Tether фонда

Компания Circle, эмитент стейблкоина USDC, выиграла арбитражный спор против криптофонда Heka Funds, который поддерживает Tether, пишет FT. Детали дела стали публичными после подачи документов в федеральный суд в Бостоне. В центре конфликта — подозрения Circle, что фонд использовал арбитражные операции с USDC для укрепления позиций своего конкурента Tether. Арбитраж криптовалют: все, что нужно знать в одной статье 14.08.2024 Читать Как возник конфликт между Circle и фондом Heka Согласно материалам дела, в конце 2023 года Circle заблокировала доступ мальтийскому фонду Heka Funds, которым управляет лондонская Abraxas Capital Manag

16.07 / 15:15

бизнес финансы люди экономика деньги Нумерология богатства: как рассчитать свой денежный код

Дата вашего рождения скрывает в себе ваш денежный потенциал, говорят эксперты.

16.07 / 15:13

технологии Apple политика финансирование t-mobile Apple изменила важное правило покупки iPhone в США: теперь смартфоны с рассрочкой могут оказаться заблокированными

Ранее покупатели могли оформить финансирование у одного из операторов-партнеров Apple и при этом получить разблокированный iPhone, который работал с SIM-картами любых операторов. Новая политика компании закрывает такую возможность.

16.07 / 15:00

технологии самит интересное Realme токен Realme Narzo 100x 5G: смартфон с батареей на 8000 мА/ч, который будет работать три дня без подзарядки

Realme решила, что заряжать смартфон каждую ночь — это развлечение не для каждого, и представила Narzo 100x 5G. Главная фишка здесь очевидна: аккумулятор емкостью 8000 мА/ч. Компания обещает, что этого хватит на три дня активного использования. Но интереснее другое — выносливость самого элемента питания. По заявлению производителя, батарея сохранит более 80% своей емкости даже после 1600 циклов зарядки, что эквивалентно примерно четырем годам эксплуатации.

16.07 / 14:53

продукты здоровье общество питание кулинария Когда солить разные виды мяса, чтобы оно не стало сухим

Время добавления соли кардинально влияет на сочность и текстуру мяса, говорят специалисты.

16.07 / 14:53

продукты здоровье продукты питания общество самит Действительно ли морская соль полезнее каменной, рассказали эксперты

Морская соль содержит минералы, но их количество слишком мало, чтобы существенно влиять на здоровье.

16.07 / 14:53

технологии ученые самит человек мозг Привычку, которая каждый день незаметно истощает мозг, назвали ученые

Ученые выяснили, что мозг может истощаться даже после полноценного сна и без серьезных физических или умственных нагрузок.

16.07 / 14:38

технологии происшествия Tesla расследование google Хакеры похитили почти $24 млн из DeFi-протокола Ostium через манипуляцию ценовым оракулом

DeFi-протокол Ostium подвергся масштабному взлому, в результате которого из публичного пула ликвидности OLP было похищено около $23,75 млн. По данным исследователей, после атаки злоумышленник обменял все похищенные 23,75 млн USDC на 12 084 ETH по средней цене около $1966 за монету. Впоследствии большую часть Ethereum перевели в криптомиксер Tornado Cash, чтобы скрыть происхождение средств. Отметим, Ostium — это платформа для синтетических деривативов, где пользователи могут открывать позиции на акции таких компаний, как Tesla, Nvidia или Meta. Хакер воспользовался уязвимостью ценового оракула По информации исследовательс

Лента новостей

На главную страницу