OpenAI o3-pro может оказаться слишком умным для светской беседы
Компания OpenAI запустила o3-pro для пользователей Pro в ChatGPT и через API. Новая модель предназначена для предоставления более надёжных и подробных ответов за счёт использования большей вычислительной мощности, хотя это приводит к заметному замедлению времени ответа даже на простые запросы.
Хотя OpenAI не раскрывает конкретных технических деталей, некоторые наблюдатели считают, что o3-pro, как и предыдущий o1-pro, может выполнять несколько проходов для каждого запроса и использовать что-то вроде консенсусного подхода для уточнения ответов.
o3-pro предназначен для сложных задач в таких областях, как математика, естественные науки и программирование, где надёжность важнее скорости. OpenAI рекомендует эту модель для ситуаций, в которых более длительное ожидание ответа является приемлемым компромиссом ради большей точности.
В отличие от o1-pro, o3-pro может работать с более широким спектром инструментов. Модель способна выполнять поиск в интернете, анализировать файлы, обрабатывать визуальные данные, использовать Python и персонализировать ответы с помощью функций памяти. Этот расширенный набор инструментов обычно приводит к увеличению времени ожидания по сравнению с более ранними моделями.
По данным OpenAI, экспертные оценки показывают, что o3-pro превосходит o3 по всем протестированным категориям, особенно в области науки, образования, программирования, бизнеса и поддержки написания текстов. Модель неизменно получает более высокие оценки за ясность, полноту, следование инструкциям и точность. OpenAI использует тест на надёжность, который требует, чтобы модель правильно ответила на вопрос с четырёх попыток, чтобы засчитать ответ как успешный. Академические оценки показывают, что o3-pro превосходит o1-pro и o3 по этим
Читать на habr.com