«Сэму Альтману пока не о чем беспокоиться»: Grok-3 не обгоняет топовые решения OpenAI
В понедельник Илон Маск презентовал Grok-3 — новую версию чат‑бота от xAI, заявив, что он «на порядок мощнее» своей предыдущей версии. Некоторые эксперты и исследователи ИИ протестировали Grok-3 и дали неоднозначные отзывы.
Маск утверждает, что новый бот превосходит GPT-4o от OpenAI, а также решения от Google, DeepSeek и Anthropic по ключевым показателям в математике, науке и программировании. «Мы ежедневно улучшаем модели, и буквально за 24 часа вы сможете увидеть прогресс», — заявил Маск во время прямой трансляции на платформе X, где его сопровождали три инженера xAI.
Андрей Карпатый, сооснователь OpenAI и бывший руководитель ИИ‑направления в Tesla, отметил в посте на X, что Grok-3 успешно справляется с поиском сложной информации в обучающих материалах, однако, подобно OpenAI o1-pro, он испытывает затруднения при решении хитроумных партий в крестики‑нолики. «В целом создаётся впечатление, что этот уровень сопоставим с o1-pro и немного опережает DeepSeek‑r1. Но конечно, нужны более детальные тесты», — добавил Карпатый, который одним из первых получил доступ к Grok-3.
Одновременно xAI представила новый инструмент для Grok-3 — DeepSearch, который должен улучшить работу с исследованиями, мозговыми штурмами и анализом данных, объясняя при этом процесс обработки запросов. По данным Business Insider, стартап разрабатывал этот инструмент как минимум с конца прошлого года. Карпатый отметил, что DeepSearch «примерно сопоставим с DeepResearch от Perplexity, что уже неплохо, но всё же уступает недавно выпущенному OpenAI Deep Research, который кажется более детализированным и надёжным».
Итан Моллик, профессор Уортонской школы бизнеса при Пенсильванском университете, изучающий ИИ, считает, что, несмотря на быстрый рост xAI, Grok-3 пока
Читать на habr.com

