Открытая GLM-5.2 обошла Fable 5 в дизайне — в Design Arena раскрыли секрет успеха
Открытая модель GLM-5.2 от Z.ai заняла первое место в single-turn веб-дизайне на Design Arena, обойдя Claude Fable 5 и Opus 4.8 — модели Anthropic, которая держала вершину этой категории месяцами. Но интереснее не сам факт, а разбор, который Design Arena выпустила следом: модель выигрывает по контринтуитивной причине.
Если прогнать через GLM-5.2 тысячу разных запросов и сгруппировать результаты по похожести, окажется, что модель чаще выдает однотипные, почти шаблонные сайты. Fable 5 в том же тесте разнообразнее и универсальнее. Казалось бы, гибкость должна выигрывать — но нет. Шаблоны GLM-5.2 просто качественные: в них нет типичных для ИИ антипаттернов вроде фиолетовых градиентов, и по предпочтениям пользователей такая "высокая база" обходит разнородную выдачу конкурента.
Вторая половина успеха — то, что код GLM-5.2 чаще просто работает. Design Arena выделяет несколько причин:
надежная работа с внешними библиотеками: chart.js и three.js, на которых часто спотыкаются другие модели, дают +6 п.п. винрейта на тех 21% сессий, где они используются;
TailwindCSS в 91% сессий против 57% у Opus 4.8 — отсюда более проработанные интерфейсы;
готовые картинки с внешних CDN вместо самодельной графики и в целом лучше выстроенный лэйаут, особенно в первом экране.
За это приходится платить временем. GLM-5.2 пишет примерно на 25% больше кода и генерирует сайт вдвое дольше — в среднем 304.7 секунды против вдвое меньшего у Fable 5, которая, наоборот, лаконична (на 38% меньше строк). При этом длиннее не значит лучше: выигрыш от объема упирается в потолок, а оптимальным Design Arena называет коридор примерно в 46–57 тысяч символов.
Оговорка важная: разбор сделала сама Design Arena, он касается только single-turn задач без агентного режима и
Читать на habr.com