



Галлюцинации недели: GPT-5.3-Codex-Spark, Sonnet 4.6 и китайский MoE-десант
Шесть флагманских релизов за неделю. Разбираемся, кто реально продвинулся, а кто просто обновил бенчмарки.
GPT-5.3-Codex-Spark, результат партнёрства OpenAI с Cerebras. Заявляют 1000+ tok/sec. Судя по видео, модель работает очень быстро. Контекст 128K (у обычного Codex 400K), но быстрый compacting компенсирует разницу. Groq и Cerebras уже делают быстрый инференс нормой.
Если следующая полноценная модель OpenAI с мощностями Cerebras даст хотя бы 200-300 tok/sec, это может убить главного конкурента в лице Anthropic. Сейчас мы выбираем модель, которая лучше пишет код, но потом будет просто некомфортно работать с моделью, которая выдает 70-80 tok/sec. Как я рассказывал на прошлой неделе, Opus 4.6 Fast в 2.5 раза быстрее обычного Опуса, но в 6 раз дороже. OpenAI за скорость отдельно не берёт, но, чтобы попробовать, нужна подписка Pro за $200.
С момента релиза GPT-5.3-Codex и Opus 4.6 в начале февраля, в твиттере не утихает холивар, всё не могут решить, какая модель лучше. Если вы тоже заинтересовались, вот, по моему мнению, неплохое сравнение. Лично у меня впечатления от этих моделей ровно такие же.
Утром в понедельник я проснулся и увидел новость: OpenAI нанял Питера Штайнбергера, создателя OpenClaw. Возглавит направление персональных агентов. Комьюнити негодует. Сэм Альтман назвал его гением.
А Meta обиделась, что не получилось захантить гения, и релизнула Manus Agents. Очень похоже, что вдохновились OpenClaw.
Мне кажется, если кому сейчас и нужны персональные агенты, так это мобильным устройствам. Особенно Apple с их Siri, про которую уже стыдно вспоминать. Партнёрства то с OpenAI, то с Google Gemini пока не дают результатов.
И пока я это всё писал, Anthropic выпустили Sonnet 4.6. По бенчмаркам подбирается к Opus, а на некоторых
Читать на habr.com