Новые тесты Apple показывают, что её ИИ-модели всё ещё отстают от лидеров рынка
Apple опубликовала новые данные о производительности двух своих моделей искусственного интеллекта и открыла доступ к меньшей по размеру системе для сторонних разработчиков. Тесты показывают, что технология LLM от Apple по-прежнему уступает конкурентам.
Apple разработала две модели: компактную версию с 3 миллиардами параметров для использования на устройствах и более крупную серверную модель. По результатам собственных тестов Apple, модель 3B превосходит модели аналогичного размера, такие как Qwen-2.5-3B, и приближается к Qwen-3-4B и Gemma-3-4B. Apple объясняет сокращение разрыва повышением эффективности, но небольшая разница в размерах делает эти заявления менее убедительными.
Серверная модель работает наравне с Llama-4-Scout. Хотя Apple не раскрывает количество параметров, она утверждает, что модель по размеру аналогична Meta* Scout, которая содержит 109 миллиардов параметров и 17 миллиардов активных.
Эта серверная модель использует архитектуру «параллельной смеси экспертов» (MoE), которая позволяет нескольким небольшим системам ИИ работать параллельно. Несмотря на это, она не может конкурировать с более крупными моделями, такими как Qwen-3-235B или GPT-4o.
Apple использует агрессивное сжатие для эффективной работы модели устройства на iPhone и iPad, в то время как в серверной модели применяется специализированная технология сжатия графики.
В области распознавания изображений модель Apple конкурирует с InternVL-2.5-4B, Qwen-2.5-VL-3B-Instruct и Gemma-3-4B. По данным Apple, она превосходит InternVL и Qwen, но уступает только Gemma-3-4B. Серверная модель превосходит Qwen-2.5-VL-32B менее чем в половине тестовых случаев и по-прежнему уступает Llama-4-Scout и GPT-4o.
Apple использует разные системы распознавания изображений для
Читать на habr.com