DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно
11 марта на платформе OpenRouter без какого-либо анонса появились две бесплатные ИИ-модели — Hunter Alpha и Healer Alpha. Ни пресс-релиза, ни поста в блоге, ни указания разработчика — только пометка «стелс-модель». За неделю Hunter Alpha обработала более 160 млрд токенов, а в сообществе разработчиков разгорелась дискуссия: не тестирует ли DeepSeek свою модель следующего поколения прямо на глазах у всех?
На странице Hunter Alpha указано, что это модель с 1 трлн параметров и контекстным окном в 1 млн токенов, заточенная под агентное использование — долгосрочное планирование, сложные рассуждения и многошаговое выполнение задач. Ее компаньон Healer Alpha позиционируется как мультимодальная модель с поддержкой текста, изображений и аудио и контекстом в 262 тысячи токенов — можно предположить, что речь идет о Lite-версии модели. Когда журналисты Reuters протестировали чатбот, тот назвал себя "китайской ИИ-моделью, обученной преимущественно на китайском языке" с датой отсечки данных — май 2025 года, что совпадает с параметрами предыдущих версий DeepSeek. На вопрос о создателе бот ответил: "Я знаю только свое имя, количество параметров и длину контекстного окна".
Характеристики Hunter Alpha совпадают с ожиданиями от DeepSeek V4 — модели нового поколения, запуск которой китайские СМИ прогнозируют уже в апреле. ИИ-инженер Дэниел Дьюхерст, проанализировавший модель, считает главным сигналом паттерн цепочки рассуждений: "Стиль рассуждения сложно замаскировать — он отражает, как модель обучалась". Кроме того, пользователи обнаружили в системных промптах фразу о необходимости "строго соблюдать китайское законодательство" — типичное требование для китайских моделей, которого нет у западных разработчиков. Еще одна зацепка: за несколько
Читать на habr.com