DeepSeek вызвал истерику у американских ИИ корпораций
Сегодняшняя новость настолько значима, что я не могу обойти её стороной. Расскажу вам несколько интересных фактов, связанных с китайской нейронной сетью DeepSeek, которая буквально встряхнула мировой технологический ландшафт.
Почему модель от DeepSeek R1 за сутки стала лидером?
Успеху DeepSeek во многом способствовала новая архитектура Multi-head Latent Attention (MLA), которая позволила сократить стоимость обучения на 90%, игнорируя 95% ненужных данных. Вопрос остаётся открытым: это гениальное упрощение или просто экономия на алгоритмах? Как бы то ни было, результат поражает, что DeepSeek обогнал ChatGPT по всем основным бенчмаркам. Модели серии R1 обучались математике методом проб и ошибок, как аспиранты, и в итоге достигли уровня GPT-4, но при этом оказались на 95% дешевле.
В бесплатной версии ChatGPT существует ограничение на количество запросов, которые вы можете отправить. Это число варьируется в зависимости от нескольких факторов, главным из которых является длина и сложность ответа, который вы хотите получить.
В среднем, можно рассчитывать на 20–50 запросов в час. Если вы задаете короткие и простые вопросы, такие как «Какая погода сегодня?», лимит будет ближе к 50. Однако, если вам требуется развернутый и детализированный ответ на сложный запрос, например, «Напишите эссе о влиянии искусственного интеллекта на общество», количество доступных запросов может сократиться до 20 или даже меньше.
На платформе chat.deepseek.com я тестировал работу чат-бота DeepSeek и за всё время использования не столкнулся с оплатой или ограничениями. Возможно, у DeepSeek есть скрытые лимиты, но я их не достиг, даже при активной нагрузке.
Кроме того, производительность DeepSeek приятно удивила. В отличие от многих других ИИ-чатов, которые
Читать на habr.com

