



Названа новая угроза для ИИ: GPU для обучения живут 1–3 года вместо заявленных шести
Крупнейшие технологические компании — Microsoft, Amazon, Google, Oracle и OpenAI — планируют вложить около триллиона долларов в дата-центры для искусственного интеллекта в ближайшие пять лет. Но у этой ставки есть уязвимое место: GPU для обучения моделей, возможно, не проживут и половину срока, который закладывают в бухгалтерские расчеты.
По данным CNN, эксперты оценивают реальный срок службы чипов для обучения больших языковых моделей в 18 месяцев — 3 года. После этого GPU могут использоваться для менее интенсивных задач вроде инференса (запуск готовых моделей) еще несколько лет, но для передовых задач они уже не годятся. Для сравнения: обычные процессоры в дата-центрах служат 5–7 лет. По данным Princeton CITP Blog, архитектор Google оценил, что при стандартной для ИИ-нагрузок загрузке в 60–70% GPU выдерживают 1–2 года, максимум — 3.
Причина — в экстремальных условиях работы. Современные дата-центровые GPU потребляют более 700 Вт мощности и генерируют огромное количество тепла. Это создает постоянный термический и электрический стресс для полупроводников. По статистике, около 9% GPU выходят из строя в течение года — против 5% у традиционных CPU. Но физический износ — не единственная проблема. Nvidia перешла на ежегодный цикл выпуска новых чипов вместо двухлетнего, и каждое поколение дает кратный прирост производительности на ватт. Это означает, что даже работающий трехлетний чип становится экономически бессмысленным: дешевле заменить его на новый, чем платить за электричество.
Вторичный рынок подтверждает эту логику. Цены аренды H100 упали на 70% от пика — с более чем 8 до примерно 2,5 доллара в час. К декабрю 2025 года ставки на H100 и более старые A100 практически сравнялись, хотя по производительности они отличаются
Читать на habr.com