



Царь бесконечного пространства. Нейросеть Карпати первой обучили в космосе на текстах Шекспира
Стартап Starcloud впервые в истории провел полный цикл обучения языковой модели на орбите. На борту спутника Starcloud-1 размером с небольшой холодильник работает Nvidia H100 — GPU в сто раз мощнее любого чипа, когда-либо запущенного в космос. На нем компания обучила с нуля nanoGPT, минималистичную реализацию GPT от Андрея Карпати, бывшего главы AI в Tesla и сооснователя OpenAI. Тренировочным датасетом послужило полное собрание сочинений Шекспира — и теперь модель отвечает на запросы в стиле елизаветинской эпохи.
Параллельно на спутнике запустили Gemma, открытую модель Google DeepMind. Первое сообщение, отправленное на Землю: "Greetings, Earthlings! Or, as I prefer to think of you — a fascinating collection of blue and green" ("Приветствую, земляне! Или, как я предпочитаю о вас думать, — удивительное собрание синего и зеленого"). Трис Варкентин, продакт-директор Google DeepMind, отметил, что успешная работа Gemma в жестких условиях космоса подтверждает гибкость и устойчивость открытых моделей.
Важно понимать: раньше языковые модели в космос уже отправляли. На МКС развернули Space Llama от Booz Allen и HPE для помощи астронавтам, на китайской станции работает ассистент "Укун". Но все они были обучены на Земле и загружены готовыми. Starcloud делает акцент именно на том, что весь процесс обучения прошел на орбите, а затем готовую модель .
Зачем вообще тащить вычисления в космос? Starcloud продвигает концепцию орбитальных дата-центров: постоянный доступ к солнечной энергии без смены дня и ночи, охлаждение без воды (но сначала надо освоить достаточно сложные технологии), нет необходимости согласований с властями. Кроме того, по прогнозам спрос на орбитальные вычисления будет только расти — в космосе увеличивается количетство
Читать на habr.com