![]()
2026 年 5 月 28 日,Elon Musk 在 X 上稱,SpaceX 幾乎已經完成內部自研 AI 訓練棧 V1.0。
![]()
這套系統用 C 語言編寫,設計上可精確映射到約 22 萬張 GB300 GPU,并配套 800G 網絡接口卡,重點使用 pipeline parallelism,也就是流水線并行,目標是盡量接近裸機性能。
這里的關鍵,不是 SpaceX 簡單增加 GPU 數量,而是 Musk 指向了 AI 訓練中的另一個瓶頸。
當集群規模擴大到數萬甚至數十萬張 GPU 后,問題不只在算力本身,還在于任務如何拆分、GPU 之間如何通信、數據如何流動、哪些芯片等待、哪些芯片空轉。訓練框架越通用,抽象層越多,在極大規模訓練中越可能出現額外開銷。
Musk 特別拿 JAX 做對比,稱這套 SpaceX 自研訓練棧在大規模訓練任務中的潛在速度提升可能超過一個數量級,也就是理論上可快 10 倍以上。
這個說法很激進,但它解釋了 SpaceX 為什么要用 C 語言重寫底層訓練系統,目的不是做一個更好看的 AI 框架,而是盡可能減少軟件層損耗,讓代碼更貼近 GPU、網絡和內存調度。
Musk 后續又補充稱,下一步將用 C 語言編寫推理棧,用于在一大塊 GB300 集群上進行同步高速強化學習。
他還提到 SpaceX 確實在使用 C++,但不多。
這件事不只涉及訓練,還涉及推理和強化學習閉環,模型需要高速生成結果,再將結果反饋給訓練系統,如果推理跟不上,訓練端的 GPU 就可能等待。
SpaceX 不是只在搭建 AI 算力集群,而是在嘗試重做訓練和推理的底層軟件棧。
Musk 隨后還稱,發布這些內容是為了吸引那些喜歡榨干硬件性能的人加入 SpaceX。
云頭條聲明:如以上內容有誤或侵犯到你公司、機構、單位或個人權益,請聯系我們說明理由,我們會配合,無條件刪除處理。
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.