網易首頁 > 網易號 > 正文申請入駐

為什么說純GPU堆不出真正的超算？CPU的關鍵作用被低估了

2026-05-24 21:20:40　來源: 創業者李孟

陜西舉報

分享至

為什么超級計算機用的是cpu集群而不是顯卡集群？算力不是由gpu提供嗎，更何況用于物理模擬高精度算力的時候顯卡也能發揮作用

現在的很多超級計算機其實是CPU+GPU組合起來一起使用，而不是單獨來說。

從功能上講CPU 擅長數據和邏輯運算，像控制和調度任務這些它很在行。GPU 適合大規模并行計算，像處理圖像、視頻這種需要大量算力的任務就交給它。它們一起工作，能讓超級計算機的性能更強大。

當然也有偏向性，銀行金融類主要處理數據和交易邏輯，CPU 用得多。像影視制作、游戲開發這類涉及大量圖像渲染處理的，就更依賴 GPU，當然也離不開 CPU 協調，很多時候還是兩者結合來滿足復雜需求。

他們是它是靈活布局的形式，以 CPU 為主能保證高效穩定。影視游戲強調圖形處理，GPU 多些能提升畫面效果。

說白了CPU就像全能的大教授，擅長處理復雜的邏輯和調度；而GPU雖然算力強，但更像是只會干重復活的“流水線工人”，只適合特定計算。超算要解決的是各種復雜問題，光靠“流水線工人”可搞不定，還得靠CPU集群來統籌大局。

我們現在的討論主要基于功能、場景和特定角度。其實很多時候，兩者并非完全不可替代，比如CPU可以承擔部分GPU的工作，反之亦然。但在實際應用中，我們必須綜合考慮成本、效能，以及整體布局上的省心省力。這才是需要細化的關鍵考量。

我們要知道技術上能替代不代表商業上劃算。用CPU干GPU的活，那電費都能把公司燒破產，這就叫效能不匹配。再加上研發周期、部署難度這些隱形成本，老板們肯定得算總賬。

超算的核心不是選擇“CPU集群”或“GPU集群”，而是根據任務需求選擇最合適的計算架構。現代超算早已進入“CPU+GPU”異構時代，例如全球最快的Frontier超算就混合使用了AMD EPYC CPU和Instinct MI250X GPU，實現了1.194 EFlop/s的峰值性能。這種組合的關鍵在于揚長避短：CPU負責復雜邏輯控制和任務調度，像“全能教授”統籌全局；GPU則承擔大規模并行計算，如同“流水線工人”高效處理重復任務。

科學計算的高精度需求是CPU不可替代的關鍵原因。例如地震預測或材料模擬需要FP64雙精度計算，GPU雖然能支持，但成本極高——單塊高精度GPU價格可達普通GPU的數倍，大規模集群替換會帶來天價開銷。GPU的并行優勢依賴于規整的數據結構，而超算任務常涉及復雜分支和不規則計算，此時CPU的靈活性更具優勢。成本與能效比也是重要考量。企業級GPU集群的平均利用率僅5%，閑置資源造成巨大浪費。

而CPU在通用計算中的能效比更優，例如靈晟系統通過國產CPU與液冷技術，實現了50GF/W的能效比，遠超純GPU方案。同時，GPU的高功耗導致散熱和電力成本飆升，進一步限制了其在超算中的單一應用。

未來超算的趨勢是更深度的異構融合。英偉達Grace CPU與GPU的結合、英特爾Falcon Shores架構，以及國產超算如“思源一號”的CPU+GPU混合設計，都證明了協同計算的價值。或許我們該問：當AI大模型訓練僅需超算10%的GPU資源就能完成時，純GPU集群是否真的必要？對此大家是怎么看的，歡迎關注我“創業者李孟”和我一起交流！

聲明：內容由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.