為什么超級計算機用的是cpu集群而不是顯卡集群?算力不是由gpu提供嗎,更何況用于物理模擬高精度算力的時候顯卡也能發揮作用
現在的很多超級計算機其實是CPU+GPU組合起來一起使用,而不是單獨來說。
![]()
從功能上講CPU 擅長數據和邏輯運算,像控制和調度任務這些它很在行。GPU 適合大規模并行計算,像處理圖像、視頻這種需要大量算力的任務就交給它。它們一起工作,能讓超級計算機的性能更強大。
當然也有偏向性,銀行金融類主要處理數據和交易邏輯,CPU 用得多。像影視制作、游戲開發這類涉及大量圖像渲染處理的,就更依賴 GPU,當然也離不開 CPU 協調,很多時候還是兩者結合來滿足復雜需求。
他們是它是靈活布局的形式,以 CPU 為主能保證高效穩定。影視游戲強調圖形處理,GPU 多些能提升畫面效果。
![]()
說白了CPU就像全能的大教授,擅長處理復雜的邏輯和調度;而GPU雖然算力強,但更像是只會干重復活的“流水線工人”,只適合特定計算。超算要解決的是各種復雜問題,光靠“流水線工人”可搞不定,還得靠CPU集群來統籌大局。
我們現在的討論主要基于功能、場景和特定角度。其實很多時候,兩者并非完全不可替代,比如CPU可以承擔部分GPU的工作,反之亦然。但在實際應用中,我們必須綜合考慮成本、效能,以及整體布局上的省心省力。這才是需要細化的關鍵考量。
![]()
我們要知道技術上能替代不代表商業上劃算。用CPU干GPU的活,那電費都能把公司燒破產,這就叫效能不匹配。再加上研發周期、部署難度這些隱形成本,老板們肯定得算總賬。
超算的核心不是選擇“CPU集群”或“GPU集群”,而是根據任務需求選擇最合適的計算架構。現代超算早已進入“CPU+GPU”異構時代,例如全球最快的Frontier超算就混合使用了AMD EPYC CPU和Instinct MI250X GPU,實現了1.194 EFlop/s的峰值性能。這種組合的關鍵在于揚長避短:CPU負責復雜邏輯控制和任務調度,像“全能教授”統籌全局;GPU則承擔大規模并行計算,如同“流水線工人”高效處理重復任務。
![]()
科學計算的高精度需求是CPU不可替代的關鍵原因。例如地震預測或材料模擬需要FP64雙精度計算,GPU雖然能支持,但成本極高——單塊高精度GPU價格可達普通GPU的數倍,大規模集群替換會帶來天價開銷。GPU的并行優勢依賴于規整的數據結構,而超算任務常涉及復雜分支和不規則計算,此時CPU的靈活性更具優勢。成本與能效比也是重要考量。企業級GPU集群的平均利用率僅5%,閑置資源造成巨大浪費。
而CPU在通用計算中的能效比更優,例如靈晟系統通過國產CPU與液冷技術,實現了50GF/W的能效比,遠超純GPU方案。同時,GPU的高功耗導致散熱和電力成本飆升,進一步限制了其在超算中的單一應用。
![]()
未來超算的趨勢是更深度的異構融合。英偉達Grace CPU與GPU的結合、英特爾Falcon Shores架構,以及國產超算如“思源一號”的CPU+GPU混合設計,都證明了協同計算的價值。或許我們該問:當AI大模型訓練僅需超算10%的GPU資源就能完成時,純GPU集群是否真的必要?對此大家是怎么看的,歡迎關注我“創業者李孟”和我一起交流!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.