全球最快計算機的寶座,昨晚換人了。不是漸進式的2%或5%,而是一上來就把前冠軍甩開一個身位——中國深圳的"靈晟"系統,比上一屆霸主、美國勞倫斯利弗莫爾國家實驗室的"酋長巖"快了整整20%以上。
如果你對超算圈略有耳聞,這個數字本身就足夠魔幻。半年前的2024年11月,"酋長巖"登頂時,外界幾乎認定這是美國在高端計算領域筑起的一道難以逾越的墻。那道墻背后,是英偉達和AMD的GPU,是數十年來在高性能芯片上積累的Know-how,是對手想追卻"缺芯"的困境。然而靈晟走了一條完全不同的路:它沒用GPU。一臺都沒用。
![]()
這話得放在當下中美AI芯片博弈的語境里,才嚼得出滋味。過去幾年,華盛頓對GPU出口層層加碼,從高端型號一路卡到中端,邏輯很直白——切斷中國獲取大規模并行計算能力的關鍵硬件,等于掐住了AI訓練和高端仿真的喉嚨。加州大學全球沖突與合作研究所的古德里奇甚至直言,CPU出口管控才是"現行法規中的漏洞"。但靈晟這臺機器恰好證明,當你把所有籌碼都壓在堵住對方某一條路的策略上時,對方可能已經修好了另一條高速。
TOP500榜單的組織者之一、田納西大學教授唐加拉說得直白:"他們通過開發不依賴GPU的系統超越了我們。"這話聽起來像一句平淡的技術點評,但背后是一個設計路線的分岔口。傳統超算的分工很清晰:CPU負責邏輯調度,GPU扛起繁重的矩陣和向量計算,尤其在AI任務中,矩陣乘法是算力消耗的大戶。靈晟的設計者沒去買GPU,而是把GPU擅長的那種并行計算能力,直接做進了CPU內部——通過專用電路加速矩陣和向量運算,把它們和標準微處理器集成在同一塊芯片上。近1400萬個計算核心,塞進90個機柜里,沒有一塊GPU,卻跑出了全球第一的速度。
這個技術選擇的"外溢效應"可能比奪冠本身更值得關注。唐加拉在查驗完深圳的新機器后,提出一個假設:這種底層設計或許能指出一條將AI和傳統科學任務更好融合的路徑。傳統超算用的是64位高精度運算,AI模型那邊早就在用八位甚至四位的低精度近似值來追求速度和規模。美國國家實驗室這幾年也在瘋狂地找中間態——既要64位的科學嚴謹,又想要低精度AI的暴力速度。靈晟這種從芯片設計層面就把兩種能力揉在一起的做法,會不會比"CPU主板插一堆GPU"的拼湊方案更優雅?目前沒人能下定論,但這臺機器至少給出一張可參考的答卷。
但這件事真正讓我停下來想一想的,不是技術上誰甩開了誰,而是中國團隊遲遲不提交測試結果這個細節。追蹤超算行業的分析師斯內爾說了一句話:"中國有實力奪冠的系統并不讓我驚訝,令人驚訝的是他們想要這份認可。"確實,唐加拉和業內專家一直猜測中國有具備沖冠實力的機器,但過去幾年,中國的實驗室明明有東西,卻從不往TOP500送測。這次主動提交的底氣從哪里來?唐加拉在訪華時得到的解釋是:靈晟沒有依賴政府資助,是設計者自行建造的,于是他們認為可以拿測試結果去申請排名。這句話的信息量不小。它暗示了某種程度的自主權——當資金來源不是國家撥款時,向國際榜單提交成績的決策鏈條或許沒那么長。當然,這也意味著,過去那些"隱藏的冠軍",你根本不知道深圳的某個機房里還跑著什么。
不過,有兩點需要拉回地面來講清楚。其一,靈晟的超快速度,更多體現在傳統的超算任務上。古德里奇提醒得很及時:它與美國AI實驗室建造的那些大規模AI超級計算機不是同一類東西。超算跑的是氣候模擬、密碼破譯、核武器設計這類需要極端精度的任務,用的是64位數學;AI模型是另一套邏輯,用低精度近似值去識別圖像、預測句子,速度和規模是核心。兩者不能直接橫向對比。靈晟的"快",快在傳統科學計算賽道,不是在和谷歌、OpenAI的AI訓練集群比誰先跑完大模型。
其二,它卡上了一個微妙的時點。中國初創公司深度求索去年用極小部分的專用AI芯片就做出尖端模型的事還沒涼透,靈晟又補上一刀——你可以卡GPU,但我用CPU堆也能堆出冠軍。特朗普政府加征的關稅和芯片出口限制,在短期內確實拉高了對手的成本,但長期看,這種壓力似乎在倒逼出一些原本不會出現的替代方案。Arm的技術授權在這里扮演了一個耐人尋味的角色:靈晟的芯片是基于Arm指令集的原創設計,而Arm這家由軟銀控股的英國公司,早已通過英偉達、亞馬遜、高通等廠商滲透進全球數據中心。Arm發言人只給了一句標準回應:"在全球范圍內開展業務,均遵守適用的出口管制法律法規。"這句話本身,就是當下地緣技術博弈的縮影。
當然,靈晟不是橫空出世。中國超算在過去十幾年里多次登上TOP500榜首,2017年之后雖無系統登頂,但積累從未中斷。日本的"富岳"也在2020到2022年統治過榜單。正如分析師斯內爾所說,"很多人都說只有美國才有能力建造這些系統,但你會發現其他國家也有這樣的能力。"超算的牌桌上從來不缺玩家,缺的只是愿意亮牌的人。這次深圳的團隊不光亮出一臺冠軍機器,還一口氣提交了14份"戈登·貝爾獎"的申請——這是超算界的奧斯卡,專門獎勵解決復雜科學問題的突破性應用。目前已有三個系統入圍,另有三個入圍氣候科學獎項。他們用靈晟跑的應用包括地球精密模擬——從大氣到冰層,以及人腦的復雜仿真。
說實話,一臺沒裝GPU的超算拿下全球第一,這事兒本身就有點黑色幽默。它像是在說,當規則被人為收緊時,創造力反而會被擠出來。至于這條路能走多遠,靈晟的芯片到底由哪家代工廠生產、用的是什么工藝節點,設計者至今未披露。唐加拉的報告中這一欄仍然空白。也許下一次榜單更新時,我們能看到更多藏在機柜里的答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.