網易首頁 > 網易號 > 正文 申請入駐

互聯戰爭:被群毆的英偉達

0
分享至

今年早些時候,外媒曝光了微軟與OpenAI的一項“瘋狂計劃”:斥資千億美金,定制一個史無前例的數據中心。然而,面對這一重大利好,英偉達卻心情復雜:

爆料顯示,OpenAI拒絕使用英偉達的InfiniBand網絡設備,轉而投奔以太網的陣營[1]。

眾所周知,一個數據中心往往有數千甚至上萬臺服務器;而連通這些服務器的,正是以InfiniBand和以太網為代表的網絡互聯技術。

英偉達是InfiniBand路線的主要玩家,獨家提供了相關的交換機、電纜等硬件設備;其余的科技公司,則扎堆在以太網賽道。

英偉達Quantum-X800 InfiniBand 交換機

OpenAI的“反水”,對英偉達而言是個巨大噩耗。

要知道,InfiniBand與以太網,彼此已互相競爭多年。InfiniBand曾一度遙遙領先:2015年時,超級計算機Top500榜單中,超半數的上榜者都在使用InfiniBand。但在當下,隨著大客戶陸續倒戈,InfiniBand正在輸掉比賽。

去年7月,AMD、微軟等9家硅谷大廠聯手成立了超以太網聯盟(UEC),準備徹底擊潰InfiniBand。今年一季度,英偉達的InfiniBand網絡設備收入,出現了環比下降[2]。與數據中心等一路狂飆的業務相比,顯得格外突出。

那么問題來了:

1.英偉達的“親兒子”InfiniBand,為何會處于劣勢?

2.對于英偉達而言,互聯為何是場不能失敗的競賽?

派別之爭

InfiniBand的初衷,是為了解決當前算力最大的瓶頸——傳輸速度。

兩臺服務器連接在一起,“1+1”所實現的算力必定會“小于2”,因為數據傳輸速度遠遠小于服務器的算力??梢园衙颗_服務器,想象成一座擁有一萬輛卡車的小城鎮;受制于客觀環境,每天只能往隔壁城鎮運輸200卡車的貨物。

數據中心則是由上千個小鎮構成的王國。小鎮與小鎮之間的運輸問題,會嚴重拖累整個王國的發展。

而限制傳輸速度的罪魁禍首,是落后的網絡協議。

所謂網絡協議,可以簡單理解為一種“交通規則”。計算機之間的信息傳輸,都沿著這一“交通規則”有序進行。最初的交通規則 ,是一種名為TCP/IP的網絡協議。

這項交通規則,有個明顯缺陷:數據在傳輸時,需要經過CPU,極度占用CPU資源,導致延遲特別高。

相當于卡車運貨的公路上,設有大批人工收費站。車子每開一段路,都要停下來掏出錢包繳費,造成了嚴重擁堵,運行效率可想而知。

在這一大背景下,全新的RDMA網絡協議(遠程直接內存訪問)應運而生。顧名思義,它可以繞過CPU,直接訪問另一臺服務器的內存。換句話說,新的交通規則,將高速公路上的人工收費站全撤走了,改設成ETC。

但基于RDMA網絡協議,業界卻衍生出了兩個不同的實現方向:

一是“外部革新派”。

基于RDMA全部推翻重來,重新構建一套網絡協議,以實現極致的性能。其成果,正是英偉達的InfiniBand。全新的交通規則,使得數據傳輸可以同時繞過CPU與內存,相當于把ETC也撤了,直接通過GPU進行數據交互。

InfiniBand(無限帶寬)這個名字,正是其極致理念的一種體現。

二是“內部改良派”。

一個熱知識,以太網是最普及的局域網技術,幾乎所有計算機系統都支持以太網設備。改良派的做法,正是利用RDMA網絡協議,去改造以太網。

由此可見,InfiniBand以太網的競爭,本質是同一技術路線的派別之爭。

在算力供應嚴重不足的當下,大刀闊斧革新的InfiniBand,本應更加受到市場青睞。然而,各大硅谷巨頭卻“十動然拒”。不光是微軟,Meta也選擇全面擁抱以太網。

InfiniBand之所以如此不受待見,問題恰恰出在革新過于激進了。

激進的代價

2019年,圍繞以色列公司Mellanox,微軟、英特爾、英偉達三家巨頭展開了激烈的競購。

Mellanox是InfiniBand方案的唯一提供商,市值為22億美金。為此,英特爾專門預留了60億美金的現金流,本以為勝券在握;沒想到英偉達更狠,以69億美金的高價將Mellanox收入囊中[7]。

這是英偉達有史以來最貴的一筆收購。然而,老黃的梭哈,給英偉達帶來了不菲的經濟回報。

前文曾提到,InfiniBand只是一種“交通規則”;想要使用這項技術,還得搭配硬件。

然而,由于InfiniBand的革新過于激進,重新設計了物理鏈路層、網絡層、傳輸層,并不適配傳統的硬件,需要更換整套基礎設施,包括專門的交換機、網卡、電纜。

這些配套網絡設備,全部由英偉達獨家提供。

相當于InfiniBand重新定義了一套更高效的交通規則,但并不適用于小鎮原本的燃油卡車;為了提升送貨效率,小鎮還得向英偉達采購一批新能源卡車。

由此可見,InfiniBand其實是一套“專用”方案。通過推廣這一方案,英偉達可以大搞捆綁銷售,向客戶兜售專用的配套網絡設施。

因此,InfiniBand的使用成本一直很高??萍脊驹诮ㄔO數據中心時,需要掏出20%的開支用于InfiniBand;如果改成通用的以太網方案,只需要一半甚至更少的費用[8]。

為了讓科技公司用InfiniBand,老黃可謂用盡套路:

例如英偉達同時售賣InfiniBand與以太網的網卡,兩者的電路板設計完全相同,但以太網的交貨時間明顯更長[9]。

用于InfiniBand的ConnectX-8 超級網卡

英偉達的小算盤在于,雖然咱貴,但性能強啊。InfiniBand方案可以大大改善AI訓練,早點把模型做出來投入市場,這錢不就賺回來了嗎?

然而,令英偉達尷尬的是,隨著“內部改良派”陣營不斷壯大,InfiniBand與以太網的性能差距被縮小了。

2014年時,改良派的最新成果RoCE v2網絡協議問世,改變了InfiniBand一枝獨秀的局面。去年,英偉達面向InfiniBand與以太網,分別推出了一款交換機。盡管兩者定位有所不同,但均能實現800Gb/s的端到端吞吐量。

當通用方案也能做到85分時,專用方案便開始失去魅力。5-10分的領先,很難讓科技公司多付一倍的價錢。

而去年7月成立的超以太網聯盟,則打算在RoCE v2網絡協議的基礎上,面向大模型這一場景,開發一套新的以太網協議,全面超越InfiniBand。

新的“反英偉達聯盟”一呼百應。截至今年3月,包括字節跳動、阿里云、百度等國內科技公司,也加入了其中。

圖:部分UEC技術指導委員會成員

面對超以太網聯盟的“正義群毆”,英偉達沒有再負隅頑抗。

過去一年,黃仁勛越來越少在公開場合提及InfiniBand。將來,InfiniBand與以太網之爭或將漸漸劃上句號。然而,英偉達并沒有放棄互聯這塊蛋糕,轉而將籌碼押注到自家的Spectrum X以太網平臺上。

因為,互聯正日漸成為大模型時代的兵家必爭之地。

下一個戰場

今年1月,美國咨詢公司Dell'Oro Group發布了一份報告,當中提到:隨著人工智能爆發,科技公司對通信互聯的需求激增,從而帶動交換機市場擴大50%[10]。

科技公司之所以對互聯這么熱情,是因為在過去一年的野蠻擴張中,漸漸觸碰到了天花板。而以InfiniBand和以太網為代表的互聯技術,正是打破瓶頸的關鍵。

科技公司遇到的第一個問題,是算力開支過于昂貴。

英偉達的AI芯片,一向以昂貴著稱:最新的B200芯片,單塊起售價達到了3-4萬美金。眾所周知,大模型是一只喂不飽的“算力吞金獸”。為了滿足日常使用,科技公司通常需要采購至少上千塊AI芯片,這錢燒得比直接碎鈔都快。

如果自研芯片,同樣也會遇到類似的問題。由于芯片制程迭代放緩,提升芯片算力上限,需要付出更多的成本。

然而,由于傳輸速度的限制,數據中心并沒有發揮出芯片全部的算力。相比于硬著頭皮堆芯片,提升數據傳輸速度,提高算力利用率,相對更具性價比一些。

第二個問題是功耗。

隨著數據中心越做越大,功耗也在直線上升。扎克伯格曾在采訪中提到,近幾年新建的數據中心,功耗已經達到了50-100兆瓦,稍大一點的已經達到了150兆瓦。按照這個趨勢下去,300、500乃至1000兆瓦,都只是時間問題[11]。

然而,根據美國能源信息署的數據,在2022年夏天,硅谷所在的加州,總發電量為85981兆瓦[12]。面對越來越多的“電力怪獸”,電網實在有些滿頭大汗。

為了訓練GPT-6,微軟與OpenAI曾搭建了一個由10萬張H100組成的服務器集群,測試了一下發現當地電網直接罷工。

目前,微軟與OpenAI的解決方案,是“跨地區的分布式超大規模集群訓練”。

翻譯成人話就是,將幾十甚至上百萬塊AI芯片,分散在多個城市或者地區,再借助InfiniBand或者以太網,連成一個整體——互聯又一次發揮了至關重要的作用[13]。

如果說,大模型世界的準則,是大力出奇跡;那么互聯的價值,就在于拔高大力出奇跡的物理上限,讓scaling law的飛輪再轉得久一些。

在人工智能時代,互聯注定將會是最重要的議題之一;而對英偉達,以及其他科技公司而言,這都是一場輸不起的比賽。

尾聲

在硅谷,英偉達越來越像只“惡龍”。在互聯的領域,大半科技公司都站在了英偉達的對立面。至于GPU就更不必說,大廠自研芯片擺脫英偉達,早已是個公開的秘密。

老黃這么不受待見,很大一個原因,是因為錢基本都被他賺去了。

不論是InfiniBand,還是AI芯片,英偉達都幾乎做到了壟斷,擁有很強的議價權。相比之下,科技公司們扎堆大煉AI,卻苦于沒有成熟的商業模式。大家回頭一看,發現只有一個皮衣男子賺得盆滿缽滿,難免心有不快。

所以,也不怪硅谷大廠們都開始“自力更生”了。畢竟,“窮”才是推動進步的原動力。



參考資料

[1] OpenAI Moves to Lessen Reliance on Some Nvidia Hardware,the information

[2] 以太網崛起,英偉達Infiniband正在遭受蠶食,半導體行業觀察

[3] 黃仁勛最新2萬字演講實錄:將打破摩爾定律發布新產品,機器人時代已經到來,騰訊科技

[4] IB or RoCE?AI數據中心網絡互聯,Haipi智途

[5] Is InfiniBand finally ready for prime time,computerworld

[6] InfiniBand見解:在數字時代推動高性能計算,飛速社區

[7] CONNECTING THE DOTS ON WHY NVIDIA IS BUYING MELLANOX,The Next Platform

[8] GREASING THE SKIDS TO MOVE AI FROM INFINIBAND TO ETHERNET,The Next Platform

[9] Nvidia’s Plans To Crush Competition – B100, “X100”, H200, 224G SerDes, OCS, CPO, PCIe 7.0, HBM3E,SemiAnalysis

[10] AI Workloads Require New Network Buildouts Expanding Data Center Switch Market by 50 Percent, According to Dell’Oro Group

[11] AI GPU bottleneck has eased, but now power will constrain AI growth warns Zuckerberg,tomshardware

[12] Energy Information Administration

[13] 為什么說“互聯”會是未來科技投資重要命題,信息平權

[14] AI以太網價值幾何,國盛證券

編輯:陳彬

視覺設計:疏睿

責任編輯:陳彬

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
遼寧門將撿到寶了,成都有費利佩 徐正源只能用姆本扎 元敏誠性情

遼寧門將撿到寶了,成都有費利佩 徐正源只能用姆本扎 元敏誠性情

替補席看球
2026-05-06 12:37:17
越南一把手很焦慮:和中國一對比,才知道原來我們落后了這么多

越南一把手很焦慮:和中國一對比,才知道原來我們落后了這么多

芳芳歷史燴
2026-04-21 00:55:07
尬吹抓飯習俗是文化認知跑偏?

尬吹抓飯習俗是文化認知跑偏?

風鈴草語
2026-05-06 06:30:28
1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

1987年法國影星阿蘭德龍訪華時,與中國演員們的珍貴合影。

草莓解說體育
2026-05-06 08:37:32
提前退休才是普通人最清醒的選擇

提前退休才是普通人最清醒的選擇

細說職場
2026-05-02 16:10:20
三奪世界冠軍總獎金28萬,車手到手14萬,張雪卻看到了幾個億買賣

三奪世界冠軍總獎金28萬,車手到手14萬,張雪卻看到了幾個億買賣

小娛樂悠悠
2026-05-06 00:05:46
他在招待所見到母親,身旁坐滿將軍,才知自己是50軍代軍長親骨肉

他在招待所見到母親,身旁坐滿將軍,才知自己是50軍代軍長親骨肉

顧史
2026-05-04 06:10:01
歐冠:拜仁vs巴黎圣日耳曼,誰能拿到晉級資格?

歐冠:拜仁vs巴黎圣日耳曼,誰能拿到晉級資格?

天下說球A
2026-05-06 08:30:10
三星電子市值達萬億美元 成臺積電之后第二家達到該規模的亞洲公司

三星電子市值達萬億美元 成臺積電之后第二家達到該規模的亞洲公司

財聯社
2026-05-06 08:25:07
王心凌演唱會被激光灼傷腿部,強忍疼痛演出,主辦方遭聲討

王心凌演唱會被激光灼傷腿部,強忍疼痛演出,主辦方遭聲討

橙星文娛
2026-05-06 11:59:58
三件大事!美軍機抵京動向,王毅嚴正回應通話 特朗普訪華安排有變

三件大事!美軍機抵京動向,王毅嚴正回應通話 特朗普訪華安排有變

音樂時光的娛樂
2026-05-06 10:07:31
今年五一,樓市扯下了最后遮羞布

今年五一,樓市扯下了最后遮羞布

房產老司機
2026-05-05 11:35:27
拖了35年才上映,首日僅393萬,我感慨:票房之王也救不了港片

拖了35年才上映,首日僅393萬,我感慨:票房之王也救不了港片

靠譜電影君
2026-05-03 22:45:48
193股獲券商買入評級,鼎勝新材目標漲幅達125.94%

193股獲券商買入評級,鼎勝新材目標漲幅達125.94%

每日經濟新聞
2026-05-06 08:45:08
尼格買提發文,公開銳評撒貝寧為人,4個新稱呼釋放強烈信號

尼格買提發文,公開銳評撒貝寧為人,4個新稱呼釋放強烈信號

娛瓜醬
2026-05-06 14:18:26
一塊H200芯片都沒賣出去!黃仁勛不裝了:中國不應獲得最先進芯片

一塊H200芯片都沒賣出去!黃仁勛不裝了:中國不應獲得最先進芯片

墨蘭史書
2026-05-06 15:15:04
亞洲第1+00后首冠!中國斯諾克創百年歷史,卻過不了官方這道坎

亞洲第1+00后首冠!中國斯諾克創百年歷史,卻過不了官方這道坎

林子說事
2026-05-06 10:36:01
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
時態升級,無力回天!伊能靜,這次連祖國牌都救不了你!

時態升級,無力回天!伊能靜,這次連祖國牌都救不了你!

一盅情懷
2026-05-04 15:50:51
曼聯今夏首筆轉會正式敲定!霍伊倫3800萬英鎊永久轉會那不勒斯

曼聯今夏首筆轉會正式敲定!霍伊倫3800萬英鎊永久轉會那不勒斯

夜白侃球
2026-05-06 10:32:31
2026-05-06 15:52:49
遠川科技評論 incentive-icons
遠川科技評論
用投資視角,扒巨頭秘史
387文章數 2289關注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當庭戳老底

頭條要聞

世界杯FIFA給中國開出天價版權費 電視轉播談判陷僵局

頭條要聞

世界杯FIFA給中國開出天價版權費 電視轉播談判陷僵局

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續10年為張一山慶生

財經要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

領克10/領克10+ 無論能源形式 領克都要快樂

態度原創

旅游
藝術
教育
手機
公開課

旅游要聞

湖北宣恩游客五一期間訂酒店“訂到公安局”?當地回應:系對外開放經營場所

藝術要聞

震撼!康斯坦丁攝影作品里的性感曲線讓人驚艷!

教育要聞

聚焦小初高英語教學銜接,AI+教師發展公益行·昆明五華站圓滿落幕

手機要聞

華為官宣海外新品發布會:5月7日舉辦,將推出nova 15 Max

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版