![]()
隨著人工智能的迅猛崛起,全球數據中心建設正經歷前所未有的擴張。預計到本十年末,數據中心的用電量將占美國總用電量的9%至17%。而在當前數據中心的電力消耗中,約有三分之一被用于冷卻運行AI模型的芯片。
正是這一環節,成為初創公司Ferveret致力于優化的核心目標。該公司由麻省理工學院(MIT)核工程專業前博士后研究員Reza Azizian,以及MIT核科學與工程系副教授Matteo Bucci共同創立。他們將核反應堆中的冷卻技術遷移應用于芯片散熱領域,實現了零水耗、低能耗的突破性方案。
Ferveret的冷卻系統將計算機服務器浸入一種特殊液體中,該液體的導熱效率遠超傳統風扇的空氣冷卻方式。與其他液冷方案相比,Ferveret的自適應相變冷卻(APC)技術有其獨特之處:它能在服務器表面產生更細小的氣泡,這些氣泡脫離頻率更高,從而大幅加速熱量傳遞過程。
目前,Ferveret已與多家企業展開合作測試,包括數據中心開發商和運營商CleanSpark、AI加速器公司FuriosaAI,以及美國最大數據中心運營商之一Switch。
在最近一項與加州大學洛杉磯分校Samueli計算機科學系合作開展的研究中,Ferveret發現其APC解決方案與當前最先進的液冷系統相比,計算功率效率提升了15%。結合Ferveret的功耗控制系統對運行條件進行優化后,該公司表示,數據中心在相同功耗下,能夠從AI模型中多獲取35%的Token——即文本或數據的基本處理單元。
"我們的目標是讓數據中心盡可能實現可持續運營,幫助它們將每一瓦電力都用于生成Token這一最有價值的輸出,"Azizian表示,"我們的系統可以支持更高性能芯片的運行,幫助數據中心大幅減少能源浪費,而且整個過程實現了零水耗。"
從核反應堆到人工智能
2013年,還在MIT從事博士后研究的Azizian結識了當時擔任研究科學家的Bucci,兩人隨即開展了核反應堆熱傳遞領域的合作研究。此后,Azizian進入工業界,將研究方向轉向芯片冷卻技術。他先后參與了微軟HoloLens增強現實頭顯的研發工作,隨后加入英偉達——這家公司為各企業提供用于訓練和運行最新AI模型的圖形處理器。與此同時,Bucci繼續在MIT深耕學術研究,并于2016年晉升為助理教授。
2017年,Azizian第一次走進數據中心,眼前那些轟鳴運轉的巨型冷卻風扇令他深感震撼。
"我當時的第一反應是:'天哪,冷卻設施怎么能這樣搞?'"Azizian回憶道,"空氣冷卻仍會消耗數據中心40%的電力。這種方式效率低得驚人,但因為不影響性能,沒人在意這套冷卻技術已經用了50年。"
Azizian隨即與Bucci展開深入探討,雙方決定將核反應堆熱傳遞優化領域積累的知識應用于數據中心冷卻。幾十年來,科學家們一直在探索更高效的核反應堆散熱方式。
"熱傳遞直接決定了能從反應堆堆芯提取多少能量,這也直接關系到經濟收益,"Azizian解釋道。
兩位創始人于2021年正式創立Ferveret。自Azizian第一次踏入數據中心以來,行業已發生了翻天覆地的變化。隨著人工智能的爆發式增長,芯片廠商不斷提升芯片集成度,在有限的電力供應下,最大化計算性能成為行業追求的核心目標。
這一趨勢推動數據中心運營商轉向液冷技術,其中一種被稱為浸沒式冷卻的方式——即將芯片完全浸入液體中——應用尤為廣泛,而將液體煮沸的方式被認為是效果最佳的浸沒式冷卻方案。
"液體是比空氣更好的導熱介質。這就是為什么把手伸入室溫水中仍然會感到涼爽,"Bucci解釋道,"液體沸騰時,散熱效果會進一步增強,因為相變過程需要消耗大量能量,而這些能量正是從芯片中帶走的熱量。這樣一來,在芯片與液體之間溫差極小的情況下,就能實現大量熱量的高效傳遞。"
然而,沸騰液體也帶來了系統復雜性的挑戰,運營商必須在捕獲并液化氣泡的同時,對壓力、溫度和液體容量進行精確控制。
Ferveret的系統源自核反應堆中一種名為"過冷沸騰"的技術。該系統采用低沸點液體,且不含其他方案中普遍使用的、具有毒性的全氟烷基化合物(PFAS)"永久性化學物質"。在芯片表面,Ferveret的液體所產生的氣泡比其他浸沒式冷卻方案更細小,這些氣泡脫離更加頻繁,并能在周圍液體中迅速重新冷凝,從而加快芯片表面的氣泡再潤濕循環,進一步提升散熱效率。
Ferveret以小型箱體為單位交付APC系統,每個箱體容納一臺服務器。創始人表示,模塊化的設計有利于系統的靈活部署,同時大幅簡化日常維護工作。
"正是物理原理使我們得以實現過去難以想象的產品形態,"Azizian表示,"大多數浸沒式冷卻方案都采用大型儲液槽,將服務器整體浸入其中。而我們提供的是更緊湊的模塊化機架式解決方案,能夠適配現有基礎設施,讓用戶更輕松地部署我們的技術。"
此外,Ferveret還提供配套的控制軟件,可實時動態調整每臺服務器的功耗分配,進一步提升整體能效。
"我們提供的是全棧式系統,涵蓋冷卻箱體、機架、冷卻分配單元,以及用于檢測溫度和壓力的傳感器,"Bucci介紹道,"我們的軟件持續監測這些傳感器數據,并對每個箱體內部的運行條件進行優化,確保整個系統的能耗降至最低。"
以更少資源賦能AI發展
除提升數據中心運營效率外,Ferveret的技術還通過降低偏遠地區數據中心建設門檻,為可持續發展注入新動力。
"陽光充沛的地方往往水資源匱乏,而我們零水耗的優勢,讓那些擁有太陽能資源卻缺乏冷卻用水的地區也能建設數據中心,"Bucci表示,"這項技術將推動數據中心向傳統上不具備相應資源的地區延伸,包括非洲、中東,以及美國部分地區,這將是一次重大突破。"
目前,Ferveret正與各大云計算巨頭(即所謂的超大規模云服務商)積極洽談合作,并已加入英偉達面向初創企業的Inception計劃。公司計劃在今年晚些時候宣布更多合作伙伴關系。創始人表示,未來將快速擴大技術規模,助力AI產業持續增長,同時減少對地球資源的消耗。
"計算行業面臨的電力獲取瓶頸日益突出,在許多地區,水資源獲取同樣面臨嚴峻挑戰,"Azizian表示,"隨著行業規模持續擴大,這些制約因素只會愈發突出。數據中心運營商的核心訴求,就是從現有電力中獲取更多Token的輸出。而我們已經證明,這完全可以實現。"
Q&A
Q1:Ferveret的自適應相變冷卻(APC)技術與傳統液冷方案有什么區別?
A:Ferveret的APC技術源自核反應堆中的"過冷沸騰"原理,核心差異在于其液體在芯片表面產生的氣泡更細小,脫離頻率更高,能在周圍液體中迅速重新冷凝,加速芯片表面的熱量傳遞。相比之下,傳統浸沒式冷卻通常采用大型儲液槽,系統更復雜。此外,Ferveret采用模塊化機架式箱體,每個箱體容納一臺服務器,部署更靈活,維護也更簡單。
Q2:Ferveret的冷卻系統能帶來多大的性能提升?
A:根據Ferveret與加州大學洛杉磯分校合作開展的研究,APC方案與當前最先進的液冷系統相比,計算功率效率提升了15%。結合Ferveret的功耗控制軟件對運行條件進行動態優化后,數據中心在相同功耗下,能夠從AI模型中多獲取35%的Token輸出。
Q3:Ferveret的技術為什么適合在偏遠地區或水資源匱乏的地區部署數據中心?
A:Ferveret的冷卻系統實現了零水耗,不依賴水資源進行散熱,這使其天然適合在太陽能資源豐富但水資源匱乏的地區部署數據中心。Bucci指出,非洲、中東以及美國部分地區都符合這一條件。相較于傳統冷卻方案受限于水資源可用性,Ferveret的技術大幅拓寬了數據中心的可建設范圍,為這些地區接入算力基礎設施提供了可能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.