前陣子,在谷歌的協(xié)助下,加州大學(xué)圣地亞哥分校(UCSD)計劃用2000臺退役的Pixel手機組合起來搭建分布式計算平臺。具體來說,他們要用2000臺二手機組成一個龐大的云端服務(wù)器,把算力榨干,主打一個低碳環(huán)保。
看到這個新聞,我們的第一反應(yīng)是:芯片和算力已經(jīng)稀缺到這個程度了嗎?同時,很多人肯定也會好奇:舊手機是如何變成服務(wù)器設(shè)備的?
在二手機上挖寶藏:芯片、存儲都是寶貴資源
根據(jù)外媒The Register的報道,加州大學(xué)圣地亞哥分校前博士生Jennifer Switzer和谷歌達成了一項合作,她將谷歌提供的2000臺Pixel Fold改造成分布式服務(wù)器。據(jù)了解,研究團隊曾經(jīng)嘗試過直接把大量二手手機放在一起進行測試,但很快發(fā)現(xiàn)太多電池扎堆的話,會給數(shù)據(jù)中心帶來火災(zāi)風險。
所以,Jennifer Switzer的方案先對這些二手手機進行改造,它們的電池和外殼會被移除,相機、通信模塊等部件也被拆掉。說白了,二手手機用于搭建服務(wù)器,最核心的就是那塊主板以及主板上的處理器、存儲等核心部件。除了硬件層面的簡化,軟件層面,這些手機上的原生安卓系統(tǒng)也被卸載了,重新裝上硬件開銷更低的Linux。
接著,這些手機每25-50臺會組成一個計算集群,多個集群再組成最終的規(guī)模化的服務(wù)器。那么,這么多手機如何相互連接和通信呢?手機原生的蜂窩網(wǎng)絡(luò)和WiFi在這類場景中都沒辦法勝任,畢竟數(shù)千臺設(shè)備之間的聯(lián)網(wǎng),足以讓網(wǎng)絡(luò)信號癱瘓。研究人員最終采用了配有有線網(wǎng)口的PCB板來解決聯(lián)網(wǎng)問題,同時提供了統(tǒng)一的電源,保證多臺設(shè)備都能穩(wěn)定運行和連接。
看到這里,想必很多人都會疑惑:體積小巧、TDP有限的手機SoC,應(yīng)付得了云端服務(wù)器的任務(wù)嗎?畢竟,在大多人的想象中,服務(wù)器都是體積龐大的巨無霸,它們專門放置在超大空間的機房里。
其實,手機的算力,沒有大家想得那么弱。谷歌的Pixel Fold是2023年發(fā)布的折疊屏產(chǎn)品,市場表現(xiàn)很一般,產(chǎn)品缺點也不少:價格昂貴、邊框太寬、折痕明顯。這款手機用的芯片是谷歌自研的Tensor G?2,綜合性能大致介于驍龍888和驍龍8 Gen1之間,放在2023年來說也是比較落后的。
![]()
(圖源:Google)
不過,近年手機行業(yè)太卷,芯片進化速度太快,普通用戶看不上的「火龍」芯片,在服務(wù)器領(lǐng)域卻是香餑餑。和手機這種移動端平臺相比,服務(wù)器對芯片能耗和散熱沒有那么敏感。當Pixel Fold的主板拆掉外殼、接上電源后,等于能耗和發(fā)熱問題都解決了。
而且,Tensor ?G2芯片包含Cortex-X1超大核和多個A78核心,性能已經(jīng)超過了很多云服務(wù)商提供的入門VPS。更關(guān)鍵的是,谷歌這款芯片還集成了12GB內(nèi)存,主板上還有256GB或者512GB的閃存,直接省去了存儲方面的一大筆成本。
同時,Tensor ?G2設(shè)計之初就考慮到了AI應(yīng)用場景,還集成了用于邊緣計算的TPU,適合用來跑一些小型的本地模型。
當然,如果單獨用一臺Pixel Fold來搭服務(wù)器,還是很不現(xiàn)實,但2000臺手機放一起來,集聚起來的算力就很夸張了。按照研究者透露的信息,現(xiàn)在即便20臺手機組成的集群的算力,就能支撐75名學(xué)生線上提交作業(yè)的負荷。
AI帶來的算力焦慮,能靠二手手機來緩解嗎?
坦白說,指望用二手手機搭建的集群去跑千億參數(shù)的大模型訓(xùn)練,無異于癡人說夢。但如果我們把目光從中心化的云端超算中心,轉(zhuǎn)向去中心化的邊緣計算,這就會是另外一番廣闊天地了。
在雷科技(ID:leitech)看來,這種由退役手機組成的微型云廠,不僅不是算力降級,反而極其契合未來 AI 發(fā)展的兩大核心訴求:低功耗與分布式低延遲。
首先,它緩解了日益嚴峻的AI高能耗問題。AI大模型的爆發(fā)固然帶來了生產(chǎn)力的飛躍,但也帶來了恐怖的能耗飆升問題。傳統(tǒng)的集中式數(shù)據(jù)中心為了維持龐大算力集群的運轉(zhuǎn),需要消耗海量的電力進行冷卻和供電。
而智能手機的SoC芯片,從誕生之初就將能效作為了核心指標。像Tensor G2這種自帶TPU算力的移動端芯片,在剝離了屏幕、基帶等耗電大戶后,其純計算的功耗遠低于傳統(tǒng)的x86服務(wù)器處理器。數(shù)千臺這樣的設(shè)備組合起來,不僅碳排放極低、環(huán)保,還能將龐大的算力需求化整為零。
![]()
(圖源:Google)
其次,它很契合邊緣計算的物理分布特性。隨著各類AI Agent的演進和端側(cè)應(yīng)用場景的復(fù)雜化,未來的AI計算不再是把所有數(shù)據(jù)都一股腦打包上傳到物理距離遙遠的云端機房,而是更傾向于在靠近用戶側(cè)的邊緣進行即時處理。
退役手機集群體積小巧、部署靈活,不再需要像傳統(tǒng)機房那樣要求苛刻的物理空間,它們完全可以部署在社區(qū)、校園、企業(yè)內(nèi)部的微型節(jié)點中。這種物理距離上的拉近,極大地降低了數(shù)據(jù)傳輸?shù)木W(wǎng)絡(luò)延遲,對于需要實時響應(yīng)的AI推理、本地模型調(diào)度或是自動化工作流來說,算得上是量身定制。
最后,這也是一種破解算力成本與供應(yīng)鏈焦慮的嘗試。當下,存儲和芯片的供應(yīng)鏈價格波動頻繁,硬件成本居高不下,而全球各地堆積如山的廢舊手機不僅造成了資源浪費,還帶來了電子垃圾污染。
將退役手機拆解重組,重塑為邊緣計算的組成部分,相當于把曾經(jīng)的電子垃圾轉(zhuǎn)化為了低碳云算力節(jié)點。這無疑為緩解全球 AI 算力焦慮提供了一種成本更低、更具可持續(xù)性的破局新思路。
不過,這種微云廠模式雖然前景誘人,但其短板同樣也比較明顯。
一方面,手機SoC和存儲的可靠性、壽命不如傳統(tǒng)服務(wù)器端。手機上搭載的閃存和芯片,設(shè)計時設(shè)想的場景是普通消費者日常使用,而不會像企業(yè)級產(chǎn)品那樣應(yīng)對7×24小時不間斷的高強度運行。由于手機存儲顆粒和芯片直接封裝在主板上,一旦出現(xiàn)故障,整個節(jié)點也就基本宣告死刑。
![]()
(Pixel Fold主板,圖源:iFixit)
另一方面,舊手機組成的計算集群會面臨后期維護問題。維護幾臺標準機架式服務(wù)器和維護2000塊裸露、拼湊的手機主板,不是一個概念。龐大的微型節(jié)點基數(shù)意味著硬件故障率會被無限放大,如果頻繁出現(xiàn)宕機,運維人員光進行物理排查和更換主板工作,就會耗費大量精力。
其實用舊手機集群來搭建服務(wù)器,這種設(shè)想前AI時代就有過,但因為投入產(chǎn)出比不劃算被放棄。如今,這種方案再次被嘗試,說白了就是我們開頭說到的那個原因,存儲、芯片成本都在暴漲,算力也有了稀缺性。現(xiàn)在如果用常規(guī)方案搭建服務(wù)器,成本比過去高得多。
同時,由于過去數(shù)年的極度內(nèi)卷,手機行業(yè)淘汰下來的舊機型,數(shù)量極其龐大,客觀上提供了相對廉價的物料,廢舊機型的二次利用,無異于在電子垃圾里挖掘金礦。
寫在最后
谷歌與加州大學(xué)圣地亞哥分校的這次嘗試,與其說是一場算力革命,不如說是應(yīng)對當下算力焦慮的一次極客實驗。
身處存儲價格狂飆、AI算力供不應(yīng)求的大環(huán)境,大家習(xí)慣了將目光聚焦在動輒數(shù)萬美元的頂級GPU上,忽略了海量閑置的移動端算力。雖然受限于閃存壽命等因素,這種二手手機拼湊的微型云廠注定無法取代傳統(tǒng)數(shù)據(jù)中心的正規(guī)軍,但它也為邊緣計算提供了一個很有想象力的實操案例。
或許不遠的未來,手機之外的二手平板、PC、游戲機、NAS等所有擁有算力的設(shè)備,都可能會被二次利用,相關(guān)的二手產(chǎn)業(yè)鏈將被重構(gòu)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.