奔跑財經3月18日消息,全球最大穩定幣發行商Tether,其AI部門近日悄然發布了一項可能顛覆行業格局的“黑科技”——QVAC Fabric。
該框架能將百億參數級別的大型語言模型(如3.8B、13B)直接部署到旗艦手機和消費級顯卡上運行,讓此前只能在云端運行的“龐然大物”真正走進個人設備。
手機GPU推理快11倍,內存占用暴降90%
根據官方披露,QVAC Fabric集成了自研的BitNet LoRA微調與推理框架,可跨平臺支持AMD、Intel顯卡、蘋果Metal生態及各類移動GPU。實測數據顯示,在旗艦設備上,基于GPU的推理速度比傳統CPU方案快2到11倍,同時內存占用相比全精度模型暴降90%。
這意味著,用戶可以在不更換手機、不增加散熱負擔的前提下,在本地運行更復雜的AI模型,或同時處理更多任務,徹底突破手機等移動設備在散熱和內存上的天然瓶頸。
目前,Tether團隊已成功在iPhone 16上完成對130億參數模型的微調,并在Pixel 9、Galaxy S25等旗艦機型上實現了38億參數模型的本地運行與微調。這標志著“端側AI”正式從營銷噱頭或簡單演示,邁入了可處理復雜任務、實現真正個性化與領域適應的實用階段。
Tether轉向基建,代碼已開源
此舉是Tether從單一穩定幣發行商向更廣泛數字基礎設施運營商轉型的關鍵一步。該公司已向能源、比特幣挖礦、媒體等領域投入數十億美元,如今將“邊緣AI工具鏈”納入版圖。
值得注意的是,相關QVAC與BitNet LoRA代碼已在GitHub上開源。一旦QVAC成為開發者和中小實驗室將大模型部署到消費硬件的主流選擇,Tether將在受銀行監管影響較小的技術棧中,建立起強大的生態影響力和技術話語權。
短期內,這更多是敘事而非盈利層面的影響。但宏觀趨勢已清晰:隨著更多AI工作負載向邊緣設備遷移,基礎設施的主導權正從集中化的超大規模云廠商(如AWS、谷歌云),向控制關鍵工具鏈和硬件抽象層的玩家轉移。
Tether正發出明確信號:它希望成為這樣的關鍵玩家,并利用其雄厚資金實力,打造降低對單一云服務商或司法管轄區依賴的基礎設施。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.