網易首頁 > 網易號 > 正文 申請入駐

PrismML發布1-bit LLM模型家族,走出隱身模式

0
分享至

隨著內存限制和能源成本正考驗著AI擴展的極限,壓縮正成為業界最活躍的研究領域之一。谷歌最新發布的TurboQuant針對的是鍵值緩存——推理過程中最耗內存的組件之一(延展閱讀:)。而現在,一家新創公司正致力于壓縮模型本身。


PrismML由加州理工學院研究人員創立,已走出隱身模式,獲得1625萬美元種子輪融資,并開源發布了其所謂的"1-bit"大語言模型家族。公司稱其方法可以顯著減少模型大小和能耗,同時保持與標準16-bit模型相當的性能。

Bonsai模型家族的旗艦模型是Bonsai 8B,一個在谷歌v4 TPU上訓練的80億參數模型。據PrismML介紹,該模型在MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval和BFClv3等基準測試套件中表現不俗,但內存占用僅約1GB,而同等規模的典型16-bit模型約需16GB。PrismML還發布了1-bit Bonsai 4B和1.7B模型,內存占用分別為0.5GB和0.24GB。

PrismML表示,其模型實現了端到端的完全二值化,所有權重在嵌入層、注意力層和MLP塊中都被約束為單個比特,"沒有任何高精度逃生通道"。雖然量化技術已被廣泛使用,但將整個網絡推至1-bit歷來會降低模型質量,尤其是在推理任務上。公司將其成果歸功于在加州理工學院開發的新數學框架,但尚未詳細說明訓練方法或穩定技術。


PrismML CEO、加州理工學院計算機科學家和數學家Babak Hassabi將這種方法描述為AI的新范式,能夠適應多樣化的硬件環境。"我們花了數年時間開發壓縮神經網絡而不損失推理能力所需的數學理論,"Hassibi在一份聲明中說,"我們將1-bit視為起點,而非終點。"

公司聲稱其1-bit模型在現有硬件上可實現高達8倍的加速,能耗降低75-80%。PrismML還預測,未來針對1-bit操作優化的硬件可通過用更簡單的算術運算替代復雜的乘法,進一步提高效率。

參與種子輪的Khosla Ventures公司的Vinod Khosla將這項工作描述為"數學突破",有潛力重塑AI系統的部署方式。"AI的未來不由誰能建造最大的數據中心來定義,而將由誰能以單位能源和成本提供最多智能來定義。PrismML代表了這種突破,"他在聲明中說。

這一觀點反映了AI不會局限在數據中心,而是將部署在邊緣設備和本地環境的理念。PrismML表示其模型設計用于在消費級和邊緣設備上運行,可能在智能手機、可穿戴設備和機器人中實現更強大的AI應用,而無需依賴云端基礎設施。

PrismML關于全1-bit模型能匹敵高精度系統能力的聲明,尚需在公司自有基準結果之外得到驗證。極端量化技術歷來難以在復雜推理任務中保持準確性。獨立的第三方基準測試和實際部署將是判定PrismML方法代表真正突破還是有限優化的關鍵。

在一篇博客文章中,PrismML描述了所謂的"智能密度",這一指標試圖衡量模型在單位大小下提供多少能力。公司表示,其1-bit模型重新定義了模型大小與性能之間的權衡,以極小的占用保持了競爭力。不過,該指標取決于公司的基準選擇和定義本身,尚未得到獨立驗證。


目前,此次發布是效率驅動AI設計的又一個例子,業界正在尋找模型規模和基礎設施成本不斷攀升的替代方案。雖然谷歌TurboQuant等近期研究專注于壓縮推理的特定組件,但PrismML雄心勃勃的模型壓縮可能大大擴展AI模型可以實際運行的范圍及其部署方式。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
扎心!丈夫勸妻子停止化療,怕人財兩空,網友:這或是最好的決定

扎心!丈夫勸妻子停止化療,怕人財兩空,網友:這或是最好的決定

火山詩話
2026-05-02 17:54:15
荷蘭光刻機巨頭急了:中國人太聰明,封鎖中國先餓死的是西方企業

荷蘭光刻機巨頭急了:中國人太聰明,封鎖中國先餓死的是西方企業

同一片??绽?/span>
2026-05-03 00:57:55
5月開始將迎來4大降價潮:除房價以外,這幾類也開始降價了

5月開始將迎來4大降價潮:除房價以外,這幾類也開始降價了

梁佇愛玩車
2026-05-01 21:50:57
2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

聊聊車生活
2026-05-03 10:09:48
吃他汀不能碰牛奶?多次警告:不止牛奶,這5物再饞也要忌嘴

吃他汀不能碰牛奶?多次警告:不止牛奶,這5物再饞也要忌嘴

小胡軍事愛好
2026-05-03 10:03:21
55年,薄一波同志如果參與授銜,應該授什么軍銜?這個軍銜最合適

55年,薄一波同志如果參與授銜,應該授什么軍銜?這個軍銜最合適

薦史
2026-05-02 17:21:51
廣東3消息!杜鋒更衣室發言曝光,胡明軒做尿檢,徐昕做好準備

廣東3消息!杜鋒更衣室發言曝光,胡明軒做尿檢,徐昕做好準備

多特體育說
2026-05-03 11:41:31
“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

“窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

妍妍教育日記
2026-04-24 09:05:03
百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

寰球經緯所
2026-04-20 22:59:41
中國足球未來無望?孫繼海:試訓40人最終0人入圍 可怕!太可怕了

中國足球未來無望?孫繼海:試訓40人最終0人入圍 可怕!太可怕了

風過鄉
2026-05-02 18:34:46
一嫁日本,二嫁美國,三嫁法國,絕不嫁中國人的李勤勤,咋樣了?

一嫁日本,二嫁美國,三嫁法國,絕不嫁中國人的李勤勤,咋樣了?

傲傲講歷史
2026-03-09 10:19:52
以革命的名義殺人,對法國大革命的重新審視與批判

以革命的名義殺人,對法國大革命的重新審視與批判

壹家言
2026-04-28 20:27:12
38歲袁姍姍曬近況疑整容失敗!撞臉楊冪被指認不出,鼻子突兀變化大

38歲袁姍姍曬近況疑整容失敗!撞臉楊冪被指認不出,鼻子突兀變化大

八卦王者
2026-05-02 13:16:05
賽后謝場環節,浙江死忠球迷區打出橫幅:拒絕外行指導內行

賽后謝場環節,浙江死忠球迷區打出橫幅:拒絕外行指導內行

懂球帝
2026-05-02 22:44:16
汪小菲他爸,汪則翰,可真不是一般人

汪小菲他爸,汪則翰,可真不是一般人

小鯨叫我照顧海
2026-05-01 23:38:19
兩年8次手術!早已透支!他今年會離隊嗎?

兩年8次手術!早已透支!他今年會離隊嗎?

柚子說球
2026-05-02 12:30:03
騎士3-3猛龍!哈登談搶七把話挑明,米切爾毫無退路,2點也成關鍵

騎士3-3猛龍!哈登談搶七把話挑明,米切爾毫無退路,2點也成關鍵

魚崖大話籃球
2026-05-02 16:31:09
石油巨震!阿聯酋宣布退出歐佩克!話音剛落,中國就發現了新油田

石油巨震!阿聯酋宣布退出歐佩克!話音剛落,中國就發現了新油田

探源歷史
2026-05-03 02:07:29
足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足壇瘋狂一夜:阿森納橫掃富勒姆,大巴黎爆冷丟分,巴薩2-1險勝

足球狗說
2026-05-03 05:19:37
人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

岐黃傳人孫大夫
2026-05-01 14:35:03
2026-05-03 12:56:49
Ai時代前沿
Ai時代前沿
人工智能新聞動態及應用案例。
1726文章數 512關注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應鏈卡脖子

頭條要聞

上??萍即髮W王晨輝教授因營救至親不幸去世 年僅39歲

頭條要聞

上??萍即髮W王晨輝教授因營救至親不幸去世 年僅39歲

體育要聞

裁判準備下班,結果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現身 戴結婚戒指笑容不斷

財經要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

教育
手機
本地
旅游
軍事航空

教育要聞

能者不想干,中學行政“空心化”何時休?

手機要聞

榮耀羅巍透露同期還有一家手機廠商也在尋求與ARRI阿萊的合作

本地新聞

用青花瓷的方式,打開西溪濕地

旅游要聞

夯!上海人的朋友圈被刷屏!上萬人的震撼場面

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進入關懷版