新 聞1: 谷歌 TurboQuant 引爆存儲芯片崩盤:AI 內存占用銳降至 1/6、推理狂飆 8 倍
3 月 26 日消息,谷歌研究院昨日(3 月 25 日)發(fā)布博文,推出全新極端壓縮算法 TurboQuant,有望重塑 AI 運行效率并解決大模型鍵值緩存(KV Cache)的內存瓶頸。
向量是 AI 模型理解和處理信息的基礎,但高維向量會消耗海量內存,從而在鍵值緩存(KV Cache)中引發(fā)嚴重的性能瓶頸。
IT之家注:鍵值緩存是大語言模型生成文本時使用的一種高速緩存機制,通過存儲歷史計算結果來避免重復計算,但極易造成內存瓶頸。
傳統(tǒng)的高維向量量化技術雖然能壓縮數(shù)據(jù),卻常常因為需要為微小數(shù)據(jù)塊計算和存儲量化常數(shù),引入了額外的“內存開銷”。這種額外負擔部分抵消了壓縮原本帶來的優(yōu)勢,導致 AI 大模型在處理長文本或大規(guī)模搜索時依然受限。
谷歌研究院為徹底解決這一難題,推出了全新壓縮算法 TurboQuant。同時,研究團隊還公布了支撐該算法的兩項核心底層技術:量化 Johnson-Lindenstrauss(QJL)和 PolarQuant(將亮相 AISTATS 2026)。
這三項技術協(xié)同工作,為高度依賴數(shù)據(jù)壓縮的 AI 與搜索業(yè)務帶來了全新解法,能夠在完全不犧牲 AI 模型預測性能的前提下,大幅削減鍵值緩存的內存占用。
在運行機制方面,TurboQuant 分為兩個關鍵步驟。首先,它利用 PolarQuant 方法進行高質量的主體壓縮。該方法打破常規(guī),放棄了傳統(tǒng)的笛卡爾坐標系,轉而將數(shù)據(jù)向量轉換為極坐標。
這種轉換將數(shù)據(jù)映射到邊界已知的固定“圓形”網(wǎng)格上,免去了昂貴的數(shù)據(jù)歸一化步驟,徹底消除了傳統(tǒng)方法的內存開銷。
![]()
隨后,TurboQuant 利用 QJL 算法處理第一步遺留的微小誤差。QJL 僅需 1 比特的殘差壓縮算力,就能像數(shù)學糾錯機一樣消除偏差,確保模型計算出精準的注意力分數(shù)。
研究團隊在 Gemma 和 Mistral 等開源大模型上進行了嚴格的基準測試。實驗數(shù)據(jù)表明,TurboQuant 無需任何預訓練或微調,就能極其高效地將鍵值緩存壓縮至 3 比特,并在“大海撈針”等長上下文測試中實現(xiàn)零精度損失,同時將內存占用降低至 1/6。
此外,在 H100 GPU 加速器上,4 比特 TurboQuant 的運行速度比未量化的 32 比特基準提升了高達 8 倍。
![]()
![]()
谷歌 TurboQuant 壓縮算法攪動萬億市場,存儲芯片板塊遭遇「黑色時刻」,巨頭股價全線飄綠,截至收盤,美光科技下跌 4%,西部數(shù)據(jù)下跌 4.4%,希捷下跌 5.6%,閃迪更是重挫 6.5%。
![]()
![]()
原文鏈接:https://m.ithome.com/html/932786.htm
一條舊聞,但看到最近的消息我還是決定拿出來再給大家看一下。
上個月月底,谷歌TurboQuant壓縮算法橫空出世,根據(jù)谷歌介紹,能大幅壓縮AI大模型對存儲的需求,不少玩家認為這是“內存崩盤”的末日號角,一些存儲廠商的股價以及存儲產(chǎn)品的市場價格也是應聲而跌,看起來谷歌TurboQuant就是內存救世主了……嗎??
新 聞 2: 谷歌 TurboQuant 算法遭質疑,中國博士后指其論文存在嚴重問題
3 月 28 日消息,谷歌研究院 3 月 25 日推出全新極端壓縮算法 TurboQuant,有望重塑 AI 運行效率并解決大模型鍵值緩存(KV Cache)的內存瓶頸,據(jù)稱可以使 AI 內存占用銳降至 1/6、推理狂飆 8 倍。
然而,3 月 27 日晚上 10 點,蘇黎世聯(lián)邦理工學院博士后、RaBitQ 算法的第一作者高健揚公開表示:“TurboQuant 論文在描述 RaBitQ 時存在嚴重問題,包括不正確的技術聲明和誤導性的理論、實驗對比 —— 而這些問題在投稿前就已向作者指出,對方承認了,但選擇不修正。”
![]()
原文鏈接:https://m.ithome.com/html/933679.htm
從來就沒有什么救世主,很快的,就有領域大佬、蘇黎世聯(lián)邦理工學院博士后、RaBitQ 算法的第一作者高健揚公開表示質疑。事實上,質疑并不是發(fā)生在論文發(fā)布之后,而是在發(fā)表之前就已經(jīng)指出,而谷歌方面并未修正,且在發(fā)布后投入大量資源宣傳,對市場、業(yè)界以及消費者都造成了極大的誤導,不知道谷歌是否故意為之……難道谷歌是為了抄底內存?
新 聞3: TrendForce:消費型內存 (Consumer DRAM) 2026Q2 還將漲價 45~50%
4 月 7 日消息,TrendForce 集邦咨詢今日表示,在三大原廠逐步淡出的 DDR4 及更早世代 Consumer DRAM 消費型內存市場,均價將在今年一季度上漲 75~80% 后二季度還將續(xù)漲 45~50%。
![]()
▲ 圖源:TrendForce
Consumer DRAM 主要是面向消費電子產(chǎn)業(yè)領域的利基型內存。一方面,三星電子、SK 海力士、美光正逐步關停 DDR4 產(chǎn)線;另一方面,南亞、華邦等體量較小的成熟制程 DRAM 供應商擴產(chǎn)速度相對有限。這導致市場恐慌情緒未能及時化解,供小于求還有愈演愈烈的態(tài)勢。
機構認為,2026 年 3 月 Consumer DRAM 的價格漲幅主要集中在 4Gb 及以下的小容量產(chǎn)品,如 DDR4 4Gb 單季度漲價 20%;而由于產(chǎn)能再分配等因素,DDR3、DDR2 各容量產(chǎn)品的均價在 3 月出現(xiàn)了 20~40% 不等的上調。
原文鏈接:https://m.ithome.com/html/936651.htm
所以,當TurboQuant這柄懸在存儲廠商頭上的“達摩克利斯之劍”存疑甚至可能被證偽的情況下,此前一度收縮的存儲價格又進一步開始膨脹了。不光是價格,其實前文中股價受到影響的幾家存儲廠商也是很快的反彈了,谷歌這次真的是讓人哭笑不得啊……
買電腦討論群:386615430
二手硬件回收微信號:diannaobapingceshi
文章轉載自網(wǎng)絡(鏈接如上)。文章出現(xiàn)的任何圖片,標志均屬于其合法持有人;本文僅作傳遞信息之用。如有侵權可在本文內留言。
引用文章內容與觀點不代表電腦吧評測室觀點.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.