網易首頁 > 網易號 > 正文 申請入駐

Google 突然對AI“內存稅”下手了:這篇論文,可能讓內存大廠徹夜難眠

0
分享至

★ 設為星標 | 只講人話,帶你玩轉AIGC。

這兩年看 AI,我有個越來越強烈的感覺:大家表面上都在卷模型多聰明、插件多厲害,但底下真正燒錢的死穴,往往不是“計算”,而是“存儲”。

對話一長,AI 的“對話記憶”就開始瘋狂吃顯存。 資料一多,AI 的“外掛知識庫”就開始瘋狂吃內存。

很多系統最后不是不夠聰明,而是太貴、太重、太難大規模跑起來。

說白了,“貧窮”限制了 AI 的想象力。

現在的內存貴到多離譜,想必大家都知道。就連我最近想配個臺式機,一看那內存條的價格,也被直接勸退了。

這正是 Google Research 最近丟出的 TurboQuant 想要解決的死穴。


Google 把它定義為一套專門給“高維數據”脫水的壓縮方法,重點盯上的就是大模型的“對話記憶”和模型的“搜索能力”。

說白了,這篇論文不是在教模型怎么變得更聰明,而是在做一件更現實、也更值錢的事:怎么把 AI 里最占內存的那堆東西,壓得更小、更輕。

01|TurboQuant 到底厲害在哪?

先說結論:高壓縮比、無損數據壓縮。

TurboQuant 最值得記住的,不是那個拗口的名字,而是這幾個數字:

它在論文里給出的結果是,即便把“對話記憶”壓縮到原來的 1/5(也就是每個數據點只給 3.5 位的空間),AI 的智商也基本沒降。就算壓到更極致的 2.5 位,也只是輕微有點“斷片兒”。

在幫 AI 翻找資料的“搜索任務”里,它的準確度比現有的主流壓縮方法都要好,而且整理數據的時間幾乎可以忽略不計。

Google 官方博客給了個更帶勁的版本:內存占用至少降 6 倍,AI 思考時的關鍵計算速度,最高提升了 8 倍。


這幾個數字為什么會讓科技圈一下子坐直了?

因為它打中的,剛好是今天 AI 最貴的那部分“地皮成本”。對話越長,AI 需要占用的“記憶空間”就越大。

你模型再強,最后都得面對一個現實:這些記憶放哪兒、讀取快不快、要花多少錢。

02|它不是簡單壓扁,關鍵在“別讓壓縮自己也變貴”

很多人看到這兒會想:這不就是把數據“脫水”(量化)嗎?以前不也有這種技術嗎?

但 TurboQuant 真正有意思的地方,不只是把數據壓得狠。

它想解決的是另一個很煩的老問題:很多壓縮方法看著省了內存空間,結果壓縮和解壓的過程又太費勁,最后算下來并沒省多少。

這就是所謂的“公攤面積”太大。論文里的做法很有靈氣。

它像是一個頂級的裝修師,先給雜亂的數據“轉個身”,讓它們的排列分布更規整。

然后分兩步走:


  1. 大刀闊斧: 先把大頭的數據壓下來;

  2. 精修補丁: 再針對剩下的細微誤差補一個“極小位寬”的修正貼。


你可以把它理解成一句人話:先把大件家具塞進紙箱,再用一點點膠帶把裂縫封死。

這就不是“簡單壓扁”了,而是在認真做一件事:盡量把壓縮做得又狠、又穩、還不拖累電腦的干活速度。

03|為什么市場會被它嚇一下?

因為這類技術一出來,資本市場立刻就開始算賬了:

如果以后 AI 系統能用更少的內存干同樣的事,那我們對那些昂貴的高端內存、存儲芯片的需求,會不會沒之前想得那么夸張了?

這兩天的媒體報道里,確實已經有人把這件事和內存股的波動聯系起來了。

像美光、閃迪、希捷這些大廠的股價走弱時,大家都在討論:Google 這個“省內存”的大招,會不會削弱大家買買買的需求?


但這里也別一口咬死。

另一種邏輯是:成本一旦降下來,AI 的應用可能會像自來水一樣普及,最后反而把總需求拉得更高。

這就是為什么我更愿意把那波下跌理解成一種“情緒先跑”,真正的行業大戲才剛剛開場。

04|這篇研究真正值錢的地方

我覺得,TurboQuant 最值得看的,不是 Google 又發了個新名詞,而是它提醒了所有人一件事:下一階段 AI 的競爭,不只是誰的模型更強,還會變成誰能把同樣的能力,跑得更便宜。

誰能把“對話記憶”壓小,誰能把“翻找資料”做輕,誰能把“讀取數據的瓶頸”打掉一截,誰就更有機會把那些超長對話、私人知識庫助手真正普及到每個人的手機里。

順手提一句,如果你之前關注過國產之光 DeepSeek 的相關技術(Engram),他們是在緩解顯卡的直接壓力。

而 Google 這一條線,核心是把 AI 需要記住的所有東西本身,變小、變輕。

兩者都在打“記憶成本”,只是路子不一樣。

谷歌這篇論文引起了不小的反響,比如著名公司 CloudFlare 公司的創始人就說它是谷歌的 DeepSeek 時刻。


另一位大 V Alex Finn說它是今年為止最大的新聞。

因為這意味著哪怕是 16GB 內存的 Mac Mini 也能跑足夠強大的大模型。(這用來養小龍蝦不得起飛?)

一位開發者已經將這項技術用到自己的模型當中,它用來跑wen3.5-35B-A3B,發現KV 緩存可以壓縮 3.8~4.9 倍,最重要的是精度損失為 零。


很多網友盛贊谷歌不僅發明而且公開了這項技術,而不是像很多公司那樣暗搓搓的留著自己用。

最后一句

很多 AI 研究看起來花里胡哨,但未必真的能落地。

TurboQuant 這種東西正好相反。它不算最熱鬧,卻很可能最接近真實世界里的錢、算力和成本。

因為很多系統最后輸的,不是“不夠聰明”,而是“太貴了”。

我相信這樣的技術,會真正給端側大模型帶來革命性的影響。無論是手機、汽車還是其他的,也許很快都可以運行非常強悍的模型了。

你覺得 AI 下一階段更重要的,是繼續往上捅破天、搞更大的模型,還是先把這種底層的成本狠狠干下來?

如果你喜歡這種把論文翻譯成人話的內容,點個“贊”、??。后面我繼續寫這類“不一定最火,但很可能最值錢”的 AI 技術。

參考:

https://arxiv.org/pdf/2504.19874

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/?utm_source=twitter&utm_medium=social&utm_campaign=social_post&utm_content=gr-acct

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

千秋文化
2026-04-22 20:21:49
西方承認,經過中東這一仗才發現,中國手里3張王牌,別人玩不來

西方承認,經過中東這一仗才發現,中國手里3張王牌,別人玩不來

混沌錄
2026-04-22 19:19:05
美伊二次談判定了?特朗普突然下達開火指令,以軍發動大規模空襲

美伊二次談判定了?特朗普突然下達開火指令,以軍發動大規模空襲

丁丁鯉史紀
2026-04-25 16:40:57
多名院士調查發現:吃一口放久發酵的腐乳,或等于進一次毒?真假

多名院士調查發現:吃一口放久發酵的腐乳,或等于進一次毒?真假

路醫生健康科普
2026-04-25 16:05:03
河南12歲貧困女孩,被校長收留免費讀書,校長待她如親生。誰知,多年后,無意看見校長車內的一件衣服,她竟2次退學…

河南12歲貧困女孩,被校長收留免費讀書,校長待她如親生。誰知,多年后,無意看見校長車內的一件衣服,她竟2次退學…

勵職派
2026-04-24 12:48:47
1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
鄭愷苗苗合體露面被偶遇,手挽手同行超甜蜜,真夫妻就是好嗑

鄭愷苗苗合體露面被偶遇,手挽手同行超甜蜜,真夫妻就是好嗑

扒蝦侃娛
2026-04-24 16:32:53
全球最疲憊總統宣布退場

全球最疲憊總統宣布退場

劉瀾昌
2026-04-25 08:43:52
美正考慮暫停西班牙北約成員國資格

美正考慮暫停西班牙北約成員國資格

財聯社
2026-04-24 22:52:23
汽車保有量超400萬輛的城市PK,蘇州交通健康指數以67.66%位列全國第一

汽車保有量超400萬輛的城市PK,蘇州交通健康指數以67.66%位列全國第一

現代快報
2026-04-25 15:06:34
王室園丁爆料,查爾斯和卡米拉生活節奏天差地別,戴安娜輸在不愛

王室園丁爆料,查爾斯和卡米拉生活節奏天差地別,戴安娜輸在不愛

照見古今
2026-04-24 18:25:23
拒逆轉!布朗25+7,馬克西31+6,塔圖姆立大功,季后賽走勢改變

拒逆轉!布朗25+7,馬克西31+6,塔圖姆立大功,季后賽走勢改變

籃球大視野
2026-04-25 09:58:52
切爾西傳奇回歸?穆里尼奧或重返斯坦福橋,兩大熱門全部靠邊站

切爾西傳奇回歸?穆里尼奧或重返斯坦福橋,兩大熱門全部靠邊站

瀾歸序
2026-04-25 06:25:00
一季度GDP!十強城市,集體爆發了

一季度GDP!十強城市,集體爆發了

西部城市
2026-04-24 21:48:03
賴清德被困臺島后,不到24小時,29國涉臺表態,大陸一語定乾坤

賴清德被困臺島后,不到24小時,29國涉臺表態,大陸一語定乾坤

墜入二次元的海洋
2026-04-25 15:39:31
以色列,突然空襲!內塔尼亞胡最新表態!國際油價大跳水

以色列,突然空襲!內塔尼亞胡最新表態!國際油價大跳水

數據寶
2026-04-25 13:17:19
央視首次曝光:全球最強光刻機亮相,中國再次打破西方技術封鎖

央視首次曝光:全球最強光刻機亮相,中國再次打破西方技術封鎖

曉徙娛樂
2026-04-25 02:02:55
被賣緬甸女學生后續:對方同意放人后又提無理要求,家屬陷入兩難

被賣緬甸女學生后續:對方同意放人后又提無理要求,家屬陷入兩難

苗苗情感說
2026-04-24 16:35:17
日軍最負盛名的坂垣師團,為什么最終擊敗他的卻是一支雜牌軍?

日軍最負盛名的坂垣師團,為什么最終擊敗他的卻是一支雜牌軍?

北海史記
2026-04-24 15:48:48
體壇丑聞!嗜賭只是冰山一角,婚內出軌睡有婦之夫,太毀三觀

體壇丑聞!嗜賭只是冰山一角,婚內出軌睡有婦之夫,太毀三觀

橙星文娛
2026-04-25 11:14:17
2026-04-25 17:32:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
728文章數 669關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

男子登機口被攔 對方沒稱重直接收取200元行李逾重費

頭條要聞

男子登機口被攔 對方沒稱重直接收取200元行李逾重費

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
本地
游戲
房產
公開課

藝術要聞

荒廢十多年!福建石獅“最美爛尾樓”,德國品牌接盤了

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

韓國總理罕見發文盛贊《紅色沙漠》 韓游發展里程碑

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版