无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<small id="rnm6j"></small>

<td id="rnm6j"></td>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Google 突然對AI“內存稅”下手了：這篇論文，可能讓內存大廠徹夜難眠

2026-03-26 11:48:34　來源: AI范兒

上海舉報

0

分享至

★ 設為星標 | 只講人話，帶你玩轉AIGC。

這兩年看 AI，我有個越來越強烈的感覺：大家表面上都在卷模型多聰明、插件多厲害，但底下真正燒錢的死穴，往往不是“計算”，而是“存儲”。

對話一長，AI 的“對話記憶”就開始瘋狂吃顯存。資料一多，AI 的“外掛知識庫”就開始瘋狂吃內存。

很多系統最后不是不夠聰明，而是太貴、太重、太難大規模跑起來。

說白了，“貧窮”限制了 AI 的想象力。

現在的內存貴到多離譜，想必大家都知道。就連我最近想配個臺式機，一看那內存條的價格，也被直接勸退了。

這正是 Google Research 最近丟出的 TurboQuant 想要解決的死穴。

Google 把它定義為一套專門給“高維數據”脫水的壓縮方法，重點盯上的就是大模型的“對話記憶”和模型的“搜索能力”。

說白了，這篇論文不是在教模型怎么變得更聰明，而是在做一件更現實、也更值錢的事：怎么把 AI 里最占內存的那堆東西，壓得更小、更輕。

01｜TurboQuant 到底厲害在哪？

先說結論：高壓縮比、無損數據壓縮。

TurboQuant 最值得記住的，不是那個拗口的名字，而是這幾個數字：

它在論文里給出的結果是，即便把“對話記憶”壓縮到原來的 1/5（也就是每個數據點只給 3.5 位的空間），AI 的智商也基本沒降。就算壓到更極致的 2.5 位，也只是輕微有點“斷片兒”。

在幫 AI 翻找資料的“搜索任務”里，它的準確度比現有的主流壓縮方法都要好，而且整理數據的時間幾乎可以忽略不計。

Google 官方博客給了個更帶勁的版本：內存占用至少降 6 倍，AI 思考時的關鍵計算速度，最高提升了 8 倍。

這幾個數字為什么會讓科技圈一下子坐直了？

因為它打中的，剛好是今天 AI 最貴的那部分“地皮成本”。對話越長，AI 需要占用的“記憶空間”就越大。

你模型再強，最后都得面對一個現實：這些記憶放哪兒、讀取快不快、要花多少錢。

02｜它不是簡單壓扁，關鍵在“別讓壓縮自己也變貴”

很多人看到這兒會想：這不就是把數據“脫水”（量化）嗎？以前不也有這種技術嗎？

但 TurboQuant 真正有意思的地方，不只是把數據壓得狠。

它想解決的是另一個很煩的老問題：很多壓縮方法看著省了內存空間，結果壓縮和解壓的過程又太費勁，最后算下來并沒省多少。

這就是所謂的“公攤面積”太大。論文里的做法很有靈氣。

它像是一個頂級的裝修師，先給雜亂的數據“轉個身”，讓它們的排列分布更規整。

然后分兩步走：

大刀闊斧：先把大頭的數據壓下來；
精修補丁：再針對剩下的細微誤差補一個“極小位寬”的修正貼。

你可以把它理解成一句人話：先把大件家具塞進紙箱，再用一點點膠帶把裂縫封死。

這就不是“簡單壓扁”了，而是在認真做一件事：盡量把壓縮做得又狠、又穩、還不拖累電腦的干活速度。

03｜為什么市場會被它嚇一下？

因為這類技術一出來，資本市場立刻就開始算賬了：

如果以后 AI 系統能用更少的內存干同樣的事，那我們對那些昂貴的高端內存、存儲芯片的需求，會不會沒之前想得那么夸張了？

這兩天的媒體報道里，確實已經有人把這件事和內存股的波動聯系起來了。

像美光、閃迪、希捷這些大廠的股價走弱時，大家都在討論：Google 這個“省內存”的大招，會不會削弱大家買買買的需求？

但這里也別一口咬死。

另一種邏輯是：成本一旦降下來，AI 的應用可能會像自來水一樣普及，最后反而把總需求拉得更高。

這就是為什么我更愿意把那波下跌理解成一種“情緒先跑”，真正的行業大戲才剛剛開場。

04｜這篇研究真正值錢的地方

我覺得，TurboQuant 最值得看的，不是 Google 又發了個新名詞，而是它提醒了所有人一件事：下一階段 AI 的競爭，不只是誰的模型更強，還會變成誰能把同樣的能力，跑得更便宜。

誰能把“對話記憶”壓小，誰能把“翻找資料”做輕，誰能把“讀取數據的瓶頸”打掉一截，誰就更有機會把那些超長對話、私人知識庫助手真正普及到每個人的手機里。

順手提一句，如果你之前關注過國產之光 DeepSeek 的相關技術（Engram），他們是在緩解顯卡的直接壓力。

而 Google 這一條線，核心是把 AI 需要記住的所有東西本身，變小、變輕。

兩者都在打“記憶成本”，只是路子不一樣。

谷歌這篇論文引起了不小的反響，比如著名公司 CloudFlare 公司的創始人就說它是谷歌的 DeepSeek 時刻。

另一位大 V Alex Finn說它是今年為止最大的新聞。

因為這意味著哪怕是 16GB 內存的 Mac Mini 也能跑足夠強大的大模型。（這用來養小龍蝦不得起飛？）

一位開發者已經將這項技術用到自己的模型當中，它用來跑wen3.5-35B-A3B，發現KV 緩存可以壓縮 3.8～4.9 倍，最重要的是精度損失為零。

很多網友盛贊谷歌不僅發明而且公開了這項技術，而不是像很多公司那樣暗搓搓的留著自己用。

最后一句

很多 AI 研究看起來花里胡哨，但未必真的能落地。

TurboQuant 這種東西正好相反。它不算最熱鬧，卻很可能最接近真實世界里的錢、算力和成本。

因為很多系統最后輸的，不是“不夠聰明”，而是“太貴了”。

我相信這樣的技術，會真正給端側大模型帶來革命性的影響。無論是手機、汽車還是其他的，也許很快都可以運行非常強悍的模型了。

你覺得 AI 下一階段更重要的，是繼續往上捅破天、搞更大的模型，還是先把這種底層的成本狠狠干下來？

如果你喜歡這種把論文翻譯成人話的內容，點個“贊”、??。后面我繼續寫這類“不一定最火，但很可能最值錢”的 AI 技術。

參考：

https://arxiv.org/pdf/2504.19874

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/?utm_source=twitter&utm_medium=social&utm_campaign=social_post&utm_content=gr-acct

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

WWDC26：庫克的離場，蘋果新AI權力重構與價值觀天平

鈦媒體APP 2026-06-25 10:26:55
0 跟貼 0
GPT-5.6緊急叫停！OpenAI最強模型被迫「一客一審」

新智元 2026-06-26 11:48:21
12 跟貼 12

100多萬人圍觀！沒頭沒腿，神似充電寶的機器人全網走紅？

機器之心Pro 2026-06-17 18:52:08
2 跟貼 2

OpenAI為何“造芯”？AI巨頭苦英偉達久矣，閃存巨頭又要贏麻了

雷科技 2026-06-26 14:54:58
0 跟貼 0
超12萬人被裁！AI“血洗”科技圈

智東西 2026-06-26 13:26:24
0 跟貼 0

prompt已經過時？

機器之心Pro 2026-06-25 17:12:59
0 跟貼 0

“AI 拉胯” 亞馬遜：會上演逆襲大戲嗎？

鈦媒體APP 2026-06-25 11:52:19
0 跟貼 0
CVPR 2026 | 20步也能穩住畫質，這個擴散加速方法不一樣

機器之心Pro 2026-04-10 18:40:17
0 跟貼 0

當一個AI編程助手在TCL深度上崗，工程師的活兒變了

36氪 2026-06-25 17:40:45
0 跟貼 0
國產AI高考708分，這款模型靠什么成為「屏蔽生」？

機器之心Pro 2026-06-26 14:56:46
0 跟貼 0
“框架”比“模型”本身對Agent成功的影響大7倍！“推理成本”和“部署效率”才是創業公司的核心競爭優勢

華爾街見聞官方 2026-06-26 15:48:01
0 跟貼 0
人眼看視頻到AI理解視頻：北大提出面向AI的實時通信框架Artic

機器之心Pro 2026-06-26 15:00:27
0 跟貼 0
2.8萬Star爆款作者竟被谷歌裁了！硅谷大佬火速搶人

新智元 2026-06-25 23:32:51
0 跟貼 0
Gemini多位核心人員叛逃

新智元 2026-06-25 15:33:16
0 跟貼 0
高級工程師供給危機不在裁員，而在入口堵塞

野生運營 2026-06-26 09:38:27
0 跟貼 0
GTA6開啟預購，Anthropic稱又遭中國模型蒸餾攻擊，張雪機車首次批量出口歐洲，谷歌前CEO批中國 AI 開源，這就是今天的其他大新聞！

差評XPIN 2026-06-26 01:57:14
1 跟貼 1
不用AI也要繳稅？蘋果Xbox漲價揭AI稅真相

野生運營 2026-06-26 15:58:02
0 跟貼 0
不上云、不租卡，如何優雅地在本地微調Qwen-VL-30B？

機器之心Pro 2026-01-13 12:57:27
0 跟貼 0
7.5級地震襲來前，谷歌安卓系統提前預警10秒，全家成功逃出

Nee看 2026-06-26 14:35:29
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
機器之心逛谷歌，分享最熱的Self-Improving

機器之心Pro 2026-06-16 12:45:36
0 跟貼 0
日本第一波反制來了？芯片制造商對華出口猛降，但中方早有準備

感謝過往 2026-06-24 08:20:15
0 跟貼 0
瘋子：我還沒聽過這么無理的要求

大嘴觀影 2026-06-22 10:25:16
1 跟貼 1
Claude design限速，谷歌開源輕松做動態網頁，實力打臉？

機器之心Pro 2026-04-29 17:20:04
0 跟貼 0
平民三巨頭平替Fable 5！性能追平，成本砍半

量子位 2026-06-21 09:58:58
0 跟貼 0
早報｜蘋果iPad、Mac正式漲價/中興高管：新一代AI手機近期上市/美光CEO：內存緊張將持續到2027年后

愛范兒 2026-06-26 08:09:12
0 跟貼 0
鐘美美被美大學錄取 4年費用300萬

新民周刊 2026-06-25 16:19:30
18369 跟貼 18369
1103 在顧二的算計下長柏發現如蘭私會外男盛家老小都要徹夜難眠

美姐電影 2026-06-23 15:58:30
1 跟貼 1
要當愛情里的瘋子

云川剪影 2026-06-25 08:33:14
1 跟貼 1
雙胞胎姐妹高考都考了692分或1分之差與清北失之交臂

極目新聞 2026-06-25 22:41:54
13809 跟貼 13809
賈淺淺被指“涉學術論文抄襲”西北大學兩月前啟動調查

江西都市現場 2026-06-24 03:05:43
11 跟貼 11
越南漁民日常打魚生活，沒有任何技術，全是釋放電流的科技！

發怒的福貓 2026-06-26 13:49:53
3 跟貼 3
“走面兒”風波愈演愈烈，選擇沉默的韓紅，不再顧及所謂的臉面

小鋭有話說 2026-06-26 14:50:05
2 跟貼 2
中國無人機技術，究竟有多離譜？

愛歌唱的叮當貓 2026-06-25 13:17:58
1 跟貼 1
極限追蹤！韓國足球評論員在墨西哥被偷包：他靠定位狂追20公里，追回筆記本電腦

紅星新聞 2026-06-25 12:03:22
22 跟貼 22
谷歌展示安卓17原生50:50分屏游戲模式

IT之家 2026-06-26 13:26:19
0 跟貼 0
女大夫徹底被瘋子整瘋了

詭秘江湖 2026-06-24 10:57:49
0 跟貼 0
V社：Steam Deck 2研發已接近尾聲，但目前市面芯片能效不達標

IT之家 2026-06-25 15:33:10
2 跟貼 2
價格大漲！有網友曬單：去年不到7000，今年12000了

南方都市報 2026-06-26 09:53:31
779 跟貼 779
就馬島主權問題，中方明確表態

上觀新聞 2026-06-26 10:09:00
816 跟貼 816

baby帶小海綿現身港迪，素顏弓著背玩手機仍好美，3部手機搶鏡

baby帶小海綿現身港迪，素顏弓著背玩手機仍好美，3部手機搶鏡

柒佰娛

2026-06-26 09:41:09

江蘇600分以上40931人，看到這個數字我沉默了

江蘇600分以上40931人，看到這個數字我沉默了

馬蹄燙嘴說美食

2026-06-26 10:06:40

火箭軍黨委發表署名文章

政知新媒體

2026-06-26 08:52:28

醫生：希望你的血脂報告里，永遠不要出現這3項異常

醫生：希望你的血脂報告里，永遠不要出現這3項異常

華庭講美食

2026-06-23 16:28:06

全球首款0.7nm芯片發布

芯智訊

2026-06-25 20:05:25

空調“鋁代銅”爭議持續發酵格力、松下、海爾三家立場清晰

空調“鋁代銅”爭議持續發酵格力、松下、海爾三家立場清晰

鰲頭財經

2026-06-23 17:41:39

大難臨頭各自飛！見福建艦現身南海：美國也不叫了，臺獨也不跳了

大難臨頭各自飛！見福建艦現身南海：美國也不叫了，臺獨也不跳了

騷年先鋒

2026-06-26 02:24:00

金價一夜大變天！6月26日，中國黃金最新價格、人民幣黃金最新價格

金價一夜大變天！6月26日，中國黃金最新價格、人民幣黃金最新價格

戶外釣魚哥阿旱

2026-06-26 13:56:15

“建議取消私生子繼承權！”專家話炸翻全網：憑什么要為背叛買單

“建議取消私生子繼承權！”專家話炸翻全網：憑什么要為背叛買單

一絲不茍的法律人

2026-06-25 11:22:53

極右翼“集大成者”，贏下哥倫比亞大選

極右翼“集大成者”，贏下哥倫比亞大選

鳳凰WEEKLY

2026-06-25 14:50:33

Here we go！羅馬諾：森林中場埃利奧特-安德森1.3億鎊加盟曼城

Here we go！羅馬諾：森林中場埃利奧特-安德森1.3億鎊加盟曼城

懂球帝

2026-06-26 05:10:11

發現一個有趣的現象：不管信不信，男人過了50，基本都有以下特征

發現一個有趣的現象：不管信不信，男人過了50，基本都有以下特征

小書蟲媽媽

2026-06-25 12:36:46

全網看哭！698分高考少年查分當場崩潰：沒人撐腰的孩子

全網看哭！698分高考少年查分當場崩潰：沒人撐腰的孩子

手工制作阿愛

2026-06-26 02:32:17

《火遮眼》超越《哪吒》，北美票房近4000萬，目前勉強回本

《火遮眼》超越《哪吒》，北美票房近4000萬，目前勉強回本

影視高原說

2026-06-25 14:59:30

委內瑞拉強震前后最新衛星圖像對比，重災區建筑損毀嚴重，委代總統視察現場，幸存者：就像恐怖片

委內瑞拉強震前后最新衛星圖像對比，重災區建筑損毀嚴重，委代總統視察現場，幸存者：就像恐怖片

揚子晚報

2026-06-26 14:41:32

央視宋世雄，晚年選擇87歲獨居北京，這一決定刺痛無數中國式家庭

央視宋世雄，晚年選擇87歲獨居北京，這一決定刺痛無數中國式家庭

人生錄

2026-06-22 16:37:13

毛主席為何頻繁更換貼身警衛員？越是忠心的人，越會被主動調離

毛主席為何頻繁更換貼身警衛員？越是忠心的人，越會被主動調離

小莜讀史

2026-06-25 15:45:24

武漢監委原委員之子在港洗錢6400萬！辯稱“賣比特幣”被當庭駁回

武漢監委原委員之子在港洗錢6400萬！辯稱“賣比特幣”被當庭駁回

聽心堂

2026-06-25 09:16:46

伊朗專家：全世界都要感謝伊朗，是伊朗治好了全世界的美軍恐懼癥

伊朗專家：全世界都要感謝伊朗，是伊朗治好了全世界的美軍恐懼癥

農夫史記

2026-06-22 20:56:04

英國插手臺島第2天，中國在聯合國發聲:中國支持阿根廷對馬島主權

英國插手臺島第2天，中國在聯合國發聲:中國支持阿根廷對馬島主權

阿龍聊軍事

2026-06-26 13:46:39

AI范兒是一個專注于人工智能領域的資訊和學習平臺，提供最新的人工智能資訊

772文章數 679關注度

往期回顧全部

科技要聞

美國政府要求OpenAI分批發布GPT-5.6

頭條要聞

男子20多年前考入大學后不滿專業輟學在山林中被發現

頭條要聞

男子20多年前考入大學后不滿專業輟學在山林中被發現

體育要聞

三球換里德：森林狼和黃蜂誰更癲？！

娛樂要聞

劉嘉玲想放棄梁朝偉，沒有自理能力

財經要聞

懸在科技頭上的達摩克利斯之劍

汽車要聞

老板們的新座駕！65萬元起，尊界V800/V680開啟預訂

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

家居

教育

健康

時尚

藝術要聞

470米！重慶“第一高樓”夢斷？上架拍賣！

家居要聞

綠意盎然自然之境

空間微調移形換境
自由流光回溯生活真意
雅奢之序五層別墅

教育要聞

天工大、暨南、西南交大等招生政策解讀，山東考生報考位次大公開

醫生如何快速診斷腦梗和腦出血？

盛夏，才要穿出松弛感！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<pre id="7v28p"></pre>

<span id="7v28p"><th id="7v28p"></th></span>

<rt id="7v28p"><label id="7v28p"></label></rt>

<noscript id="7v28p"></noscript>