網易首頁 > 網易號 > 正文 申請入駐

Claude 這個更新,讓模型能力提升10%+!

0
分享至

大多數人低估了昨天 Claude開放 100 萬上下文長度的更新,從 200K 到 1M,上下文長度其實不是提升到原來的 5 倍,而是 7 倍、8 倍、9 倍。

因為原來 200K 的上下文里有很大一部分會被系統提示詞、記憶、skills,以及預留的 compact buffer 所占據。所以你真正可使用的項目上下文長度其實就 100K 出頭,現在在 1M 上下文里,項目可用的上下文提升到了 900K 左右。

我打開 /context 截了兩張圖:

Sonnet 4.6(200K)——打開對話就用掉了 25%


Opus 4.6(1M)——同樣的 skill 配置,用掉的比例縮到 4%


Free space 的對比:

· Sonnet 4.6(200K):free space 118k(58.8%)

· Opus 4.6(1M):free space 923k(92.3%)

923 ÷ 118 ≈ 7.8 倍。名義上 5 倍,實際可用空間接近 8 倍。對于 skill 配置越重的用戶,這個數字越夸張——這就是我說它等效于 6-10 倍的原因。

被 compact 折磨過的人都懂這是什么感覺。對話太長觸發 compact,有時候順,有時候直接失敗,對話就卡死了。重開,手動粘貼上下文,每次都有信息損耗,然后模型在同一個地方再犯一遍你以為解決了的錯。

上下文不是容量,是草稿紙

費曼不相信自己說不清楚的東西。他的標準是:把所有符號去掉還能講清楚,才算真理解。上下文限制限制的不只是能放進去多少內容。

你正在解一道復雜的數學題,做到一半,我把你的草稿紙拿走了。你變笨了嗎?沒有。但你能解出那道題嗎?也不能了。

問題出在草稿紙,不在你的大腦。模型的上下文就是它的草稿紙。

記憶不只是存儲,是推理的原材料。推導結論,前提和中間步驟得記在某個地方,才能一步步往下走。每推一步就忘一步,算力再猛也推不出來。上下文窗口就是模型的有效記憶范圍,超出去只能猜。

所以模型出錯很多時候不是不夠聰明,是看不見:

代碼開發:bug 的根源在三個文件之前引入的變量定義。那個定義超出上下文了,模型看不見,只能猜。

長文寫作:寫到后半段,前面某個論點超出窗口了。模型開始隱隱復述已經說過的東西,或者前后邏輯出現細微矛盾。你改稿時才發現,時間沒了。

多輪對話:第 3 輪定的約束到第 30 輪消失了。建議越來越奇怪,你說不出哪里不對,就是感覺「它沒在聽」。

上下文越小,這類殘缺越多,判斷越差。

數據:上下文越長,Claude 和其他模型差距越大

數據也能說明這件事。Anthropic 用 MRCR v2(8-needle)測了一組長上下文檢索,任務是在超長文本里同時找多個藏起來的關鍵信息。


模型

256K

1M

Claude Opus 4.6 91.9% 78.3% Claude Sonnet 4.6 90.6% 65.1%

GPT-5.4

79.3%?

36.6%

Gemini 3.1 Pro

59.1%

25.9%

? GPT-5.4 的 256K 數據為 128K–256K 區間均值

上下文越長,差距越大。 256K 時幾個模型還擠在一起,拉到 1M,GPT-5.4 掉到 36.6%,Gemini 3.1 Pro 掉到 25.9%,Claude Opus 4.6 還在 78.3%。不是 Claude 在短上下文里更強——是拉長之后別人扛不住,Claude 還在。

Claude Code 的 PM Boris Cherny 也在推上確認了一件事:

Opus 4.6 1M 現在是 Claude Code Max、Team、Enterprise 的默認模型,不用改任何設置。Pro 版和 Sonnet 用 /extra-usage 手動開啟。

Anthropic 還引用了個客戶案例:用上 1M 上下文之后,自動壓縮事件減少了 15%。這跟我自己的體感對得上。我自己估,對長期迭代的復雜項目,這個價值至少等于模型能力提升 10%-20%。

API也取消溢價了

900K token 的請求和 9K token,現在一個價:

服務商

長上下文怎么收費

Anthropic Claude ? 無溢價,和短上下文一個價

OpenAI GPT-5.4

超過 272K 輸入收 2× 單價,輸出 1.5×

OpenAI 收長度稅,Anthropic 現在不收了。終于,上下文成了top模型的標配。理論上長上下文也確實不該是高級功能,本身就該是個模型基礎能力。

Claude Code Max 用戶(100 刀/月那檔)更簡單,1M 上下文直接就有,不用加參數,不用多付錢。

順帶還有兩件事

更新

圖片 / PDF 上限 100 → 600

以前一堆 PDF 要手動拆批,現在一次喂進去。我每次寫文章要整理十幾張截圖和參考資料,這個直接省了好幾步。

更新

Adaptive Thinking 轉正式版

模型自己判斷什么時候慢想、什么時候直接答,不用你手動配置推理深度。少了一層不必要的決策。

Context,Not Control.

AI 工具的進步有兩種:模型變聰明,或者把已有的能力真正釋放出來。1M 上下文 GA 是后者。但對于長期項目、復雜開發、以及被 compact 搞崩過的人,實際影響不比前者小。

費曼說過,背下來一個公式,和能自己從頭推導出來,是兩回事,重量完全不同。給模型喂答案,和給它喂能推導出答案的所有信息,也是兩回事。后者更難,但結果更靠譜。

上下文窗口,決定了你能給它多少推導所需的信息。之前太小,你得做減法——剪掉那些「可能有用但放不進去」的東西。每次剪,都是在賭這段信息不重要。賭對了沒感覺,賭錯了,模型就在某個你看不見的地方犯了一個你找不出原因的錯。

現在,你完全可以肆無忌憚去給模型投喂任何你覺得它該知道的信息了。

這個管理理念不止是在Netflix和字節,在大模型的使用和管理上也越來越有效了

Context,Not Control.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
貴州女子癡呆21年,突然記起北京有套120平四合院,子女趕去后愣住

貴州女子癡呆21年,突然記起北京有套120平四合院,子女趕去后愣住

如煙若夢
2025-04-14 16:51:12
老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

譚老師地理大課堂
2026-04-24 00:05:13
芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉了

芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉了

王新喜
2026-04-23 20:37:56
姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

姆巴佩在社交媒體暗戳支持穆里尼奧回歸皇馬后,現任主帥作出回應

夜白侃球
2026-04-24 10:51:37
形勢有多嚴峻?才4月份,廣東就有公司放長假,多少人又要失業

形勢有多嚴峻?才4月份,廣東就有公司放長假,多少人又要失業

慧翔百科
2026-04-24 11:46:34
我資助的女同桌當大官,來公司視察她當眾問我:你還欠我頓飯

我資助的女同桌當大官,來公司視察她當眾問我:你還欠我頓飯

小陸搞笑日常
2026-04-23 17:30:58
吳法憲出獄后,安置在濟南,同時告訴他有四個安排

吳法憲出獄后,安置在濟南,同時告訴他有四個安排

歷史甄有趣
2026-04-24 07:25:10
皇馬看到爭冠希望!6戰全勝+征服諾坎普,巴薩兩大核心傷缺

皇馬看到爭冠希望!6戰全勝+征服諾坎普,巴薩兩大核心傷缺

奧拜爾
2026-04-24 10:16:26
《妻子的浪漫旅行》45歲金莎宣布備孕,3年前已保存凍卵,太拼了

《妻子的浪漫旅行》45歲金莎宣布備孕,3年前已保存凍卵,太拼了

娛君墜星河
2026-04-24 10:20:37
武漢大爺公交插隊被撞致死,家屬起訴乘客和公交公司,法院判了

武漢大爺公交插隊被撞致死,家屬起訴乘客和公交公司,法院判了

奇思妙想草葉君
2026-04-24 00:26:53
死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

黑翼天使
2026-04-23 19:51:23
世錦賽首場爆冷!丁俊暉收獲大利好,外媒支招,淘汰趙心童有戲!

世錦賽首場爆冷!丁俊暉收獲大利好,外媒支招,淘汰趙心童有戲!

曹說體育
2026-04-24 11:01:19
伊朗中央銀行:霍爾木茲海峽通行費已入賬

伊朗中央銀行:霍爾木茲海峽通行費已入賬

每日經濟新聞
2026-04-24 08:27:08
島內最新民調,事關兩岸統一,蔣萬安鄭麗文支持率有驚人變化?

島內最新民調,事關兩岸統一,蔣萬安鄭麗文支持率有驚人變化?

DS北風
2026-04-23 15:56:17
伊朗德黑蘭防空系統啟動

伊朗德黑蘭防空系統啟動

財聯社
2026-04-24 01:36:24
用戶都氣笑了!700元路由器保修剩15天壞了:廠商只愿退款10元了事

用戶都氣笑了!700元路由器保修剩15天壞了:廠商只愿退款10元了事

快科技
2026-04-23 19:07:05
老板娘和我說放大看有驚喜!

老板娘和我說放大看有驚喜!

太急張三瘋
2026-04-24 10:35:42
我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

千秋文化
2026-04-20 19:55:30
教育部新規落地!9月上學全變了,家長趁早看

教育部新規落地!9月上學全變了,家長趁早看

笑熬漿糊111
2026-04-23 00:05:18
5月1日執行!酒駕處罰全面升級,再敢喝酒開車,代價太大了

5月1日執行!酒駕處罰全面升級,再敢喝酒開車,代價太大了

大魚簡科
2026-04-23 14:35:54
2026-04-24 13:11:00
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發者
191文章數 112關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

教育
親子
本地
房產
藝術

教育要聞

“假聰明”的孩子,會有3種表現,長大難成大器,父母別高興太早

親子要聞

春天“長高食譜”大戰:是喂養孩子,還是喂養育兒焦慮?

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

房產要聞

三亞安居房,突然官宣!

藝術要聞

16幅 佐恩高清油畫 | 瑞典著名畫家

無障礙瀏覽 進入關懷版