无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

實測GLM-5.2百萬上下文,我讓他做了85頁的世界杯前瞻!

0
分享至

就在昨天,魔幻得有點不真實。

早上一睜眼,看到 Anthropic 收到了美國商務部的一封信。理由是國家安全,要求他們立刻停掉所有外國人對 Fable 5 和 Mythos 5 的訪問。不只是美國境外,連美國境內的外籍人士、Anthropic 自己的外籍員工,都得停(好家伙...按這邏輯,連 Andrej Karpathy 都得被請出去,人家是斯洛伐克人。前腳剛加入 Anthropic,后腳自家最強的模型就用不上了,心疼他一秒)

然后 Anthropic 做了個誰都沒料到的決定:為了合規,干脆把 Fable 5 和 Mythos 5 對所有人全部關停。好嘛,美國人自己也用不了了。

我中午看到這消息,心涼了半截。Fable 5 確實強,號稱全世界最強不算吹,結果領了幾天體驗下就算結束了。

然后,很有趣,昨天下午智譜就發了篇公告。

第一句話是這么寫的:「在一些前沿模型突然變得不可用的時刻,我們選擇相信另一條路:前沿智能不應只屬于少數人,也不應被少數規則隨時收回?!?/p>

緊接著,GLM-5.2 來了。真正可用的 1M 上下文,下周開源,走 MIT 協議。


時間點也很好玩,Anthropic 是 5 點 21 收到的那封信,智譜就把開放時間也定在了 5 點 21。一邊在關門,一邊在開門,還真挺有情懷的。

GLM-5.2 我當天晚上就上手了。說起來,之前 GLM-5、GLM-5.1 出來的時候我也沒少用,對智譜這條線一直挺熟。這次 5.2 最讓我驚喜的,是直接上了 1M 的長上下文。

有了這個,我想整波大活。

別人讓模型猜比分,我想玩點不一樣的

最近世界杯正打著,我刷到一堆博主在用大模型預測比賽輸贏。

但說實話,讓大模型吐個預測比分這事,挺簡單的。反正怎么編都能給你憋出個數來,以及因為有足夠多的人預測,總會有算得對一點的幸存者,我覺得沒什么意思。

我想玩點不一樣的,尤其是想確認下GLM-5.2在超長上下文里會不會迷糊、超復雜工程會不會崩。

所以我把 GLM-5.2 接進了 Claude Code。

我丟給它的任務是這個:

把 2026 這屆世界杯的小組賽,做成一整套前瞻 PPT。每一場對陣都要一頁,要有國旗、對陣時間、場地、關鍵球員、影響勝負的核心洞察,還有賽果預測。已經踢完的比賽直接用真實賽果。

而且我還順手掛了兩個我自己的 skill 上去。

一個叫 freud-skill,專門給模型做認知準備的,這個還沒正式發布,這里先賣個關子。另一個是 huashu-design,我自己那套做高保真 HTML 的設計規范。

我想看的就是:兩個 skill 同時壓上去,這個國產模型能不能接得住。


第一個坎:它差點栽在「世界杯有幾場」上

任務一丟出去,第一個驚喜就來了,而且來得特別關鍵。

這里有個特別容易中招的地方:往屆世界杯是 32 隊,小組賽恰好就是 48 場。這個數字舊得太「合理」了,模型訓練知識里多半也是這個老版本。自然而然的認為我所要求的全部小組賽是「48 場」,表面上一點毛病都沒有。換個不太較真的模型,大概率順著就往下做,最后做出一整套錯的。

GLM-5.2 沒有。

它做到一半,自己停了下來。它的原話大意是:用戶說 48 場,但 2026 世界杯已經改制成 48 隊、12 個小組,每組 4 隊踢 6 場,12 組算下來是 72 場,這個我不能憑記憶斷言,必須權威核實。

然后它真的去查了,FIFA 官網、ESPN、維基這些源交叉著核對。分組、已經踢完那幾場的真實比分,全對了一遍。


這一下,我對它的好感度直接拉滿。

我一直覺得,現在判斷一個模型智力水平的關鍵要素是,看它知不知道自己可能記錯,肯不肯在該停的地方停下來。知道多少是知識量,能靠搜索補;這份會自主糾錯的特性則往往比較少見。

這次世界杯剛好改了制,72 場不是 48 場,是個絕佳的照妖鏡。一個被遺忘的舊知識,差點把它帶溝里,但事實核查的要求讓它自己剎住了車。

它怎么搬動這個龐然大物

確認完數據和樣式,我把需求又加碼了,哈哈哈,我突然覺得自己是個任務中臨時加需求的壞老板。

除了 72 場每場一頁,我還要每個小組一頁形勢前瞻,再加一個整體封面。算下來,這是一個 85 頁 的工程。

這種體量,一頁一頁順著做必崩,要么中途斷了,要么風格做著做著就飄了。

GLM-5.2 的處理方式,還挺不一樣的。

它沒有急著寫第一頁。兩個 skill 先后起了作用:freud 那部分先給它自己做了認知準備,把身份錨定成「體育轉播視覺總監 + 戰術分析師」的合體,再由 huashu-design 把整套設計系統定下來。

然后它把整個工程拆成了五層流水線,從一個統一的數據源出發,到 12 個子 agent 并行去研究 12 個小組,再到批量渲染、聚合成一面總覽墻。逐層怎么拆,它自己列在了下面這張圖里。


這里面有個我特別認同的判斷:它沒有讓那 12 個子 agent 直接去寫 HTML,只讓它們產出結構化的內容,HTML 由統一的模板來渲染。

理由很實在:讓一堆 agent 各寫各的頁面,風格一定會飄。把內容和樣式分開,85 頁的風格才能鎖死成一套。

這套思路,跟我平時盯大工程的做法幾乎一模一樣。它不是在「完成任務」,是在「設計怎么完成任務」,這兩者差著一個段位。

而且它很克制,沒有頭鐵地一口氣沖完 85 頁,而是先做幾頁樣板讓我定方向,確認了再批量。這點正是 freud 那個 skill 想要的效果:先確認認知位置對不對,再撒開跑。在錯的方向上狂奔,是最大的浪費。

做出來的東西,到底好不好看

先看全貌。整套 85 頁跑完,鋪開是這么一面墻:1 張封面、12 個小組前瞻、72 場比賽,每一場一頁。從我下需求到全部落地,前后大概一個小時。


再往里看幾頁。


我讓它先出了兩套風格讓我選。



一套是深炭底加金色比分的轉播特刊風,一套是紙白底大襯線的雜志編輯風。


老實說,結果超出我預期。

信息層次很清楚,該有的信息層都在,沒漏;72 場體量這么大,風格還能保持統一,沒有飄。它把一個最容易做散的活,做得很穩。

更難得的是,GLM-5.2 是個純文本模型,它根本看不見自己畫出來的頁面。怎么辦?它自己截了圖,再調了個視覺模型去校驗,挨頁檢查有沒有溢出、裁切、字體沒加載。一個看不見的人,靠這套笨辦法把視覺問題兜住了。


而且,以最終設計效果來說,我覺得審美還挺長在我點上的,視覺上一眼就能區分核心要點,而且每一場該有的預測、數據和前瞻信息一點沒少。他在執行介紹還會多模態的能力看圖,實際校驗PPT審美和內容邊界是否有問題,我覺得是個挺成熟的設計師工作流程的。

最終效果如下(強烈建議打開視頻看看?。?/p>

我的整體判斷

把這一整套跑完,我的結論是這樣的。

1M 上下文是真香。 我那份又長又啰嗦的項目規范+兩個skill,喂到很深的位置,它還能老老實實遵循,沒有讀著讀著就忘了前面。以前用短上下文模型,干到一半得反復存檔交接,這次基本不用。而且怎么任務流程這么復雜,最后產出物更是龐然大物,能在一個對話窗口里穩定跑完還挺超出我預期的。

最直觀的一個感受是這樣的。 我現在用兩個不同的命令,分別開原生 Claude Code 和接了 GLM-5.2 的 Claude Code。干著干著,要不是偶爾翻到最上面瞄一眼模型名,我已經基本分不清手里這個到底是 GLM-5.2 還是 Opus 4.8 了。輸出看得懂、聊得明白、幻覺極低,活兒穩穩給你干完。

靠關鍵環節調用十幾個 agent 一起跑,整套 85 頁不到一個小時就全落地了,絕對效率還挺好的。如果你有比較大型的項目需要完成,GLM-5.2 + Claude Code 框架,是相當不錯的選擇。

一邊在關門,一邊在開門。

Fable 5 被下線不是它的錯,技術本身是好的。

但這件事,反倒讓我對另一條路更確定了。

其實這陣子,不止智譜一家,好幾個國產開源模型都趕在這個當口放了新版本。說是被這波斷供「逼」著吃上的紅利也好,說是憋著一口氣也好,看著它們一個接一個頂上來,我心里是真高興?,F在唯一替它們擔心的是算力,就盼著大家的卡都撐得住,別被一下子涌進來的人擠爆了。

把前沿智能鎖進少數人手里、說收回就收回的墻,看著挺高,可在洶涌向前的洪流底下,完全是螳臂當車。

智譜在公眾號的公告結尾寫了兩句話,我看了很感動:

A step closer to frontier intelligence for everyone.

The future of AI is open, and it is for the people.

向前沿智能再近一步,為每一個人。AI 的未來是開放的,它屬于所有人。

下周它就開源了。新的東西,總會來的。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《廊橋遺夢》:奉勸天下夫妻,能過則好好過,你漸漸就會發現,無論跟誰結婚,本質都是學會跟自己相處

《廊橋遺夢》:奉勸天下夫妻,能過則好好過,你漸漸就會發現,無論跟誰結婚,本質都是學會跟自己相處

心理觀察局
2026-06-14 06:46:18
吉馬良斯:巴西全隊世界杯首戰都很緊張;安胖給我們傳遞信心

吉馬良斯:巴西全隊世界杯首戰都很緊張;安胖給我們傳遞信心

懂球帝
2026-06-14 11:14:31
事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

玲兒愛唱歌
2026-06-04 07:05:24
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
從失敗到完美:日本H3火箭8飛6載荷精準入軌,一掃去年墜毀陰霾

從失敗到完美:日本H3火箭8飛6載荷精準入軌,一掃去年墜毀陰霾

冷知識挖掘機21
2026-06-13 04:13:21
梅婷的700平菜園:讓孫儷海清都沉默了,與公婆同住,被寵成公主

梅婷的700平菜園:讓孫儷海清都沉默了,與公婆同住,被寵成公主

魔都姐姐雜談
2026-06-13 15:28:27
衣服全是假貨?繼“南極人”之后,這4家品牌也靠賣吊牌賺錢了

衣服全是假貨?繼“南極人”之后,這4家品牌也靠賣吊牌賺錢了

青梅侃史啊
2026-06-12 19:17:06
美媒算出一筆明白賬:中國越早統一,全球反而越安心

美媒算出一筆明白賬:中國越早統一,全球反而越安心

空谷幽幽藍
2026-06-13 19:59:26
巴菲特點破A股:散戶仍不肯割肉,主力會用這幾種方法來對付散戶

巴菲特點破A股:散戶仍不肯割肉,主力會用這幾種方法來對付散戶

一方聊市
2026-06-08 19:35:03
調整!6月14日晚間央視直播乒乓收官日有變,4場決賽,林詩棟爭冠

調整!6月14日晚間央視直播乒乓收官日有變,4場決賽,林詩棟爭冠

煙潯渺渺
2026-06-14 14:29:13
618首周比比看,華為奪冠,蘋果第二,vivo第三

618首周比比看,華為奪冠,蘋果第二,vivo第三

科技鋒說
2026-06-14 17:23:44
突發! 澳洲移民局凌晨上門, 華人當場被捕! 遣返回國, 再也回不來

突發! 澳洲移民局凌晨上門, 華人當場被捕! 遣返回國, 再也回不來

澳微Daily
2026-06-14 16:00:18
德布勞內:現在更懂得享受世界杯,年輕時腦子里基本只有踢球

德布勞內:現在更懂得享受世界杯,年輕時腦子里基本只有踢球

懂球帝
2026-06-14 06:48:08
電車會不會替代油車還不知道,但不得不承認,油混車“快完蛋了”

電車會不會替代油車還不知道,但不得不承認,油混車“快完蛋了”

原來仙女不講理
2026-05-20 22:10:29
所有發達國家都有一個共性:人工很貴,勞動很值錢。

所有發達國家都有一個共性:人工很貴,勞動很值錢。

流蘇晚晴
2026-01-27 18:18:22
餓死人就開戰?菲律賓司令放狠話:中國若不撤出仁愛礁,必有一戰

餓死人就開戰?菲律賓司令放狠話:中國若不撤出仁愛礁,必有一戰

泛舟碧波湖水
2026-06-12 19:58:14
老了才發現,很多子女瞧不起自己的父親!原來是這3方面出了問題

老了才發現,很多子女瞧不起自己的父親!原來是這3方面出了問題

風起見你
2026-06-09 00:18:19
恥辱丟冠!馬刺16分再被逆轉,看數據:你就是頭號罪人!

恥辱丟冠!馬刺16分再被逆轉,看數據:你就是頭號罪人!

運籌帷幄的籃球
2026-06-14 09:48:59
AI臉引發全民生理性厭惡,AI美顏正在慢慢毀掉我們的審美

AI臉引發全民生理性厭惡,AI美顏正在慢慢毀掉我們的審美

西樓知趣雜談
2026-06-04 12:14:18
莫斯科限制燃油銷售!烏克蘭同時攻擊俄羅斯圖拉等三大能源目標

莫斯科限制燃油銷售!烏克蘭同時攻擊俄羅斯圖拉等三大能源目標

項鵬飛
2026-06-14 16:36:05
2026-06-14 18:56:50
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發者
233文章數 121關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

村民砍掉"孤獨樹":砍樹前一天跟紅裙女子發生沖突

頭條要聞

村民砍掉"孤獨樹":砍樹前一天跟紅裙女子發生沖突

體育要聞

8年8隊奪冠,鄧肯那句話,現在還給了馬刺

娛樂要聞

鄧超攜子觀戰NBA,等等帥氣十足

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

綜合續航超1600km/零百加速4秒級 2027款星途ES預售18.99萬起

態度原創

本地
時尚
旅游
公開課
軍事航空

本地新聞

AK劉彰邂逅河北南大港濕地

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

旅游要聞

重慶長壽洪湖鎮首屆“湖畔果香”采摘暢玩節甜蜜啟幕

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:美伊協議周日簽 還有終極手段

無障礙瀏覽 進入關懷版