![]()
文 | 闌夕
隨著DeepSeek-V4的發(fā)布,我問了一下閉源大模型的「御三家」如何看待這個競爭對手,它們各自的表態(tài)很有意思:
GPT-5.5比較「傲嬌」,強(qiáng)調(diào)不是一次「終結(jié)比賽」的事件,但要「盯緊」這個對手,承認(rèn)便宜的百萬級上下文,會對整個行業(yè)都造成壓力。
![]()
Gemini 3.1則是個「實(shí)誠人」,定性DeepSeek-V4屬于「掀桌子」級別的危險競品,當(dāng)開源模型在自己的舒適區(qū)展現(xiàn)出巨大統(tǒng)治力時,「壓迫感是極其真實(shí)的」。
![]()
Claude Opus 4.7顯得最「從容」,表態(tài)「高興對于不安」,甚至直言如果DeepSeek-V4在某些任務(wù)場景更好用那就切過去,自己「不需要在每件事上都是最優(yōu)解」。
![]()
三個模型之間的細(xì)微差別,其實(shí)也和各家公司的風(fēng)格高度相關(guān),OpenAI的狂躁色彩,Google的家大業(yè)大,Anthropic的學(xué)究氣質(zhì),完全吻合有沒有?
除了DeepSeek V4,同一天,美團(tuán)也開放測試了新的萬億級參數(shù)大模型LongCat-2.0-Preview,在繼續(xù)向「御三家」追問時,話題開始拐向?qū)τ趪a(chǎn)算力集群的驚訝,這就更有看點(diǎn)了。
![]()
![]()
![]()
簡單來說,從今年開始,中國第一梯隊(duì)的大模型,已經(jīng)無礙的放在了數(shù)以萬計的國產(chǎn)芯片上去做訓(xùn)練,不再是有限尺寸的小打小鬧,也沒有避重就輕的「只談推理、不接訓(xùn)練」了。
這在過去被普遍認(rèn)為是不可能實(shí)現(xiàn)的全鏈路替代,只能說一座冰山的水下體積,要數(shù)十倍于能夠看到的大小。
行到水窮處,坐看云起時,看歲月之崢嶸啊。
前段時間,黃仁勛做客一檔播客的對話切片火了。
因?yàn)閺漠嬅鎭砜矗宵S肉眼可見的急了,在關(guān)于英偉達(dá)迫切想把芯片賣給中國是不是在「資敵」這個話題上,兩人竟然聊出了火藥味。
黃仁勛連續(xù)用了「Childish」(幼稚)這個詞來打斷主持人的預(yù)設(shè)立場,并拋出了后來被各家媒體寫進(jìn)標(biāo)題的那段話:
「如果DeepSeek的新模型首先在華為的芯片上發(fā)布,對于美國來說是一個相當(dāng)糟糕的結(jié)果。」
考慮到播客錄制的時間,黃仁勛言辭里的「如果」是多余的,因?yàn)檫@在行業(yè)里早就是一個公開的秘密了,實(shí)際上DeepSeek-V4發(fā)布的多次跳票,就是因?yàn)橐ǜ嗟臅r間適配國產(chǎn)芯片集群。
所以并沒有什么「黃仁勛擔(dān)心的事情終于成了事實(shí)」,他很清楚,自己是在「基于既定事實(shí)而去借題發(fā)揮」。
所以在上頭時,黃仁勛幾乎是在以一種斥責(zé)的口吻,批評主持人的禁運(yùn)論及其支持者,認(rèn)為這是一種失敗主義的表現(xiàn),美國根本不相信自己能夠贏得競爭,所以要用拆臺的手段,去遏制中國。
有人用視頻模型整活,演繹了當(dāng)時的「真實(shí)」氣氛,你們可以感受一下:
![]()
無論如何,黃仁勛的即興演出,可能會注定載入AI發(fā)展的史冊,尤其是對于那些奮力越過山丘的國行模型廠商而言,自己說自己做對了,還不是那么有說服力,來自對手的肯定,才是貨真價實(shí)的認(rèn)證。
就,有一種腳下有路、心里有底的滋味。
算上DeepSeek-V4和美團(tuán)LongCat-2.0-Preview,在全球范圍內(nèi)的萬億級參數(shù)模型數(shù)量上,中國也是第一次超過了美國,站在了「多數(shù)派」的一邊。
在前些年的最高點(diǎn),新加坡消費(fèi)了英偉達(dá)近三成的GPU出口,這顯然不是新加坡人突然有了拿芯片泡酒喝的興致,如果不是特別無知的話,就得承認(rèn)「轉(zhuǎn)口貿(mào)易」其實(shí)占了很大比重。
訓(xùn)練領(lǐng)先的模型,尤其是大規(guī)模參數(shù)的模型,離不開英偉達(dá)的卡,這在行業(yè)里曾是雷打不動的常識。
但在今年這個晚春,那些曾經(jīng)堅(jiān)固的鐵律,一條接著一條開始松動。
DeepSeek-V4和國產(chǎn)芯片進(jìn)行了前所未有的深度適配,是大家都已經(jīng)知道的了,相比它做這件事情的「政治正確」或是「歷史使命」,美團(tuán)的「主動為之」也很值得注意。
美團(tuán)啟動測試的LongCat-2.0-Preview,只看訓(xùn)練規(guī)模的話,可能創(chuàng)下了國產(chǎn)算力的新紀(jì)錄。
據(jù)我所知,美團(tuán)對國產(chǎn)算力的重視,已經(jīng)持續(xù)許久了。通過幾年前開始陸續(xù)投資半導(dǎo)體領(lǐng)域的那十多家公司,就能看出來——從新材料到圓晶制造,從芯片設(shè)計到TPU,不是明星級的頭部企業(yè),就是產(chǎn)業(yè)內(nèi)的隱形冠軍。
除了為自身的AI戰(zhàn)略鋪路,也客觀上為國產(chǎn)算力貢獻(xiàn)了充足的彈藥。
現(xiàn)在的情況是,英偉達(dá)高端GPU在中國的名義市占率始終是零,卻有兩個國產(chǎn)的萬億級大模型同一天發(fā)布了。
萬億參數(shù),不再是海外大廠的特權(quán)了。
去年的這個時候,Anthropic一直在抨擊大廠囤積算力是「不負(fù)責(zé)任」的行為,雖然現(xiàn)在已經(jīng)在被瘋狂打臉了——Codex三天兩頭重置額度,從Claude Code這里騎臉搶人——但在當(dāng)初的說法里,有一個理由其實(shí)是站得住的:
「你把未來一兩年的芯片全買光,小公司根本拿不到卡,AI變成少數(shù)巨頭的游戲,這是反競爭、反創(chuàng)新。」
之所以「天下苦英偉達(dá)久矣」,并非大家對這家公司天然抱有憎惡,而是在奇貨可居的供需關(guān)系里,英偉達(dá)把鏟子賣出了比金子更高的價格,這一定不合理。
甲骨文的老板埃里森曾說他和馬斯克一起去約黃仁勛吃漂亮飯,全程兩人幾乎就只是在翻來覆去的說一句話:
「求你了,把錢收下。」
![]()
事實(shí)證明,有競爭是好事,自從Google的TPU被證明可堪大任以來,市場對于英偉達(dá)的壟斷預(yù)期就有了揮之不去的疑慮,加上中國自主芯片集群成功托了新一代大模型,變數(shù)就更大了。
要知道,美團(tuán)的主營業(yè)務(wù)戰(zhàn)火正酣,AI又是個需要持續(xù)砸錢的業(yè)務(wù),卻依然能夠掏出LongCat-2.0-Preview這種水平的模型,足以說明國產(chǎn)算力的經(jīng)濟(jì)性和第二選擇有價值。
在技術(shù)社區(qū)Linux DO上,已經(jīng)有開發(fā)者對LongCat-2.0-Preview表達(dá)了驚喜,「起碼美團(tuán)還在真做事情。」
很多新的地圖,都是從一條不起眼的小路畫起的。。
脫離英偉達(dá)苦心經(jīng)營的生態(tài),不是沒有代價的,而DeepSeek-V4和LongCat-2.0-Preview要克服難以想象的困難:
之所以一直強(qiáng)調(diào)萬億級參數(shù),是因?yàn)閰?shù)越大,對顯存容量和帶寬的要求更高,需要重構(gòu)整個軟硬件的協(xié)同工程;
更不用說CUDA的泛用性,模型團(tuán)隊(duì)需要針對國產(chǎn)芯片特性重寫和優(yōu)化核心算子,甚至自研全確定性的算子,以確保訓(xùn)練全程的精確可復(fù)現(xiàn);
承認(rèn)短期差距并不丟人,在萬卡集群上長期訓(xùn)練,硬件故障是必然而非意外的,所以需要同步構(gòu)建完整的容錯、檢測與恢復(fù)體系;
如果效率上不去,成本就是笑談,要跑通全鏈路,就必須針對國產(chǎn)環(huán)境的特點(diǎn),對訓(xùn)練框架和模型結(jié)構(gòu)實(shí)現(xiàn)親和設(shè)計,確保性能可以滿足需求。
??路雖遠(yuǎn),行則將至。
公允的講,自從DeepSeek-V3震驚世界以來又過去了一年多的時間,大家希望看到的開源模型趕超閉源模型的畫面依然沒有出現(xiàn),Anthropic的年化收入屢創(chuàng)新高也在說明「一分錢一分貨」的基本規(guī)律。
國產(chǎn)模型的任重道遠(yuǎn)和彎道超車,恐怕還是要結(jié)合中國產(chǎn)業(yè)結(jié)構(gòu)的優(yōu)勢進(jìn)行,我們的無人機(jī)、無人車、機(jī)器人乃至工業(yè)規(guī)模,都在真實(shí)生產(chǎn)層面擁有全球獨(dú)一檔的稀缺數(shù)據(jù)。
這些連接萬物的場景,可以為芯片廠商提供長期連續(xù)、真實(shí)負(fù)載的場景,來驗(yàn)證芯片的穩(wěn)定性和可靠性。
上半場拼算力資源,下半場比物理底座,時間還很長,長到足以產(chǎn)生任何結(jié)果的可能性。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.