无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek過(guò)了算力的河,美團(tuán)LongCat正在彎腰造船

0
分享至



「核心提示」
國(guó)產(chǎn)算力迎來(lái)“DeepSeek+LongCat”節(jié)點(diǎn)。

作者 | 張經(jīng)緯

編輯 | 邢昀

Token,是未來(lái)數(shù)字世界最核心、最值錢(qián)的大宗商品。

2026年GTC大會(huì)上,黃仁勛這樣定義AI時(shí)代的底層通貨,而數(shù)據(jù)中心就是生產(chǎn)智能的工廠。

過(guò)去幾年,全球絕大多數(shù)這樣的“工廠”都依賴同一套設(shè)備:英偉達(dá)的GPU與CUDA生態(tài)。當(dāng)霍爾木茲海峽的開(kāi)放與關(guān)閉,影響地緣政治與能源安全格局,全球AI市場(chǎng)的Token供給也需要回答:算力供應(yīng)鏈出現(xiàn)單點(diǎn)依賴,如何保障Token的穩(wěn)定產(chǎn)出?

4月24日上午,DeepSeek V4正式發(fā)布,其官方技術(shù)報(bào)告明確將華為昇騰950PR寫(xiě)入硬件驗(yàn)證清單,實(shí)現(xiàn)了從英偉達(dá)CUDA到國(guó)產(chǎn)算力的全棧遷移。下午,美團(tuán)LongCat-2.0-Preview開(kāi)放測(cè)試,這是目前唯一公開(kāi)確認(rèn)由國(guó)產(chǎn)算力完成萬(wàn)億參數(shù)預(yù)訓(xùn)練的大模型,訓(xùn)練全程動(dòng)用了5萬(wàn)至6萬(wàn)張國(guó)產(chǎn)算力卡,其訓(xùn)練規(guī)模是迄今為止最大的。

兩款模型在同一天跨入“萬(wàn)億參數(shù)俱樂(lè)部”,更關(guān)鍵的是,這意味著一條自主的“國(guó)產(chǎn)Token”供應(yīng)鏈,正在英偉達(dá)體系之外加速接通。

理解這一天意味著什么,需要拆開(kāi)來(lái)看。

1、萬(wàn)億參數(shù)俱樂(lè)部的新玩家

過(guò)去一段時(shí)間里,萬(wàn)億參數(shù)如同大模型的“珠峰”。玩家們想登頂,需要刷美國(guó)技術(shù)棧的“裝備”,尤其離不開(kāi)英偉達(dá)。

Open AI、Anthropic等硅谷獨(dú)角獸,無(wú)不是英偉達(dá)H100/A100集群上的“付費(fèi)玩家”。憑借軟硬一體的CUDA生態(tài)系統(tǒng),英偉達(dá)在全球AI訓(xùn)練負(fù)載市場(chǎng)中占據(jù)了90%以上的絕對(duì)壟斷地位。

對(duì)中國(guó)AI企業(yè)而言,這有諸多不確定性。近年來(lái),美國(guó)對(duì)華高端AI芯片的出口管制持續(xù)收緊,從最初的A100、H100禁售,延伸至特供版H20的許可限制,到今年4月,美國(guó)高端芯片實(shí)質(zhì)對(duì)華禁售。即便通過(guò)其他渠道拿到芯片,也隨時(shí)面臨升級(jí)路徑被切斷的風(fēng)險(xiǎn)。

至此,算力不再只是支出成本,也是生存成本。

2026年4月24日,備受關(guān)注的DeepSeek V4發(fā)布,同日美團(tuán)LongCat-2.0-Preview啟動(dòng)開(kāi)放測(cè)試,雙雙加入了“萬(wàn)億參數(shù)模型”的行列。這兩個(gè)大模型用不同方式,實(shí)現(xiàn)了國(guó)產(chǎn)算力替代的進(jìn)展。

DeepSeek V4的早期訓(xùn)練基于英偉達(dá)CUDA架構(gòu)和GPU硬件,之后全棧遷移至華為芯片。V4適配的華為昇騰950PR推理芯片,甚至在低精度推理中展現(xiàn)出超越通用GPU的效率。

同期進(jìn)行測(cè)試的LongCat-2.0-Preview選擇了另一種方式,這是目前唯一由國(guó)產(chǎn)算力訓(xùn)練的萬(wàn)億參數(shù)大模型。其訓(xùn)練與推理全程依托國(guó)產(chǎn)算力集群獨(dú)立完成,動(dòng)用的國(guó)產(chǎn)算力卡數(shù)量在5萬(wàn)至6萬(wàn)張之間,是國(guó)產(chǎn)算力上完成的規(guī)模最大的訓(xùn)練任務(wù)。

從技術(shù)層面來(lái)看,DeepSeek V4和LongCat-2.0-Preview均采用MoE架構(gòu),支持1M(100萬(wàn)token)超長(zhǎng)上下文窗口,單次推理可處理數(shù)百萬(wàn)字輸入,處理量級(jí)與GPT-5.5處于同一水平。兩款模型在知識(shí)容量、長(zhǎng)文本理解及復(fù)雜邏輯推理的上限上,已正式跨入全球第一梯隊(duì)。

沒(méi)有采取行業(yè)通行的“堆算力”路線,DeepSeek V4和LongCat-2.0-Preview都是通過(guò)架構(gòu)優(yōu)化,對(duì)每一張國(guó)產(chǎn)卡算力進(jìn)行極致榨取,同時(shí)它們也用實(shí)踐證明,極致優(yōu)化算力效率,可以抵消硬件的賬面差距。

V4通過(guò)混合注意力架構(gòu)(CSA + HCA)、Muon優(yōu)化器等底層架構(gòu)創(chuàng)新,在上下文長(zhǎng)度放大8倍的前提下,算力消耗比V3.2降低七成以上。LongCat-2.0-Preview每token激活參數(shù)約48B,從一些測(cè)試反饋來(lái)看,在保持較高性能的同時(shí),實(shí)現(xiàn)了不錯(cuò)的推理效率。

效率革命最終轉(zhuǎn)化為顛覆性的商業(yè)定價(jià)。DeepSeek V4最新的API定價(jià),V4 Flash每百萬(wàn)tokens輸入(緩存命中)價(jià)格為0.02元,V4 Pro為0.025元。海外社交媒體上,有網(wǎng)友表示,這是從Claude或者GPT遷移到DeepSeek的最佳窗口期。

兩款模型的發(fā)布,引發(fā)了國(guó)產(chǎn)算力適配的連鎖反應(yīng),國(guó)產(chǎn)算力替代逐漸成為趨勢(shì)。

從華為昇騰、百度昆侖芯、寒武紀(jì)思元、海光信息DCU到阿里平頭哥,國(guó)產(chǎn)AI芯片在性能與生態(tài)上持續(xù)迭代;摩爾線程、壁仞科技、沐曦股份等創(chuàng)業(yè)企業(yè)也在加速追趕。

TrendForce預(yù)測(cè),2026年國(guó)產(chǎn)芯片在高端市場(chǎng)的份額將增長(zhǎng)到70%,行業(yè)對(duì)國(guó)產(chǎn)算力的期待,不再停留在“可用”層面。

2、算力突圍前后

中國(guó)AI廠商們加速布局國(guó)產(chǎn)替代,除了此前說(shuō)到的美國(guó)高端芯片出口管制等政策壓力,還有一個(gè)重要的考量:算力荒傳導(dǎo)至價(jià)格端,導(dǎo)致算力變得越來(lái)越貴。

中信證券指出,Token調(diào)用量井噴帶來(lái)的是算力需求極大爆發(fā),與此同時(shí)供給側(cè)受到各類硬約束短期邊際增量有限,目前國(guó)內(nèi)外均出現(xiàn)了嚴(yán)重的算力荒。

而中國(guó)AI用戶的算力消耗極其巨大,根據(jù)OpenRouter的數(shù)據(jù), 2026年3月30日-4月5日,中國(guó)AI模型的周調(diào)用量突破12.96萬(wàn)億Token,是同期美國(guó)的4.3倍。如此龐大的需求, 如果長(zhǎng)期高度依賴單一的“英偉達(dá)+臺(tái)積電”供應(yīng)鏈,將面臨供應(yīng)受限與價(jià)格持續(xù)上漲的雙重風(fēng)險(xiǎn)。

這種結(jié)構(gòu)性矛盾,使得國(guó)產(chǎn)算力替代不再只是 “備選題”,而是 “必答題”。然而,替代之路向來(lái)艱難。

其難點(diǎn)在于拋棄現(xiàn)成的代碼庫(kù)、編譯和調(diào)試工具,從“零”開(kāi)始。英偉達(dá)CUDA經(jīng)過(guò)20年積累,擁有超400萬(wàn)開(kāi)發(fā)者和成熟的cuBLAS、cuDNN、NCCL庫(kù)。國(guó)產(chǎn)算力平臺(tái)的算子庫(kù)覆蓋度、優(yōu)化深度以及測(cè)試工具都不完整,需要工程團(tuán)隊(duì)進(jìn)行大量底層開(kāi)發(fā)與調(diào)試工作。

另一個(gè)難點(diǎn)在于硬件的并行計(jì)算。由于單卡性能存在差距,國(guó)產(chǎn)芯片想要實(shí)現(xiàn)同樣的計(jì)算性能,勢(shì)必要并行更多硬件,而算力硬件并行容易帶來(lái)故障。

在大模型訓(xùn)練中,集群規(guī)模一旦擴(kuò)大至萬(wàn)卡級(jí)別,故障概率呈指數(shù)級(jí)上升,任何微小的計(jì)算錯(cuò)誤、通信延遲或數(shù)值精度偏差,都會(huì)在并行運(yùn)算中指數(shù)級(jí)放大,導(dǎo)致整個(gè)訓(xùn)練任務(wù)中斷或模型收斂失敗。

LongCat-2.0-Preview在5、6萬(wàn)張國(guó)產(chǎn)集群上完成萬(wàn)億參數(shù)MoE模型的穩(wěn)定訓(xùn)練,意味著團(tuán)隊(duì)必須在并行策略、通信拓?fù)洹⒒旌暇扔?xùn)練及容錯(cuò)機(jī)制上進(jìn)行深度自研與調(diào)優(yōu)。這是對(duì)國(guó)產(chǎn)算力系統(tǒng)工程能力的一次高強(qiáng)度的壓力測(cè)試。

工程能力還只是冰山一角,芯片設(shè)計(jì)制造、軟件棧乃至應(yīng)用,需要更多產(chǎn)業(yè)力量的長(zhǎng)期投入。來(lái)自互聯(lián)網(wǎng)巨頭、產(chǎn)業(yè)資本與風(fēng)險(xiǎn)投資的資金,成為這些長(zhǎng)期進(jìn)化背后的重要支撐。

以美團(tuán)為例,近幾年在算力、科技硬件和大模型等領(lǐng)域進(jìn)行了廣泛的早期投資。芯片方面,美團(tuán)投資了摩爾線程、沐曦股份、紫光展銳、愛(ài)芯元智、榮芯半導(dǎo)體等眾多企業(yè),覆蓋了多家國(guó)產(chǎn)GPU頭部和“國(guó)家隊(duì)”級(jí)別的半導(dǎo)體公司。

這些企業(yè)的技術(shù)方向各有側(cè)重:摩爾線程與沐曦股份聚焦通用GPU設(shè)計(jì);紫光展銳在移動(dòng)通信與物聯(lián)網(wǎng)芯片領(lǐng)域根基深厚,為端側(cè)AI提供底層連接能力;愛(ài)芯元智專注邊緣算力、AI視覺(jué)芯片;榮芯半導(dǎo)體則涉足晶圓代工,立足于芯片的產(chǎn)能提升。

美團(tuán)還同時(shí)投資了包括宇樹(shù)科技、銀河通用、星海圖在內(nèi)的多家具身智能公司和科技硬件公司。從大模型上游的芯片設(shè)計(jì)制造、到大模型研發(fā),再到AI在各個(gè)領(lǐng)域的應(yīng)用,用王興的話來(lái)說(shuō),美團(tuán)將AI視為戰(zhàn)略機(jī)遇。

美團(tuán)的密集投資并非孤例,它所折射的,是中國(guó)科技資本對(duì)國(guó)產(chǎn)算力賽道乃至未來(lái)科技發(fā)展的系統(tǒng)性布局。

3、模型在國(guó)產(chǎn)算力上跑通了,然后呢?

當(dāng)國(guó)產(chǎn)芯片鋪開(kāi)、萬(wàn)億參數(shù)模型跑通,本土AI能否走向“更好用”階段,面臨著數(shù)據(jù)層面的挑戰(zhàn)。

一方面,是工程反饋數(shù)據(jù)。

當(dāng)超大規(guī)模AI模型在國(guó)產(chǎn)芯片集群上訓(xùn)練時(shí),會(huì)暴露出各種問(wèn)題,比如某些計(jì)算環(huán)節(jié)精度有誤差、芯片之間數(shù)據(jù)傳輸太慢、軟件編譯優(yōu)化不到位、多卡并行時(shí)通信通道擁堵、低精度計(jì)算時(shí)數(shù)值丟失等。

技術(shù)團(tuán)隊(duì)逐一攻克這些問(wèn)題的過(guò)程,本身就是一場(chǎng)對(duì)國(guó)產(chǎn)芯片軟硬件的大規(guī)模測(cè)試。每一個(gè)被修復(fù)的bug、每一段被調(diào)優(yōu)的通信協(xié)議,都會(huì)反饋給國(guó)產(chǎn)芯片廠商,推動(dòng)下一代硬件的改進(jìn)和軟件棧的成熟。

對(duì)LongCat-2.0-Preview這樣的“原生國(guó)產(chǎn)模型”來(lái)說(shuō),從訓(xùn)練階段起便全程依托國(guó)產(chǎn)算力集群完成,產(chǎn)生的工程反饋較為完整和真實(shí)。這種“模型反哺芯片”的閉環(huán),有利于國(guó)產(chǎn)算力生態(tài)向下扎根。

另一方面,大模型需要物理底座,和具體任務(wù)、真實(shí)世界產(chǎn)生高質(zhì)量的數(shù)據(jù)互動(dòng)。

特斯拉憑借全球最大的真實(shí)駕駛數(shù)據(jù)庫(kù),構(gòu)建了其自動(dòng)駕駛的核心基石,從真實(shí)世界采集、到仿真訓(xùn)練、再到算法迭代的“Real-to-Sim-to-Real”飛輪,同時(shí)驅(qū)動(dòng)了自動(dòng)駕駛汽車(chē)與人形機(jī)器人的進(jìn)化。

同樣的邏輯,正在一個(gè)更復(fù)雜高頻,貼近日常生活的場(chǎng)景展開(kāi),那不是加州的高速公路,而是中國(guó)城市的街頭巷尾。美團(tuán)擁有全國(guó)2800多個(gè)市縣的即時(shí)配送網(wǎng)絡(luò),覆蓋中國(guó)最復(fù)雜的物理環(huán)境。美團(tuán)無(wú)人機(jī)已累計(jì)完成商業(yè)訂單超78萬(wàn)筆,國(guó)內(nèi)外開(kāi)通70條航線。美團(tuán)無(wú)人車(chē)已至少已完成550萬(wàn)單配送任務(wù),自動(dòng)駕駛總里程突破1900萬(wàn)公里。

無(wú)人機(jī)在樓宇間穿行時(shí)的視覺(jué)避障數(shù)據(jù)、無(wú)人車(chē)在復(fù)雜路況下的實(shí)時(shí)決策軌跡、騎手與機(jī)器協(xié)同調(diào)度中的動(dòng)態(tài)優(yōu)化樣本,都是高價(jià)值、高密度的真實(shí)世界數(shù)據(jù)。這些是LongCat大模型持續(xù)進(jìn)化的養(yǎng)料,也是國(guó)產(chǎn)算力芯片在嚴(yán)苛環(huán)境中驗(yàn)證可靠性、能效比的真實(shí)環(huán)境。

同一天里先后發(fā)布和開(kāi)放測(cè)試的DeepSeek V4與LongCat-2.0-Preview,構(gòu)成了國(guó)產(chǎn)算力進(jìn)化的一體兩面。前者以開(kāi)源、低價(jià)與通用能力,證明了國(guó)產(chǎn)算力可支撐全球頂尖的基礎(chǔ)模型;后者以原生國(guó)產(chǎn)訓(xùn)練、萬(wàn)億參數(shù)規(guī)模與物理世界閉環(huán),證明了國(guó)產(chǎn)算力集群可獨(dú)立完成極限的工程任務(wù)。

這不僅僅是算力焦慮下的替代敘事,更是一場(chǎng) “主動(dòng)定義”的轉(zhuǎn)身,獨(dú)立生長(zhǎng)、正向循環(huán)的中國(guó)AI產(chǎn)業(yè)鏈,還需要長(zhǎng)期努力,但正在加速成型。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
菲防長(zhǎng)回應(yīng)被華制裁,外交部:特奧多羅仍在顛倒黑白、攻擊抹黑,其言行是撈取政治私利的作秀表演

菲防長(zhǎng)回應(yīng)被華制裁,外交部:特奧多羅仍在顛倒黑白、攻擊抹黑,其言行是撈取政治私利的作秀表演

環(huán)球網(wǎng)資訊
2026-06-12 15:33:08
鵝腿阿姨真正可怕的地方

鵝腿阿姨真正可怕的地方

燕梳樓頻道
2026-06-12 14:09:06
世界杯沒(méi)開(kāi)始,法國(guó)隊(duì)先贏一局?全員拎著“一套房”出行,把機(jī)場(chǎng)走出高定T臺(tái)!

世界杯沒(méi)開(kāi)始,法國(guó)隊(duì)先贏一局?全員拎著“一套房”出行,把機(jī)場(chǎng)走出高定T臺(tái)!

新歐洲
2026-06-12 20:40:21
四川律師譚萬(wàn)瀟終于被抓了,這三年,是誰(shuí)在給他撐傘?

四川律師譚萬(wàn)瀟終于被抓了,這三年,是誰(shuí)在給他撐傘?

千千法言
2026-06-12 12:02:47
美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座,票價(jià)爭(zhēng)議浮出水面

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座,票價(jià)爭(zhēng)議浮出水面

澎湃新聞
2026-06-12 17:40:29
加拿大1比1波黑:一頓操作猛如虎,然而

加拿大1比1波黑:一頓操作猛如虎,然而

張佳瑋寫(xiě)字的地方
2026-06-13 05:30:31
惡臭!上海一別墅區(qū)傳出高頻尖叫,居民不堪其擾…

惡臭!上海一別墅區(qū)傳出高頻尖叫,居民不堪其擾…

看看新聞Knews
2026-06-12 22:37:03
巴基斯坦總統(tǒng)、總理哀悼

巴基斯坦總統(tǒng)、總理哀悼

環(huán)球時(shí)報(bào)國(guó)際
2026-06-11 14:35:12
3分鐘從第九到第二!德比斯:沒(méi)有64號(hào),我連前五都進(jìn)不了

3分鐘從第九到第二!德比斯:沒(méi)有64號(hào),我連前五都進(jìn)不了

童叔不飆車(chē)
2026-06-13 01:22:02
韓國(guó)2-1逆轉(zhuǎn)出線在望,女球迷又火了,身材顏值都在線,笑容很甜

韓國(guó)2-1逆轉(zhuǎn)出線在望,女球迷又火了,身材顏值都在線,笑容很甜

球盲百小易
2026-06-12 19:28:00
釘釘CEO無(wú)招被開(kāi)除,一切都結(jié)束了

釘釘CEO無(wú)招被開(kāi)除,一切都結(jié)束了

科技頭版Pro
2026-06-12 14:15:22
阿里高層這次真的生氣了

阿里高層這次真的生氣了

一見(jiàn)財(cái)經(jīng)
2026-06-12 11:11:21
于東來(lái)反思對(duì)員工太包容:?jiǎn)T工不值6000元工資,一旦離開(kāi)胖東來(lái)就完了

于東來(lái)反思對(duì)員工太包容:?jiǎn)T工不值6000元工資,一旦離開(kāi)胖東來(lái)就完了

頂級(jí)大佬思維
2026-06-12 12:42:48
“一天一個(gè)價(jià)”,山姆盒馬雞蛋產(chǎn)品限購(gòu)?最新回應(yīng)

“一天一個(gè)價(jià)”,山姆盒馬雞蛋產(chǎn)品限購(gòu)?最新回應(yīng)

河南交通廣播1041
2026-06-12 13:41:05
私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

素衣讀史
2026-06-11 21:56:30
劉宇寧發(fā)文回應(yīng)戀情:清醒坦蕩的態(tài)度,才是明星該有的模樣

劉宇寧發(fā)文回應(yīng)戀情:清醒坦蕩的態(tài)度,才是明星該有的模樣

陳意小可愛(ài)
2026-06-13 00:50:31
世界杯開(kāi)幕式!labubu嚇了全球一跳

世界杯開(kāi)幕式!labubu嚇了全球一跳

李東陽(yáng)朋友圈
2026-06-12 08:35:34
英媒一語(yǔ)驚人:中美貿(mào)易戰(zhàn)中,美國(guó)唯獨(dú)算錯(cuò)的是中國(guó)的底牌!

英媒一語(yǔ)驚人:中美貿(mào)易戰(zhàn)中,美國(guó)唯獨(dú)算錯(cuò)的是中國(guó)的底牌!

流史歲月
2026-06-12 18:30:08
魚(yú)餌含精神藥品“安定”!日產(chǎn)十噸銷(xiāo)往全國(guó),廠家:魚(yú)被麻痹狂咬鉤 利潤(rùn)率50%

魚(yú)餌含精神藥品“安定”!日產(chǎn)十噸銷(xiāo)往全國(guó),廠家:魚(yú)被麻痹狂咬鉤 利潤(rùn)率50%

貓頭鷹視頻
2026-06-12 19:15:43
金正恩:我們的選擇是正確的

金正恩:我們的選擇是正確的

IN朝鮮
2026-06-12 13:10:39
2026-06-13 05:59:00
豹變
豹變
最具穿透力洞察力的商業(yè)觀察
2160文章數(shù) 20988關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬(wàn)億美元富豪誕生!

頭條要聞

SpaceX上市首日收漲19% 總市值報(bào)2.1萬(wàn)億美元

頭條要聞

SpaceX上市首日收漲19% 總市值報(bào)2.1萬(wàn)億美元

體育要聞

歐洲恐韓?肉德維德?

娛樂(lè)要聞

一天4個(gè)瓜,肖戰(zhàn)熱巴最意外

財(cái)經(jīng)要聞

萬(wàn)億美元順差背后,透露這些信號(hào)

汽車(chē)要聞

標(biāo)配激光雷達(dá)/雙動(dòng)力可選 昊鉑S600限時(shí)售17.99萬(wàn)起

態(tài)度原創(chuàng)

健康
游戲
旅游
教育
軍事航空

老人、小孩、孕婦,吃粽子有啥風(fēng)險(xiǎn)

索尼PS國(guó)區(qū)運(yùn)營(yíng)神了!玩梗《黑袍》:我會(huì)玩你的游戲

旅游要聞

印度有錢(qián)人真多酷暑辦理旅游簽證!不是有錢(qián)任性,是熱到活不下去

教育要聞

唐尚珺第17次寫(xiě)高考作文:不后悔放棄中國(guó)政法大學(xué),為救治父親

軍事要聞

伊朗媒體:已故最高領(lǐng)袖葬禮推遲舉行

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版