網易首頁 > 網易號 > 正文 申請入駐

DeepSeekV4 與美團 LongCat 同時「破萬億」,釋放了哪些信號?

0
分享至



國內AI 企業開始嘗試鋪設自己的軌道。

撰文|藍洞商業 于瑋琳

今年伊始,海外科技圈都在關注中國的算力問題。

1 月,馬斯克在播客中稱,中國在AI 算力上「將遠超世界其他地區」。2 月,OpenAI 首席執行官奧特曼說,中國在人工智能領域的技術進步 「快得驚人」。英偉達CEO黃仁勛也多次公開表示:「限制中國的AI技術,反而會加速其自主研發」。

2025年可以說是供給端的集結之年。摩爾線程、沐曦股份等國產GPU接連登陸資本市場,國產大模型的產業基礎進一步加深。2026年,變化向產業鏈下游傳導,4月下旬,多款國產大模型發布新版本。

4月20日,月之暗面推出擅長長程代碼編寫的Kimi K2.6模型;4月24日,DeepSeek V4發布;隨后美團LongCat-2.0-Preview開放測試,兩者總參數規模均突破萬億,且均支持1M超長上下文。

值得一提的是,DeepSeek V4完成了從英偉達體系向華為昇騰平臺的遷移與適配;而美團LongCat2.0則是訓練推理全程基于國產算力的萬億參數大模型,使用了5萬至6萬張國產算力芯片。

長久以來,中國AI從業者,普遍策略是搭上已有的成熟方案。現在,國內AI企業開始嘗試鋪設自己的軌道。

在荒野修路

你該如何完成一次艱難的任務呢?

科幻作家阿瑟·克拉克的答案是:「唯一的辦法是讓不可能本身,成為前進的起點!

DeepSeek V4從最初定檔到最終發布,時間調整了多次。外部普遍推測,原因之一,就是需要將核心代碼從英偉達的CUDA遷移出來。

CUDA生態經過十幾年的打磨,已是一個功能強大、工具完備的開發平臺。國產算力生態尚在構建初期。遷移代碼的過程,意味著開發團隊需要做大量底層框架的重構工作。

最終DeepSeek做到了,V4發布兩日后,摩根大通在報告中指出,V4成功適配華為昇騰芯片,驗證了國產算力在前沿AI推理上的可行性;且DeepSeek通過混合注意力架構等底層技術創新,顯著降低了推理成本。

DeepSeek用技術極客的方式降本增效,通過重寫半個大模型的工作量完成硬核遷移。同日開放測試的美團LongCat-2.0-Preview,則是直接跑在國產算力之上。

國產算力在工程層面,有哪些難點?不妨以LongCat-2.0-Preview為例看看。

第一個難點,是物理層面的。國產硬件底座的顯存容量和帶寬與英偉達芯片有差異,訓練部署萬億參數模型時,美團團隊在工程方面有不小的挑戰,需要用更多精力去調試并行策略、優化顯存。

第二難點,是軟件生態的成熟度,針對國產芯片的特性,確保訓練全程的精確可復現,團隊需要重寫和優化核心算子,以及自研全確定性的算子。

第三個難點,是萬卡集群的穩定性,在動用5萬-6萬張國產算力卡的超大規模集群上,硬件故障難以避免。為此,團隊構建了一套完整的容錯與自動恢復體系。

最后,針對國產硬件的特點,團隊在訓練框架和模型結構進行針對性的親和設計,打破了通用框架的適配局限,提升了計算性能。

DeepSeek的算法優化降低了算力的門檻,把模型的價格打了下來;美團的工程實踐則證明國產芯片的可行性。這些探索,也給國產芯片生態沉淀出工程能力和經驗。

梁文鋒曾說:「我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚」,而今「鯰魚效應」已經顯現,DeepSeek并不獨行。

從單點到系統

騰訊云的湯道生曾有這樣一個比喻:「大模型是發動機,使用者是駕駛員」。使用者很容易注意到發動機的性能,但優秀的駕駛員,會意識到燃料與底盤同樣重要。

中國算力的發展,依賴的是整條產業鏈的協同進步。各個環節的核心企業,都在持續補足短板。

在制造端,公開數據表明,中國芯片產量節節攀升,但卻是「啞鈴型」結構,28nm以上成熟制程占絕對主力,14nm及以下先進制程產能依然稀缺。

面對EUV光刻機缺位的現實,中芯國際、華虹半導體等企業正推進多重曝光等工藝攻關,試圖在物理極限中尋找平衡點。多方報道顯示,中芯國際的N+2工藝(等效7nm)良率已經突破80%,這意味著已經跨過了商業化量產的門檻。

在算力端,國產芯片在單卡算力上與英偉達仍存在差距。華為昇騰910C等產品的實踐表明,通過極致的集群線性加速比,也能跑通體量巨大的模型訓練。

「得生態者得天下」。英偉達CUDA構建的護城河之所以深厚,一個重要原因是形成了普適性的軟硬件兼容標準。

行業從業者也意識到這一點。比如寒武紀推出基礎軟件平臺,兼容主流框架,降低開發者的遷移門檻。智源人工智能研究院牽頭的開源系統,構建了統一的底層接口,讓上層模型可以運行在多種不同的國產芯片上。

國內互聯網大廠也有很多動作,百度的雙軌戰略,字節跳動的千億投入,都在為算力底座尋找更優解。

據公開數據梳理,在過去幾年中,美團至少布局了21家覆蓋半導體/智能硬件和通用大模型領域的相關公司。其中,既包括芯片算力層的摩爾線程、沐曦股份,以及視覺芯片領域的愛芯元智;也包括新材料等細分賽道的廣州眾山、東方算芯等多家企業。

在技術長期保持跟進的同時,產業資本也在做算力的投資人和共建者,逐漸形成正向循環。

從數字世界,到現實任務

「當下人工智能正處于第三次浪潮的重要拐點,大模型正推動其從弱人工智能邁向通用人工智能,更關鍵的是,推動機器人從1.0專用機器人時代進入2.0通用具身智能時代!

北京智源人工智能研究院院長王仲遠的話,點出AI能力的重要落點,是物理世界。

一方面,眾多國產廠商正致力于讓大模型在云端「讀萬卷書」,提升模型的智慧、邏輯推理的嚴密性。另一方面,也要讓大模型「行萬里路」,比如文心大模型被植入到自動駕駛的決策系統中;混元大模型的工業質檢方案,已出現在多個流水線場景。

美團的外賣、到店、酒旅等業務,構成了日常生活中最復雜的任務執行網絡。這里有海量的的真實場景:從商家后廚的出餐速度,到騎手在暴雨中的配送路徑,再到用戶深夜的一句「想吃火鍋」。

王興曾明確提出,要將美團App率先升級成「AI-powered App」。這意味著,LongCat的訓練目標不僅是回答「哪家的小炒肉好吃」,更要「找到這家店,選出最佳的團購券,然后預定2個周五晚上7點鐘的座位」。

這意味著任務交付的效果尤為重要,也解釋了美團為何強調要打造物理世界的AI底座。

從參數提升到算力跑通,國產大模型正在完成從「能用」到「好用」的進階。

這條路沒有捷徑。未來,當算法、算力、資金與場景持續產生化學反應,中國AI 的故事,也將從「單點突破」翻到「系統進化」這一頁。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
3人年薪9380萬!對陣湖人,火箭讓出半套首發?新陣有望創造奇跡

3人年薪9380萬!對陣湖人,火箭讓出半套首發?新陣有望創造奇跡

熊哥愛籃球
2026-05-01 18:46:38
美國再不離場就麻煩了!中國集結戰略力量沖向黃巖島!

美國再不離場就麻煩了!中國集結戰略力量沖向黃巖島!

阿龍聊軍事
2026-05-01 09:38:16
反華議員訪港遭拒入境,英外長要求中方給解釋,我國回應盡顯底氣

反華議員訪港遭拒入境,英外長要求中方給解釋,我國回應盡顯底氣

藍色海邊
2026-05-01 14:32:22
江蘇一百歲老人,時隔60多年才突然發現:自己是中央特科重要人員

江蘇一百歲老人,時隔60多年才突然發現:自己是中央特科重要人員

舊史新譚
2026-04-05 17:02:25
全國罷工!5月1日交通大癱瘓,海陸空出行全攻略

全國罷工!5月1日交通大癱瘓,海陸空出行全攻略

以希臘之名
2026-05-01 13:34:19
護士夫婦救人后續!女子蘇醒發聲,母校發文,有人說怪話被怒批

護士夫婦救人后續!女子蘇醒發聲,母校發文,有人說怪話被怒批

觀察鑒娛
2026-05-01 09:06:36
角色反轉,聯大主席貝爾伯克訪華露底牌,目標直指中國一票否決權

角色反轉,聯大主席貝爾伯克訪華露底牌,目標直指中國一票否決權

遁走的兩輪
2026-05-01 03:03:07
北電96級再聚首,黃曉明一身肌肉,趙薇罕見現身,52歲祖峰好滄桑

北電96級再聚首,黃曉明一身肌肉,趙薇罕見現身,52歲祖峰好滄桑

冷紫葉
2026-04-30 15:43:10
尤文嫌貴國米無意!拜仁中場大將或加盟米蘭 一弱點引發廣泛質疑

尤文嫌貴國米無意!拜仁中場大將或加盟米蘭 一弱點引發廣泛質疑

雪狼侃體育
2026-05-01 19:22:41
失眠原因找到了!北京大學研究:睡不好的人,身體缺這種營養物質

失眠原因找到了!北京大學研究:睡不好的人,身體缺這種營養物質

路醫生健康科普
2026-04-30 13:05:07
飛機起飛前一旅客稱行李內有炸彈 南寧吳圩國際機場通報

飛機起飛前一旅客稱行李內有炸彈 南寧吳圩國際機場通報

新京報
2026-05-01 11:15:05
恩里克:花5小時分析5-4;孔氏拜仁是執教巴黎遇過最強對手

恩里克:花5小時分析5-4;孔氏拜仁是執教巴黎遇過最強對手

星Xin辰大海
2026-05-01 19:50:24
致敬帕勒莫!維尼修斯6分鐘內罰丟3個點球,球迷看傻眼了

致敬帕勒莫!維尼修斯6分鐘內罰丟3個點球,球迷看傻眼了

仰臥撐FTUer
2026-04-30 21:41:06
她陪主席走到最后,終身未婚,41年后同日離世,一生守密不言語

她陪主席走到最后,終身未婚,41年后同日離世,一生守密不言語

倫倫媽愛歷史
2026-05-01 10:56:29
李淵跪求放過10個孫子,李世民點頭應允,轉身后為何怒斬十孫?

李淵跪求放過10個孫子,李世民點頭應允,轉身后為何怒斬十孫?

千秋文化
2026-01-20 20:41:08
釘釘把錄音筆做成了充電寶:1299元的跨界實驗

釘釘把錄音筆做成了充電寶:1299元的跨界實驗

報錯免疫體
2026-04-30 16:35:07
賽后大亂斗!C 羅卷入大規模沖突,和對手球星當場激烈對峙

賽后大亂斗!C 羅卷入大規模沖突,和對手球星當場激烈對峙

夜白侃球
2026-05-01 15:21:40
張雪峰的財產爭奪戰開始了!

張雪峰的財產爭奪戰開始了!

八卦瘋叔
2026-04-29 11:08:54
世錦賽這次,趙心童敗北不到一天,墨菲竟因一段公開銳評火出圈

世錦賽這次,趙心童敗北不到一天,墨菲竟因一段公開銳評火出圈

林輕吟
2026-05-01 19:28:45
伊朗最高領袖,“最詳細傷情”披露

伊朗最高領袖,“最詳細傷情”披露

中國新聞周刊
2026-04-30 16:23:05
2026-05-01 21:04:49
藍洞商業
藍洞商業
原創、深度的新經濟人物和事件
691文章數 773關注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續大增 iPhone收入新高

頭條要聞

70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

頭條要聞

70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊早被炒了

娛樂要聞

馬筱梅產后身材恢復超好 現身戶外直播

財經要聞

GPU神話松動,AI真正的戰場變了

汽車要聞

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態度原創

教育
健康
房產
數碼
家居

教育要聞

告別“紙上談兵”!這個地方打破勞動教育圍墻,給孩子留下值得回憶的汗水!

干細胞治燒燙傷面臨這些“瓶頸”

房產要聞

所有戶型全賣爆!海口TOP級豪宅,景觀樣板間五一全線開放!

數碼要聞

三星T7存儲卡發售:提供128GB至1TB可選,329元起

家居要聞

靈動實用 生活藝術場

無障礙瀏覽 進入關懷版