網易首頁 > 網易號 > 正文 申請入駐

國產算力機會來了!DeepSeek V4全量開源,華為寒武紀贏麻了

0
分享至

雷科技(ID:leitech)算了下,距離DeepSeek上一次大版本更新已經過去484天,雖然期間一直有小版本更新,也引發了不少討論,但這終究不是大家期待的V4。



圖源:DeepSeek

不過,好消息是我們終于不用再等了,DeepSeek V4在4月24日早上10:56正式發布,首發就有Flash和Pro兩個版本。這個消息很快就在海外刷屏,DeepSeek V4發布的推文,短時間內就收獲了數萬點贊和數百萬次瀏覽,評論區也是擠滿了人。



圖源:X

DeepSeek V4的關注度實在太高,以至于DeepSeek不得不在官方推文下留言:

請僅以我們官方賬號發布的 DeepSeek 新聞為準。其他渠道的聲明并不代表我們的觀點。

DeepSeek發布這個聲明的原因,是此前有人謠傳DeepSeek迫于壓力將不會開源V4版本(或僅開源小參數版本)。這個謠言甚至在一定程度上引發了開源AI社區的恐慌,不過現在這些謠言都被DeepSeek V4的全模型全量開源擊碎了,而且還是大家熟悉的Apache 2.0許可證。

有外國網友直接在底下留言:開源人工智能之王回歸了。



圖源:X

對的,DeepSeek,回來了。

開源王者,以怎樣的姿勢歸來?

此次發布的DeepSeek V4預覽版本分為Pro和Flash兩個模型,其中Pro面向復雜推理、高階Agent和高強度任務,Flash則面向高頻調用、低成本部署和快速響應場景。

其中V4-Pro采用1.6T總參數、49B激活參數的MoE架構,V4-Flash則為284B總參數、13B激活參數,兩者都支持100萬 token 的上下文長度。雖然參數差距巨大,但是根據官方的說法,他們借助算法優化了兩個模型的參數調用,使得兩個模型在日常任務中的表現幾乎相同。



圖源:DeepSeek

在小雷看來,這也揭示了DeepSeek對下一階段大模型競爭方向的判斷:模型不只是要更強,還要更便宜、更開放,這樣才能更容易被企業和開發者真正用起來。如果你深度使用過OpenClaw,云端Token的消耗速度肯定會讓你印象深刻,隨著AI的用途越發廣泛、能力越發強大,Token成本已經成為所有人都必須面對的問題。

但是,很多任務其實并不需要Pro級的AI模型去處理,比如辦公輔助、內容摘要、數據整理等場景,更需要的是速度、穩定性和成本控制。所以將模型一分為二,然后讓Flash版在輕量化任務中保持Pro的性能,就足以讓使用者和企業節省大量的Token費用。

聊回DeepSeek V4,小雷覺得最值得關注的就是百萬級 token 上下文。對普通用戶來說,這意味著更長的文檔、更復雜的對話、更完整的項目資料,可以被一次性納入模型處理,不用再拆分成多個片段分階段完成。



圖源:DeepSeek

而且DeepSeek V4的Agent及推理能力也得到了大幅度增強,配合更長的上下文,足以讓其具備出色的連貫操作能力,這也是為未來的“Claw”生態大爆發提前做好準備。小雷認為,DeepSeek趕在如今的時間段發布V4版本,肯定也是有這方面的考量。

更關鍵的是,DeepSeek V4延續了DeepSeek一貫的高性價比路線。過去很多大模型競爭喜歡強調參數規模和榜單成績,但DeepSeek卻更強調工程效率和使用門檻,因為它真正想解決的不是讓少數人看到技術上限,而是讓更多人承擔得起AI成本。



圖源:DeepSeek

這種思路對國產AI非常關鍵,中國市場有龐大的中小企業、垂直行業和內容生產需求,但它們不可能長期承受高昂的海外模型調用成本。DeepSeek V4如果能在性能和價格之間繼續保持平衡,就會成為更廣泛應用場景里的基礎模型。

更何況單論開源模型的話,在目前的各項測試中DeepSeek V4都幾乎拿到了第一,并且媲美海外閉源模型的最新版本(不過V4測試時GPT 5.5和Opus 4.7都還沒發布)。開源意味著你只需要投入前期的硬件成本,就能夠近乎零成本使用該模型,這對于不少大型企業來說也極具誘惑力。

國產算力,終于等來主場

既然聊到硬件成本,那么就不得不提DeepSeek V4對國產算力卡的支持了。在V4版本的開發過程中,華為、寒武紀等中國芯片企業都深度參與其中,并且與DeepSeek一起基于國產芯片重構AI大模型的算法邏輯并進行生態適配。

其實,在過去很長一段時間里,國產AI芯片面臨的最大問題,并不是沒有產品,而是缺少足夠強、足夠主流的真實業務負載,去測試國產算力芯片是否真正能夠穩定運行主流大模型。

當然,你要拿Qwen、kimi、豆包等AI模型去跑也確實可行,但是因為模型都是基于CUDA生態研發的,想在昇騰等芯片上跑通就需要借助兼容層來運行,相當于犧牲效率來換取低廉的硬件成本(某種程度上來說也是不得已而為之),也很難展示國產芯片的真正性能。

而DeepSeek V4的出現就解決了這個問題,它既有長上下文需求,又有復雜推理需求,還會被大量開發者和企業調用。如果國產芯片能在這樣的模型上跑出穩定表現,肯定會比單純公布硬件規格更有說服力,同時也能證明基于國產芯片深度適配后的國產模型,在性能和性價比上依然能夠躋身全球前列。



圖源:雷科技

對華為昇騰來說,DeepSeek V4應該是今年最重磅的項目了。雖然昇騰過去已經在政企、運營商、云計算和AI訓練推理場景里積累了不少案例,但要真正形成生態,還需要更多頭部模型和開發框架的支持。

除了華為昇騰,還有另一個值得注意的企業——寒武紀,作為另一家在首日就宣布支持DeepSeek V4的芯片企業,它也受到了很多關注,只有少數在開發階段就已經開始進行優化的芯片,能夠在首日直接適配DeepSeek,適配的國產AI芯片數量超過了英偉達芯片。雖然早前傳聞DeepSeek會放棄對CUDA生態的支持,但現在看來顯然是誤傳。

事實上,DeepSeek的早期版本仍然是在英偉達的硬件上訓練出來的,后續才逐漸轉向華為昇騰,并且首批硬件訪問權限僅提供給華為,等于是拉著華為一起搞“聯合研發”。



圖源:雷科技

這種做法的效果是顯著的,基于昇騰950超節點,DeepSeek V4-Pro在8K輸入場景下可實現約20ms的單token解碼時延,單卡Decode吞吐約4700 TPS,V4-Flash則可實現約10ms的時延,單卡Decode吞吐約1600 TPS,是英偉達此前可公開出口給中國的H20算力卡的2.87倍。

這些數字的意義,不是說讓國產芯片的海報上又增添幾串數字,而是讓市場第一次可以用更接近真實應用的方式去評估國產AI算力。而且也告訴市場,大模型推理不是簡單看芯片峰值算力,還要看顯存訪問、并行調度、低精度計算、通信效率和推理框架的協同。

雖然英偉達的算力卡性能確實稱得上全球最強,但是其真正的核心是CUDA生態,所以國產芯片想要追趕英偉達,就不能只靠堆硬件參數(制程限制下一時半會兒也追不上),而是要讓模型、框架和應用一起遷移過去,打造真正的軟硬件協同。

可以說,DeepSeek V4給Qwen、豆包、kimi等國產頂級大模型提前蹚了路,告訴大家:國產芯片是真的行。

CPU也被DeepSeek重新點燃

在寫這篇文章查詢資料的時候,小雷還看到了一則新聞:英特爾財報發布,Q1營收超預期,盤前股價飆升近30%。在英特爾的財報中,最值得關注的就是數據中心與人工智能業務部門(DCAI)營收達51億美元,同比增長22%。



圖源:百度股票

AI的需求,正在從GPU逐漸轉移到CPU上。有讀者可能好奇,小雷為什么要在DeepSeek的文章里提這個?因為DeepSeek恰恰是CPU需求增長的主要推手之一,其V4版本就引入了年初曝光的mHC架構,該架構的核心邏輯是“查算分離”。

舉個例子,以前的AI大模型,查資料和推算都是在GPU上完成的,不僅擠占算力,也占用大量顯存;而mHC架構則是將模型中靜態數據(即非調用數據)存儲在CPU的系統內存中,GPU僅需處理推理所需的數據即可。

這種設計,直接將大參數模型對顯存的壓力轉移到了CPU的系統內存上,而CPU即使是消費級的產品,也可以輕松掛載128GB乃至256GB的內存。這使得萬億參數規模的DeepSeek V4無需堆疊昂貴的顯卡陣列就可以完成本地化部署。

不過,CPU也因此需要更深度地介入到AI模型推理中,這使得高性能、高能效且高內存帶寬支持的處理器更受歡迎。而英特爾此前發布的至強6最高可支持12通道內存,單內存規格最高為256GB,意味著一顆CPU最高可掛載3TB的系統內存(在英特爾的產品線中,甚至有支持4TB的特化版本)。

某種程度上,mHC架構也算是降低了市場對HBM內存(VRAM)的需求,卻讓壓力回到了DRAM上。短期來看,可能確實讓內存的價格稍微回落(畢竟DRAM的制造難度比HBM小很多),但是長期來看,估計會讓所有內存都處于持續的緊缺狀態,消費電子行業接下來可能還要繼續承壓。



圖源:veer

而且,隨著類“OpenClaw”應用的普及,PC對CPU的要求也更高,因為AI需要一個高效的CPU在端側進行指令處理和執行。這也使得英特爾的新處理器備受關注,酷睿Ultra 300系列的高能效+高端側算力設計,恰好滿足此類應用的需求。

在開源模型+開源AI應用的雙重推動下,英特爾的營收估計還會持續上漲,這也讓雷科技(ID:leitech)意識到,如今的AI浪潮中,如何最大程度地利用現有的計算硬件生態,將會是未來AI生態需要優先考慮的事情。

寫在最后

在雷科技(ID:leitech)看來,DeepSeek V4的意義其實已經不只是“又一個強大的國產大模型發布”這么簡單,而是告訴我們,模型能力固然重要,但模型能不能被更多人用起來,能不能跑在更便宜、更容易獲得的硬件上,才是下一階段AI競爭的關鍵。

這不禁讓我想到了當年macOS與Windows的競爭,同為最早的圖形界面操作系統,前者雖然性能更強,但是因為僅支持蘋果的硬件,導致其在后續的幾十年里份額僅有Windows的十分之一甚至更低。而在AI領域也是如此,閉源AI模型雖然能力強大,但是普通開發者和小型企業卻面臨用不起、難以部署等問題。

而DeepSeek V4其實恰好解決了這些問題。首先開源就意味著免費,其次100萬 token 上下文和更強的 Agent 能力,又讓其真正成為生產力工具,而對國產芯片生態的支持,也讓其能夠適應不同的硬件環境,相當于給全球的AI開發者們開辟了一條新的康莊大道。

只能說,484天的等待沒有白費,DeepSeek這次帶回來的,不只是一個更強的V4,而是一個更開放、更低成本、更接近普通人的AI世界。

2026第十九屆北京國際汽車展覽會將于4月24日至5月3日在北京?中國國際展覽中心(順義館)和首都國際會展中心(新國展二期)舉行,本屆車展以“領時代·智未來”為主題,集中展現汽車工業的更多黑科技。
比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結,多款重磅新車首秀;地平線、Momenta、卓馭等供應商集體秀肌肉,AI大模型深度賦能,高階智駕、動力電池、超快充技術等前沿科技集中亮相,看點拉滿!
雷科技旗下「電車通」將派出報道團直擊現場,以“關注電動車,更懂智能化”的專業視角,帶來一線獨家報道,敬請關注!



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
麥科勒姆23+5,老鷹爆冷掀翻尼克斯!庫明加立大功,約翰遜準3雙

麥科勒姆23+5,老鷹爆冷掀翻尼克斯!庫明加立大功,約翰遜準3雙

一將籃球
2026-04-24 10:36:12
田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

以茶帶書
2026-04-23 16:11:50
真的慌了!看了ChatGPT Images 2.0一鍵生成的PPT,我們嚇出一身冷汗……

真的慌了!看了ChatGPT Images 2.0一鍵生成的PPT,我們嚇出一身冷汗……

秋葉PPT
2026-04-23 08:22:02
特朗普兒媳抖家族猛料:伊萬卡愛提建議,公公喜歡半夜打電話

特朗普兒媳抖家族猛料:伊萬卡愛提建議,公公喜歡半夜打電話

像夢一場a
2026-04-23 22:48:46
四川飼料大王首富變“首負”:欠了近千億,一年光利息就要18億

四川飼料大王首富變“首負”:欠了近千億,一年光利息就要18億

領悟看世界
2026-04-14 01:12:20
焦點訪談,錯了嗎?

焦點訪談,錯了嗎?

魚眼觀察
2026-04-23 20:42:20
演員王大陸一審被判刑

演員王大陸一審被判刑

極目新聞
2026-04-22 12:35:08
笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

火山詩話
2026-04-21 09:46:21
左小青這狀態,鯊瘋了!明媚動人,若隱若現

左小青這狀態,鯊瘋了!明媚動人,若隱若現

只要高興就好
2025-12-10 19:09:26
賈國龍天邊燜面才兩個月,評分已暴跌3.8分!網友直言:兇多吉少

賈國龍天邊燜面才兩個月,評分已暴跌3.8分!網友直言:兇多吉少

秋姐居
2026-04-24 14:40:46
張柏芝大兒子終于“長開”了!穿西裝比謝霆鋒還帥,網友:像爺爺

張柏芝大兒子終于“長開”了!穿西裝比謝霆鋒還帥,網友:像爺爺

木子愛娛樂大號
2026-01-07 21:47:13
高盛:中國白酒Q1業績預測,貴州茅臺、五糧液“冰火兩重天”

高盛:中國白酒Q1業績預測,貴州茅臺、五糧液“冰火兩重天”

財聞
2026-04-24 13:24:20
瑟爾斯基“猛料”:俄欲吞并全烏太荒誕

瑟爾斯基“猛料”:俄欲吞并全烏太荒誕

小眼睛小世界
2026-04-24 06:22:38
未來5月,苦盡甘來的三大星座

未來5月,苦盡甘來的三大星座

朗威談星座
2026-04-22 15:47:25
1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

嘮叨說歷史
2026-03-24 11:17:11
快訊!伊朗政權變天了!

快訊!伊朗政權變天了!

故事終將光明磊落
2026-04-24 17:29:03
以色列:已準備好重啟戰爭,只要美國同意,將刺殺伊朗最高領袖穆杰塔巴,炸毀其能源和電力設施,使其重回“石器時代”

以色列:已準備好重啟戰爭,只要美國同意,將刺殺伊朗最高領袖穆杰塔巴,炸毀其能源和電力設施,使其重回“石器時代”

揚子晚報
2026-04-24 07:16:02
德國百年巨頭倒下時,浙江修鞋匠花4500萬買下,如今年入70億

德國百年巨頭倒下時,浙江修鞋匠花4500萬買下,如今年入70億

毒sir財經
2026-04-19 22:12:53
奔馳快養不起北京汽車了

奔馳快養不起北京汽車了

汽車K線
2026-04-24 07:30:06
13-3!世錦賽首個8強誕生 8位中國球員出局 丁俊暉4-4追平趙心童

13-3!世錦賽首個8強誕生 8位中國球員出局 丁俊暉4-4追平趙心童

侃球熊弟
2026-04-25 00:29:19
2026-04-25 02:00:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36928文章數 812047關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

航班提前起飛10分鐘 大學生把海航告了

頭條要聞

航班提前起飛10分鐘 大學生把海航告了

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

手機
本地
游戲
時尚
公開課

手機要聞

1799元起!vivo Y6 5G手機發布:6.75英寸LCD屏、7200mAh大電池

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

《光與影:33號遠征隊》發售一周年 銷量破800萬

今日熱點:愛奇藝回應暫停頁面廣告爭議;經紀公司否認THEBOYZ解約成功……

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版