網易首頁 > 網易號 > 正文 申請入駐

算力受限 DeepSeek-V4憑什么開源?

0
分享至



4月24日,國內大模型賽道掉下來一只靴子。DeepSeek-V4預覽版正式上線并同步開源,直接把1M(一百萬字)超長上下文拉成了官方服務的出廠配置。

要是放在一年前,這種級別的長文本處理能力,還是海外頭部大廠鎖在企業級付費墻里的專屬權益。現在,它直接被攤在開源社區的桌面上,成了開發者隨取隨用的基礎設施。對于一直熬夜處理冗長代碼庫或復雜法務合同的開發者來說,這無疑是一個好消息。

但在這種技術下放的背后,官方通稿里保留了一句非常克制的交底:“受限于高端算力,目前DeepSeek-V4-Pro的服務吞吐十分有限”。

對于看慣了廠商在發布會上大談算力儲備的人來說,這種直白透著一股罕見的冷峻。

大模型打到下半場,誰手里有多少高端硬件籌碼,業內心里都有數。與其維持參數層面的繁榮,不如將產業現狀亮明。DeepSeek這次的動作,其實是放棄了純粹跑分比拼的執念,在核心算法突破、國內尚待完善的異構算力生態,以及企業真實的商業環境之間,找到了一套兼顧技術演進與硬件現狀的折衷方案。

中國AI產業正在脫去早期盲目燒錢的外衣,步入一個極其現實的“算力賬本”時代。

Pro版算力賬怎么平?

具體來看那個吞吐被明確限流的V4-Pro。作為體系內的旗艦,V4-Pro擁有高達1.6T的總參數量,但在推理時僅需激活49B參數。這種極致的稀疏化設計,并非一個僅供展示的櫥窗模型,在真實產線的嚴苛檢驗下,它的技術底座具備極強的防御力。

能否勝任復雜代碼與邏輯推演,是檢驗大模型能否真正進入核心生產環節的試金石。在Agentic Coding(智能體代碼)評測環境里,V4-Pro的實操表現穩穩站在了當前開源模型的第一梯隊。



深度求索早已將其接入內部的代碼流水線中,讓其成為一線工程師重度依賴的生產力工具。研發人員給出的反饋顯示,其代碼生成和糾錯體驗優于Sonnet 4.5,非深度思考場景下已接近Opus 4.6,不過與Opus 4.6的思考模式仍有差距。

這種實戰表現的背后,是研究團隊對算法縱深的極致挖掘。在考驗預訓練數據清洗質量與知識密度的世界知識測評中,V4-Pro領先現有的大部分開源模型,目前僅略遜于頂尖閉源模型Gemini-Pro-3.1。至于數學、STEM(科學、技術、工程、數學)以及競賽型代碼測評,它拿到了與世界頂級閉源大廠同臺競技的資格。

獲取這種戰力,靠的顯然不是單純依賴算力卡堆疊。國內團隊心里清楚,真要拼高端顯卡儲備并不現實。V4-Pro能在有限顯存下處理1M的超大上下文,底層支撐是研發團隊對注意力機制進行了深度重構。他們實現了一種全新的注意力壓縮方案,在token維度進行高強度壓縮,并搭配其標志性的DSA稀疏注意力技術(DeepSeek Sparse Attention)。

這一套原創技術路線,加上首次引入的KV Cache滑窗和壓縮算法,有效控制了長序列處理帶來的計算開銷和內存占用。為了讓開發者真能在業務中調用其能力,研發團隊專門給Claude Code、OpenClaw等主流Agent工具做了底層適配。

技術文檔中甚至明示,開發者在處理復雜任務時可直接開啟思考模式,將reasoning_effort參數設為max。這種在有限計算資源下進行的系統級工程優化,恰恰向行業證明了,即便高端算力受限,本土團隊依然能靠原生架構設計拓寬模型的性能邊界。

13B激活量卡住了誰?

那些盯著Pro版吞吐瓶頸的人,往往忽視了深度求索隱藏在背后的商業支點,Flash版。業內有聲音認為這不過是算力短缺下的妥協產物,這種看法顯然低估了管理團隊的長期考量。這是一次經過嚴密成本精算后,對下沉生態發起的務實卡位。



據公開的適配代碼信息披露,Flash版的總參數量維持在龐大的284B級別,但它的激活參數量,被精確地卡在了13B。

13B,在這個同行試圖將參數推向萬億規模的語境下,顯得并不引人矚目。但這恰恰體現了混合專家(MoE)架構在商業落地中的經濟學邏輯:總參數決定了模型知識的廣度,而激活參數直接決定了每次調用接口時,服務器需要支出的電費成本和內存帶寬。

將激活量壓制在13B,直接把大模型從造價昂貴的頂級智算中心里剝離了出來。它對單卡顯存和算力峰值的需求非常克制。實測結果表明,Flash版在應對海量、高頻的簡單日常任務時,響應速度和準確率保持了穩定水準,底層通用推理能力并未出現明顯滑坡。對于那些每天需要處理成千上萬次API調用的中小開發者和長尾企業來說,這才是真正用得起、跑得動的平價生產力工具。

更深層的產業邏輯在于,目前國內主流的異構算力芯片,在單卡絕對性能上仍在追趕期。承載全量激活的計算系統極易觸碰內存墻,導致運行效率低下;但面對激活量僅為13B的Flash版,這些芯片卻能在中低功耗下保持順暢運轉。

DeepSeek這一步,盤活了國內大量閑置的中低端算力資源,為急需落地場景的國產芯片提供了一個契合度極高的試煉場。這種向下包容的基礎設施建設邏輯,遠比單純在各類測試榜單上刷個排名更符合當下的商業現實。

國產芯片接的住嗎?

此次發布引發行業廣泛討論的,是其打出的全棧國產落地標簽。過去很長一段時間,算法公司和國產芯片廠商之間存在一定的錯位:模型廠商擔憂硬件生態不完善會拖累研發進度,芯片廠商則缺乏最前沿的大模型進行深度調優。這一次,僵局被實質性打破了。



華為計算迅速發聲,確認昇騰超節點全系列產品全面支持新模型。從技術細節看,昇騰底層芯片依靠融合kernel和多流并行技術,有效降低了系統的計算開銷,從而穩住了長文本場景下的推理性能。寒武紀也迅速完成了Day 0適配并開源了底層代碼,海光DCU同步宣告打通閉環。

但我們需要撥開生態繁榮的表象,審視機房里軟硬縫合時面臨的真實阻力。以昇騰950系列芯片為例,據業內消息,該芯片具備112GB自研HBM、1.4TB/秒帶寬,單卡功耗達600瓦。在特定推理精度(如FP4)下,其單卡算力已展現出極強的數據表現,達到英偉達H20的2.87倍。但在要求更高的FP16或FP32通用訓練精度區間,國產硬件與英偉達的性能鴻溝依然存在。

此外,所謂的“Day 0適配”,距離企業級業務的無損運轉,仍需跨越供應鏈不透明帶來的隱形成本。超節點硬件的高速連接標準極其封閉,核心零部件的流向形同一個信息黑盒。這種采購端的壁壘,無疑讓算力系統的規模化部署與維護變得更加復雜。

同時,目前這套系統高度依賴國內極少數大型機構的集采大單。海外市場訂單的匱乏,意味著這場算力突圍戰只能在內循環里打轉。這種單一的商業閉環,讓整套軟硬協同系統的運轉效率,亟需經歷更多元商業環境的淬煉。

高端算力產能爬坡吃緊,直接導致DeepSeek在通稿中坦承,Pro版想要實現大幅降價,還需等待下半年超節點的批量上市。大模型與國產芯片確實完成了初步的物理咬合,但在技術落差和供應鏈約束下,這種帶傷狂奔的姿態,恰恰是國產算力生態最真實的生存切面。

人走了技術是否還能轉?

視野退回到真實的商業競爭中,DeepSeek-V4的問世是一次極其精準的戰略防守。過去大半年,這家公司的處境始終處于高壓狀態。C端賽道演變為紅海,頭部廠商動用海量資金進行密集投放。QuestMobile的數據呈現了清晰的競爭態勢:截至2026年3月,豆包月活達到3.45億,千問為1.66億,DeepSeek以1.27億固守自身的基本盤。



外部流量競爭激烈,內部的技術班底也面臨流動考驗。行業內的挖角競爭白熱化,多條業務線的骨干人員接連流出。據公開履歷與行業信息,第一代大語言模型核心作者已確認加盟騰訊,V3核心貢獻者去往小米,R1核心研究員入職字節跳動,多模態方向的核心力量也確認了新去向。據業內傳聞,OCR方向核心作者魏浩然也已離職。

核心研發成員的變動,必然會引發外界對其研發后勁的嚴格審視:這家依靠技術立足的公司,底層架構的創新能力是否會受到影響?

在這個節點,V4預覽版的發布成為了最直接的回應。它向市場證實,公司已經建立起一套具備抗風險能力的系統化研發流水線。即便面臨人員架構的調整,其技術演進的邏輯依然能夠保持精確運轉。這種建立在工程體系基礎上的組織韌性,迅速在資本市場獲得了正向反饋。

近期,DeepSeek被曝以不低于100億美元的估值尋求融資,計劃募集資金以補充儲備。據行業媒體援引接近交易人士的消息,市場傳聞有頭部互聯網巨頭預計注資,或將推高本輪估值。如果這筆交易最終敲定,將重寫國內大模型賽道的估值記錄,超越月之暗面此前的表現。在融資談判的關鍵期,端出百萬上下文和全棧國產適配的實質性成果,是管理層穩住戰略大盤、回應外部疑慮的理性落子。

寫在最后

在概念更迭頻繁的科技商業語境中,愿意專注于底層基礎設施搭建的團隊始終稀缺。DeepSeek-V4的發布,為大模型下半場的競爭確立了一個務實而冷峻的基調。

面對算力瓶頸,他們沒有選擇修飾,而是將國產高端硬件的真實供需現狀拋給了市場;面對下沉落地需求,他們利用13B激活量的Flash版,為處于追趕期的國產算力芯片提供了生存空間;面對外部的流量圍堵和人才競爭,他們用具體的長文本處理能力做出了行業維度的回應。

官方在發布當天引用的《荀子》原文極具深意:“不誘于譽,不恐于誹,率道而行,端然正己。”

模型可以開源,但算力不會免費。DeepSeek這次交出的,不是一款更強的模型,而是一種在算力成為約束之后,能力如何被重新分配的解法。在算力仍然不完美的現實里,這或許才是更接近產業本質的進化方向。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
林莉回憶生平第一次見大明星妹妹林青霞,她像個孩子,姐姐叫沒完

林莉回憶生平第一次見大明星妹妹林青霞,她像個孩子,姐姐叫沒完

銅臭的歷史味
2026-04-26 01:45:57
特朗普稱已取消威特科夫和庫什納前往巴基斯坦的行程

特朗普稱已取消威特科夫和庫什納前往巴基斯坦的行程

國際在線
2026-04-26 02:28:06
1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

阿校談史
2026-03-20 11:03:27
最新發布:2026年第一季度全國31省GDP排名!

最新發布:2026年第一季度全國31省GDP排名!

葉初七
2026-04-25 11:51:04
為個人健康考慮,西班牙女足國腳葆拉-托馬斯24歲宣布退役

為個人健康考慮,西班牙女足國腳葆拉-托馬斯24歲宣布退役

懂球帝
2026-04-25 11:15:51
湖北一老人拿離世孩子手機去維修,稱里面有視頻想留個念想,獨臂店主拒絕收錢:所有用來寄托逝者思念的手機維修,全部免費

湖北一老人拿離世孩子手機去維修,稱里面有視頻想留個念想,獨臂店主拒絕收錢:所有用來寄托逝者思念的手機維修,全部免費

930老友記
2026-04-25 21:34:53
經歷三次離婚后我才懂:所有夫妻關系破裂,都源于這三個原因

經歷三次離婚后我才懂:所有夫妻關系破裂,都源于這三個原因

千秋文化
2026-03-01 22:12:24
哈弗茨和埃澤先后因傷離場,阿森納一戰折損兩員大將

哈弗茨和埃澤先后因傷離場,阿森納一戰折損兩員大將

懂球帝
2026-04-26 03:32:06
勇士隊在2026年NBA模擬選秀中,將大幅度向前發展!

勇士隊在2026年NBA模擬選秀中,將大幅度向前發展!

夜白侃球
2026-04-25 23:59:09
伊朗武裝部隊發聲

伊朗武裝部隊發聲

中國基金報
2026-04-25 19:38:20
全球最強光刻機亮相!央視首次曝光,中國再次打破西方技術封鎖

全球最強光刻機亮相!央視首次曝光,中國再次打破西方技術封鎖

阿紿聊社會
2026-04-24 22:56:10
最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準時出海

最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準時出海

孤單是寂寞的毒
2026-04-24 16:45:41
阿爾特塔:哈弗茨&埃澤不得不下場,我認為他們只是輕微的小傷

阿爾特塔:哈弗茨&埃澤不得不下場,我認為他們只是輕微的小傷

懂球帝
2026-04-26 03:52:21
我敢打賭99%的男人會選白衣服女孩做老婆,看腿型就知道

我敢打賭99%的男人會選白衣服女孩做老婆,看腿型就知道

匹夫來搞笑
2026-04-24 12:20:31
高市沒料到,中方動真格了,中韓朝俄四國同時開火,局勢變成4打

高市沒料到,中方動真格了,中韓朝俄四國同時開火,局勢變成4打

可樂愛微笑
2026-04-26 05:07:56
海牙做出審判,老杜回國無望,人民日報一錘定音:中國不救菲律賓

海牙做出審判,老杜回國無望,人民日報一錘定音:中國不救菲律賓

泠泠說史
2026-04-25 20:05:47
美國女游客在印度民宿遭老板下藥,員工趁機性侵,被限制求救3天

美國女游客在印度民宿遭老板下藥,員工趁機性侵,被限制求救3天

小魚愛魚樂
2026-04-23 22:07:16
比伊勞拉更強!切爾西鎖定歐戰冠軍名帥,此人實力穩壓阿爾特塔

比伊勞拉更強!切爾西鎖定歐戰冠軍名帥,此人實力穩壓阿爾特塔

瀾歸序
2026-04-26 05:15:17
43歲萬茜VS23歲王和:自然美勝整容

43歲萬茜VS23歲王和:自然美勝整容

眼底星碎
2026-04-24 21:46:36
探訪賈國龍新品牌“天邊砂鍋燜面”店:人均消費55元左右,部分門店不提供兒童餐

探訪賈國龍新品牌“天邊砂鍋燜面”店:人均消費55元左右,部分門店不提供兒童餐

極目新聞
2026-04-25 23:16:28
2026-04-26 05:51:00
科技不許冷 incentive-icons
科技不許冷
聚焦前沿科技趨勢,追蹤產業熱點,把科技講熱,把未來看懂
37文章數 0關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
教育
數碼
房產
游戲

藝術要聞

毛澤東寫小字,太瀟灑了

教育要聞

今年新傳會爆嗎|與200位27朋友的對話

數碼要聞

聯發科亮相2026北京車展:主動式智能體座艙解決方案

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

金發美少女魔王和我是鄰居!新游首曝美女角色太吸睛

無障礙瀏覽 進入關懷版