无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

算力受限 DeepSeek-V4憑什么開源?

0
分享至



4月24日,國內(nèi)大模型賽道掉下來一只靴子。DeepSeek-V4預覽版正式上線并同步開源,直接把1M(一百萬字)超長上下文拉成了官方服務的出廠配置。

要是放在一年前,這種級別的長文本處理能力,還是海外頭部大廠鎖在企業(yè)級付費墻里的專屬權(quán)益。現(xiàn)在,它直接被攤在開源社區(qū)的桌面上,成了開發(fā)者隨取隨用的基礎(chǔ)設(shè)施。對于一直熬夜處理冗長代碼庫或復雜法務合同的開發(fā)者來說,這無疑是一個好消息。

但在這種技術(shù)下放的背后,官方通稿里保留了一句非常克制的交底:“受限于高端算力,目前DeepSeek-V4-Pro的服務吞吐十分有限”。

對于看慣了廠商在發(fā)布會上大談算力儲備的人來說,這種直白透著一股罕見的冷峻。

大模型打到下半場,誰手里有多少高端硬件籌碼,業(yè)內(nèi)心里都有數(shù)。與其維持參數(shù)層面的繁榮,不如將產(chǎn)業(yè)現(xiàn)狀亮明。DeepSeek這次的動作,其實是放棄了純粹跑分比拼的執(zhí)念,在核心算法突破、國內(nèi)尚待完善的異構(gòu)算力生態(tài),以及企業(yè)真實的商業(yè)環(huán)境之間,找到了一套兼顧技術(shù)演進與硬件現(xiàn)狀的折衷方案。

中國AI產(chǎn)業(yè)正在脫去早期盲目燒錢的外衣,步入一個極其現(xiàn)實的“算力賬本”時代。

Pro版算力賬怎么平?

具體來看那個吞吐被明確限流的V4-Pro。作為體系內(nèi)的旗艦,V4-Pro擁有高達1.6T的總參數(shù)量,但在推理時僅需激活49B參數(shù)。這種極致的稀疏化設(shè)計,并非一個僅供展示的櫥窗模型,在真實產(chǎn)線的嚴苛檢驗下,它的技術(shù)底座具備極強的防御力。

能否勝任復雜代碼與邏輯推演,是檢驗大模型能否真正進入核心生產(chǎn)環(huán)節(jié)的試金石。在Agentic Coding(智能體代碼)評測環(huán)境里,V4-Pro的實操表現(xiàn)穩(wěn)穩(wěn)站在了當前開源模型的第一梯隊。



深度求索早已將其接入內(nèi)部的代碼流水線中,讓其成為一線工程師重度依賴的生產(chǎn)力工具。研發(fā)人員給出的反饋顯示,其代碼生成和糾錯體驗優(yōu)于Sonnet 4.5,非深度思考場景下已接近Opus 4.6,不過與Opus 4.6的思考模式仍有差距。

這種實戰(zhàn)表現(xiàn)的背后,是研究團隊對算法縱深的極致挖掘。在考驗預訓練數(shù)據(jù)清洗質(zhì)量與知識密度的世界知識測評中,V4-Pro領(lǐng)先現(xiàn)有的大部分開源模型,目前僅略遜于頂尖閉源模型Gemini-Pro-3.1。至于數(shù)學、STEM(科學、技術(shù)、工程、數(shù)學)以及競賽型代碼測評,它拿到了與世界頂級閉源大廠同臺競技的資格。

獲取這種戰(zhàn)力,靠的顯然不是單純依賴算力卡堆疊。國內(nèi)團隊心里清楚,真要拼高端顯卡儲備并不現(xiàn)實。V4-Pro能在有限顯存下處理1M的超大上下文,底層支撐是研發(fā)團隊對注意力機制進行了深度重構(gòu)。他們實現(xiàn)了一種全新的注意力壓縮方案,在token維度進行高強度壓縮,并搭配其標志性的DSA稀疏注意力技術(shù)(DeepSeek Sparse Attention)。

這一套原創(chuàng)技術(shù)路線,加上首次引入的KV Cache滑窗和壓縮算法,有效控制了長序列處理帶來的計算開銷和內(nèi)存占用。為了讓開發(fā)者真能在業(yè)務中調(diào)用其能力,研發(fā)團隊專門給Claude Code、OpenClaw等主流Agent工具做了底層適配。

技術(shù)文檔中甚至明示,開發(fā)者在處理復雜任務時可直接開啟思考模式,將reasoning_effort參數(shù)設(shè)為max。這種在有限計算資源下進行的系統(tǒng)級工程優(yōu)化,恰恰向行業(yè)證明了,即便高端算力受限,本土團隊依然能靠原生架構(gòu)設(shè)計拓寬模型的性能邊界。

13B激活量卡住了誰?

那些盯著Pro版吞吐瓶頸的人,往往忽視了深度求索隱藏在背后的商業(yè)支點,F(xiàn)lash版。業(yè)內(nèi)有聲音認為這不過是算力短缺下的妥協(xié)產(chǎn)物,這種看法顯然低估了管理團隊的長期考量。這是一次經(jīng)過嚴密成本精算后,對下沉生態(tài)發(fā)起的務實卡位。



據(jù)公開的適配代碼信息披露,F(xiàn)lash版的總參數(shù)量維持在龐大的284B級別,但它的激活參數(shù)量,被精確地卡在了13B。

13B,在這個同行試圖將參數(shù)推向萬億規(guī)模的語境下,顯得并不引人矚目。但這恰恰體現(xiàn)了混合專家(MoE)架構(gòu)在商業(yè)落地中的經(jīng)濟學邏輯:總參數(shù)決定了模型知識的廣度,而激活參數(shù)直接決定了每次調(diào)用接口時,服務器需要支出的電費成本和內(nèi)存帶寬。

將激活量壓制在13B,直接把大模型從造價昂貴的頂級智算中心里剝離了出來。它對單卡顯存和算力峰值的需求非常克制。實測結(jié)果表明,F(xiàn)lash版在應對海量、高頻的簡單日常任務時,響應速度和準確率保持了穩(wěn)定水準,底層通用推理能力并未出現(xiàn)明顯滑坡。對于那些每天需要處理成千上萬次API調(diào)用的中小開發(fā)者和長尾企業(yè)來說,這才是真正用得起、跑得動的平價生產(chǎn)力工具。

更深層的產(chǎn)業(yè)邏輯在于,目前國內(nèi)主流的異構(gòu)算力芯片,在單卡絕對性能上仍在追趕期。承載全量激活的計算系統(tǒng)極易觸碰內(nèi)存墻,導致運行效率低下;但面對激活量僅為13B的Flash版,這些芯片卻能在中低功耗下保持順暢運轉(zhuǎn)。

DeepSeek這一步,盤活了國內(nèi)大量閑置的中低端算力資源,為急需落地場景的國產(chǎn)芯片提供了一個契合度極高的試煉場。這種向下包容的基礎(chǔ)設(shè)施建設(shè)邏輯,遠比單純在各類測試榜單上刷個排名更符合當下的商業(yè)現(xiàn)實。

國產(chǎn)芯片接的住嗎?

此次發(fā)布引發(fā)行業(yè)廣泛討論的,是其打出的全棧國產(chǎn)落地標簽。過去很長一段時間,算法公司和國產(chǎn)芯片廠商之間存在一定的錯位:模型廠商擔憂硬件生態(tài)不完善會拖累研發(fā)進度,芯片廠商則缺乏最前沿的大模型進行深度調(diào)優(yōu)。這一次,僵局被實質(zhì)性打破了。



華為計算迅速發(fā)聲,確認昇騰超節(jié)點全系列產(chǎn)品全面支持新模型。從技術(shù)細節(jié)看,昇騰底層芯片依靠融合kernel和多流并行技術(shù),有效降低了系統(tǒng)的計算開銷,從而穩(wěn)住了長文本場景下的推理性能。寒武紀也迅速完成了Day 0適配并開源了底層代碼,海光DCU同步宣告打通閉環(huán)。

但我們需要撥開生態(tài)繁榮的表象,審視機房里軟硬縫合時面臨的真實阻力。以昇騰950系列芯片為例,據(jù)業(yè)內(nèi)消息,該芯片具備112GB自研HBM、1.4TB/秒帶寬,單卡功耗達600瓦。在特定推理精度(如FP4)下,其單卡算力已展現(xiàn)出極強的數(shù)據(jù)表現(xiàn),達到英偉達H20的2.87倍。但在要求更高的FP16或FP32通用訓練精度區(qū)間,國產(chǎn)硬件與英偉達的性能鴻溝依然存在。

此外,所謂的“Day 0適配”,距離企業(yè)級業(yè)務的無損運轉(zhuǎn),仍需跨越供應鏈不透明帶來的隱形成本。超節(jié)點硬件的高速連接標準極其封閉,核心零部件的流向形同一個信息黑盒。這種采購端的壁壘,無疑讓算力系統(tǒng)的規(guī)模化部署與維護變得更加復雜。

同時,目前這套系統(tǒng)高度依賴國內(nèi)極少數(shù)大型機構(gòu)的集采大單。海外市場訂單的匱乏,意味著這場算力突圍戰(zhàn)只能在內(nèi)循環(huán)里打轉(zhuǎn)。這種單一的商業(yè)閉環(huán),讓整套軟硬協(xié)同系統(tǒng)的運轉(zhuǎn)效率,亟需經(jīng)歷更多元商業(yè)環(huán)境的淬煉。

高端算力產(chǎn)能爬坡吃緊,直接導致DeepSeek在通稿中坦承,Pro版想要實現(xiàn)大幅降價,還需等待下半年超節(jié)點的批量上市。大模型與國產(chǎn)芯片確實完成了初步的物理咬合,但在技術(shù)落差和供應鏈約束下,這種帶傷狂奔的姿態(tài),恰恰是國產(chǎn)算力生態(tài)最真實的生存切面。

人走了技術(shù)是否還能轉(zhuǎn)?

視野退回到真實的商業(yè)競爭中,DeepSeek-V4的問世是一次極其精準的戰(zhàn)略防守。過去大半年,這家公司的處境始終處于高壓狀態(tài)。C端賽道演變?yōu)榧t海,頭部廠商動用海量資金進行密集投放。QuestMobile的數(shù)據(jù)呈現(xiàn)了清晰的競爭態(tài)勢:截至2026年3月,豆包月活達到3.45億,千問為1.66億,DeepSeek以1.27億固守自身的基本盤。



外部流量競爭激烈,內(nèi)部的技術(shù)班底也面臨流動考驗。行業(yè)內(nèi)的挖角競爭白熱化,多條業(yè)務線的骨干人員接連流出。據(jù)公開履歷與行業(yè)信息,第一代大語言模型核心作者已確認加盟騰訊,V3核心貢獻者去往小米,R1核心研究員入職字節(jié)跳動,多模態(tài)方向的核心力量也確認了新去向。據(jù)業(yè)內(nèi)傳聞,OCR方向核心作者魏浩然也已離職。

核心研發(fā)成員的變動,必然會引發(fā)外界對其研發(fā)后勁的嚴格審視:這家依靠技術(shù)立足的公司,底層架構(gòu)的創(chuàng)新能力是否會受到影響?

在這個節(jié)點,V4預覽版的發(fā)布成為了最直接的回應。它向市場證實,公司已經(jīng)建立起一套具備抗風險能力的系統(tǒng)化研發(fā)流水線。即便面臨人員架構(gòu)的調(diào)整,其技術(shù)演進的邏輯依然能夠保持精確運轉(zhuǎn)。這種建立在工程體系基礎(chǔ)上的組織韌性,迅速在資本市場獲得了正向反饋。

近期,DeepSeek被曝以不低于100億美元的估值尋求融資,計劃募集資金以補充儲備。據(jù)行業(yè)媒體援引接近交易人士的消息,市場傳聞有頭部互聯(lián)網(wǎng)巨頭預計注資,或?qū)⑼聘弑据喒乐怠H绻@筆交易最終敲定,將重寫國內(nèi)大模型賽道的估值記錄,超越月之暗面此前的表現(xiàn)。在融資談判的關(guān)鍵期,端出百萬上下文和全棧國產(chǎn)適配的實質(zhì)性成果,是管理層穩(wěn)住戰(zhàn)略大盤、回應外部疑慮的理性落子。

寫在最后

在概念更迭頻繁的科技商業(yè)語境中,愿意專注于底層基礎(chǔ)設(shè)施搭建的團隊始終稀缺。DeepSeek-V4的發(fā)布,為大模型下半場的競爭確立了一個務實而冷峻的基調(diào)。

面對算力瓶頸,他們沒有選擇修飾,而是將國產(chǎn)高端硬件的真實供需現(xiàn)狀拋給了市場;面對下沉落地需求,他們利用13B激活量的Flash版,為處于追趕期的國產(chǎn)算力芯片提供了生存空間;面對外部的流量圍堵和人才競爭,他們用具體的長文本處理能力做出了行業(yè)維度的回應。

官方在發(fā)布當天引用的《荀子》原文極具深意:“不誘于譽,不恐于誹,率道而行,端然正己。”

模型可以開源,但算力不會免費。DeepSeek這次交出的,不是一款更強的模型,而是一種在算力成為約束之后,能力如何被重新分配的解法。在算力仍然不完美的現(xiàn)實里,這或許才是更接近產(chǎn)業(yè)本質(zhì)的進化方向。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
大快人心:中國男子因多次舉報遛狗不牽繩行為被扭送精神病院

大快人心:中國男子因多次舉報遛狗不牽繩行為被扭送精神病院

北歐模式
2026-07-05 11:24:21
綠軍送走巔峰FMVP被罵,轉(zhuǎn)頭神級操作打臉全聯(lián)盟,這盤棋太絕了

綠軍送走巔峰FMVP被罵,轉(zhuǎn)頭神級操作打臉全聯(lián)盟,這盤棋太絕了

林子說事
2026-07-05 03:03:24
央8又押對寶了!2026年諜戰(zhàn)劇扎堆開播,24集王炸《醒來》憑什么

央8又押對寶了!2026年諜戰(zhàn)劇扎堆開播,24集王炸《醒來》憑什么

阿廢冷眼觀察所
2026-07-06 00:26:57
我國首架,首飛成功!

我國首架,首飛成功!

環(huán)球網(wǎng)資訊
2026-07-04 15:50:17
永州文旅淪陷!兩個女游客遭強制猥褻,丈夫還被打骨折,當?shù)亓?>
    </a>
        <h3>
      <a href=小鋭有話說
2026-07-01 13:25:56
親弟車禍他崩潰砸傷右手,尼克斯冠軍中鋒隱瞞真相打完總決賽

親弟車禍他崩潰砸傷右手,尼克斯冠軍中鋒隱瞞真相打完總決賽

星河漫山野
2026-07-06 00:05:56
膽也太肥了!哈梅內(nèi)伊還沒下葬,以色列就對他的兒子虎視眈眈

膽也太肥了!哈梅內(nèi)伊還沒下葬,以色列就對他的兒子虎視眈眈

游古史
2026-07-05 23:20:08
墨西哥主帥怒斥FIFA臨時改賽程:這是背后捅刀子

墨西哥主帥怒斥FIFA臨時改賽程:這是背后捅刀子

慢享生活集
2026-07-05 01:35:29
賀煒解說佛得角:他們像祖先一樣一代代離開家鄉(xiāng),很多人已不會說家鄉(xiāng)的土話

賀煒解說佛得角:他們像祖先一樣一代代離開家鄉(xiāng),很多人已不會說家鄉(xiāng)的土話

哲學船
2026-07-05 22:15:27
西安賽格再起軒然大波!投資人2億本金分文未得,發(fā)視頻哭訴經(jīng)過

西安賽格再起軒然大波!投資人2億本金分文未得,發(fā)視頻哭訴經(jīng)過

火山詩話
2026-07-05 07:46:40
79歲王奎榮將北京140平房子、2000多萬存款,全部贈予小37歲妻子

79歲王奎榮將北京140平房子、2000多萬存款,全部贈予小37歲妻子

國際阿嘗
2026-07-04 09:05:08
5天一到,解放軍準時封海,特朗普沒想到,中方從未給31國留面子

5天一到,解放軍準時封海,特朗普沒想到,中方從未給31國留面子

面包夾知識
2026-07-03 17:07:24
梅西賽后遇到阿根廷女記者索菲-馬丁內(nèi)斯,兩人當面澄清緋聞

梅西賽后遇到阿根廷女記者索菲-馬丁內(nèi)斯,兩人當面澄清緋聞

懂球帝
2026-07-05 23:11:06
馬寧的含金量還在上升!巴拉圭對陣法國主裁判罰尺度惹爭議,曾主哨國足世預賽獲低分

馬寧的含金量還在上升!巴拉圭對陣法國主裁判罰尺度惹爭議,曾主哨國足世預賽獲低分

上游新聞
2026-07-05 11:59:39
科技投資人集體恐慌時,這個分析師說“AI滅掉軟件業(yè)”是幻覺

科技投資人集體恐慌時,這個分析師說“AI滅掉軟件業(yè)”是幻覺

碳基打工人
2026-07-04 02:01:44
正式簽約!1億變成1230萬!NBA又一支頂級強隊

正式簽約!1億變成1230萬!NBA又一支頂級強隊

籃球教學論壇
2026-07-06 00:23:09
突然意識到對方是在有愛家庭長大的,網(wǎng)友:不明白有人這么愛回家

突然意識到對方是在有愛家庭長大的,網(wǎng)友:不明白有人這么愛回家

九哥哥車評
2026-07-05 09:51:12
巴拉圭門將:我們踢球臟?那又能怎么辦呢,我們就是這么強硬

巴拉圭門將:我們踢球臟?那又能怎么辦呢,我們就是這么強硬

懂球帝
2026-07-05 10:01:04
兩岸艦船對峙,美國已介入,中方開始立威,王毅給魯比奧上了一課

兩岸艦船對峙,美國已介入,中方開始立威,王毅給魯比奧上了一課

阿芒娛樂說
2026-07-03 18:29:51
黃有龍估計也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

黃有龍估計也沒想到,自己花重金培養(yǎng)大的女兒,竟給趙薇做了嫁衣

精彩背后的故事
2026-07-05 21:34:45
2026-07-06 00:56:49
摩爾觀察 incentive-icons
摩爾觀察
聚焦前沿科技趨勢,追蹤產(chǎn)業(yè)熱點,把科技講熱,把未來看懂
44文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

華為:邏輯折疊將大幅提升麒麟CPU核心頻率

頭條要聞

醫(yī)院給老人一次拔12顆牙種10顆 官方:將頂格行政處罰

頭條要聞

醫(yī)院給老人一次拔12顆牙種10顆 官方:將頂格行政處罰

體育要聞

姆巴佩點走巴拉圭:巴黎三代左鋒傳承

娛樂要聞

霉霉婚禮照片泄露 有四人違規(guī)

財經(jīng)要聞

揭秘跨境“對敲”換匯黑產(chǎn)

汽車要聞

方程豹鈦9內(nèi)飾曝光 用上了長聯(lián)屏設(shè)計/下半年上市

態(tài)度原創(chuàng)

健康
教育
親子
手機
軍事航空

聽說少吃點能抗衰老?專家講解!

教育要聞

630分以上518人!江寧、高淳、溧水區(qū)三區(qū)2026年中考分段表出爐!

親子要聞

工程車愛游泳

手機要聞

2026下半年換機方向定了:大屏手機要火,華米OV耀聚齊了

軍事要聞

普京與特朗普通話85分鐘 細節(jié)公布

無障礙瀏覽 進入關(guān)懷版