本文來源:時代財經 作者:龐宇 林心林
![]()
圖源:AI生圖
蟄伏近5個月,DeepSeek終于迎來新一輪重磅迭代。
4月24日,DeepSeek-V4 Preview正式上線并開源,該版本分為Pro和Flash兩款,分別對應官方網頁端、App界面的專家模式與快速模式。
從技術迭代方向來看,DeepSeek-V4 在模型參數體量與實際能力上實現不小突破。
DeepSeek官方測評顯示,V4-Pro在Agentic Coding、世界知識、數學、STEM和競賽級代碼等測評中,達到當前開源模型領先水平,并在部分指標上比肩頂尖閉源模型。
此次備受關注的V4版本發布,較市場此前預期的“春節前后”節點晚了數月。而在這段時間里,大模型行業競爭空前激烈,部分大模型甚至以“月更”為節奏高頻持續上新,DeepSeek卻一直悄無聲息。
這家憑借低成本、高性能和開源打出辨識度的明星大模型企業,則一邊因新模型“停更”“跳票”身陷輿論討論,一邊又被卷入人才流動和融資傳聞。
時代財經注意到,深度求索官方在DeepSeek-V4官宣文稿末尾,特意援引了《荀子·非十二子》的名句“不誘于譽,不恐于誹,率道而行,端然正己。”這十六個字表述,似乎是其對近期外界種種聲音作出的間接回應。
V4姍姍來遲,在華為昇騰平臺首發
“從現在開始,1M上下文將是DeepSeek所有官方服務的標配。”深度求索方面介紹,DeepSeek-V4模型按大小分為DeepSeek-V4-Pro、DeepSeek-V4-Flash兩個版本,上下文長度均為1M(一百萬)。
長上下文能力已非大模型行業的新鮮事。過去一年,國內外頭部模型廠商幾乎都在持續拉長上下文窗口。V4更受關注的,是其通過結構創新實現推理成本大幅降低。
DeepSeek在官方文章中表示,V4開創了一種全新的注意力機制,在token維度進行壓縮,結合DSA稀疏注意力(DeepSeek Sparse Attention),既實現全球領先的長上下文能力,又相較于傳統方法大幅降低了對計算和顯存的需求。
而V4更大的亮點在于Agent能力的顯著提高。
在Agentic Coding評測中,V4-Pro已達到當前開源模型最佳水平。“目前DeepSeek-V4已成為公司內部員工使用的Agentic Coding模型,據評測反饋使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與其思考模式存在一定差距。”
在世界知識測評中,V4-Pro大幅領先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。此外,在數學、STEM、競賽型代碼的測評中,V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。
不過,DeepSeek也坦言,在推理能力上,V4-Pro-Max與最先進的前沿模型仍存在3至6個月的差距。
![]()
圖源:DeepSeek-V4技術報告
時代財經注意到,DeepSeek-V4在海內外全網更新后,迅速在海外開發者社區和技術圈引起熱議。
不少網友對于DeepSeek此次更新給出積極反饋,有評價稱其幾乎是“這個領域里相當徹底的開源”,開發者文檔完善、價格“低得驚人”,同時卻具備接近前沿模型的能力;也有用戶直言,模型質量與價格相比是一筆“瘋狂劃算的交易”。
實際上,DeepSeek V4的登場比市場預期晚了許多。
早在今年初,就有消息傳出DeepSeek-V4將在春節前后發布,一時間業內討論度升溫。但之后,市場幾番猜測又頻頻落空。直至4月24日正式亮相,較上一輪模型更新(DeepSeek-V3.2)已間隔近5個月。
值得注意的是,對于此前外界猜測的延遲發布與底層代碼重寫、適配國產芯片有關的傳聞,本次DeepSeek-V4技術報告給出了側面印證。
時代財經注意到,深度求索罕見地將華為昇騰和英偉達寫進DeepSeek-V4技術報告:“我們在英偉達GPU和華為昇騰NPU平臺上驗證了細粒度EP(專家并行)方案。”
華為官方也發布信息稱,DeepSeek-V4在昇騰首發,昇騰超節點全系列產品支持DeepSeek V4系列模型。
這一算力適配的選擇,或將引來全球科技行業的震動。長期以來,全球AI算力的技術體系與產業生態,基本圍繞英偉達的技術路線構建,其CUDA生態不僅為模型開發提供了成熟的工具支撐,更已成為行業內通用的AI計算標準接口。
如今,DeepSeek-V4選擇在華為昇騰平臺首發,無疑打破了這一長期固化的算力生態格局。近日,英偉達創始人黃仁勛在一場訪談中就提到:“DeepSeek絕非一個?關緊要的進步,如果DeepSeek率先在華為上發布,那對美國來說將是一個可怕的結果。”
與此同時,這一生態成本未來或能夠進一步降低。DeepSeek表示,受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。
目前,按DeepSeek官方價格折算,V4-Pro每百萬tokens輸入是1元,輸出是12元;V4-Flash每百萬tokens的輸入和輸出分別是0.2元和2元。
![]()
圖源:DeepSeek-V4技術報告
融資傳聞升溫,DeepSeek走到十字路口
在DeepSeek-V4“姍姍來遲”的這段空窗期里,大模型行業的競爭格局已悄然劇變,火藥味漸濃——這與當年DeepSeek R1橫空出世時的環境已然不同。
今年2月,字節跳動、騰訊、阿里等多家科技巨頭紛紛加大AI應用投入,它們旗下的豆包、元寶和千問等產品的月活躍用戶(MAU)迎來爆發式增長,在AI原生App榜單中強勢崛起,一度撼動DeepSeek占據的“江湖地位”。幾乎在同一時間,Kimi K2.5、GLM-5、MiniMax M2.5等國產大模型也密集登場。
隨著4月上旬DeepSeek創始人梁文鋒在內部溝通中透露,新一代旗艦大模型將于當月下旬發布的消息傳開,一場圍繞大模型的卡位戰加速打響。
戲劇性的是,就在DeepSeek-V4上線的前一天,互聯網巨頭上演了一場集體“伏擊”,4月23日,小米MiMo-V2.5和騰訊混元Hy3 preview同日開啟公測,而阿里則在更早前的4月2日便發布了Qwen3.6-Plus。
外部強敵環伺之下,DeepSeek的內部組織穩定性與服務保障能力正在經受考驗。
一方面,核心技術人才的接連出走,引發市場對這家基座大模型公司研發能力的擔憂。公開信息顯示,自2025年下半年以來,DeepSeek的研發團隊出現明顯人員流動,DeepSeek第一代大語言模型核心作者王炳宣轉投騰訊、V3版本核心貢獻者羅福莉入職小米。
甚至在4月中旬V4版本呼之喚出之時,據晚點報道,當年R1核心研究員郭達雅選擇加入字節跳動Seed團隊。
另一方面,隨著用戶規模的擴張,DeepSeek服務穩定性問題也日益凸顯。2026年開年以來,DeepSeek多次出現大規模服務中斷,其中3月29日晚至次日上午的宕機波及網頁端與APP端,持續時間長達約12小時。
進入4月,關于DeepSeek啟動首次外部融資的消息持續發酵。
就在DeepSeek-V4上線前一周,證券時報等多家媒體報道稱,DeepSeek正與投資者洽談首輪外部股權融資,計劃以不低于100億美元的估值,募集不少于3億美元資金。隨后又有報道稱,騰訊、阿里正洽談以超過200億美元估值投資DeepSeek,兩家投資方預計共計投資18億美元。不過上述消息均未得到DeepSeek及相關方的確認。
這場融資傳聞之所以引發如此大的反響,核心在于它與DeepSeek此前留給外界的“技術純粹派”印象形成強烈反差。
梁文鋒曾在公開表態中表現出對融資的明確排斥。其在采訪中曾表示,幻方作為出資人之一為其充足研發預算;更核心的顧慮在于外部投資者或干預公司決策,梁文鋒稱很多VC對做研究有顧慮,存在退出需求,希望盡快做出產品商業化,而這與DeepSeek優先做研究的思路并不完全匹配。
彼時,獨立于融資敘事之外、專注于技術研究,正是DeepSeek最吸引人的故事之一。一定程度上,當年R1橫空出世,正是憑借這份純粹的技術追求,在眾多模型中脫穎而出,成為AI行業的“黑馬”。
但如今,大模型競爭已告別單點突破的時代,進入算力、人才、生態、產品和商業化的綜合戰。僅依靠技術聲望和內部資金,或許已難以覆蓋下一階段的綜合競爭成本。
而引入外部資本,不僅能補充彈藥,還意味著企業的估值將得到市場定價,員工手中的股權激勵也將有更清晰的價值參照。這對于過去一年頻頻被卷入人才流動討論的DeepSeek來說,或許也是穩定團隊、留住核心研發人員的一種更為現實的方式。
實際上,在DeepSeek尚未邁出融資這一步時,昔日同為大模型獨角獸的競爭對手們,早已在資本市場上加速奔跑。
今年1月,智譜(02513.HK)與MiniMax(00100.HK)先后登陸港交所,截至4月24日,兩者最新市值分別達到4169億港元和2439億港元。
月之暗面雖尚未啟動上市,但據財聯社3月份報道,其今年以來已完成三輪融資,估值在3個月內翻了4倍,最新一輪融資估值上升至180億美元。
對于站在十字路口的DeepSeek而言,一邊是愈發殘酷的算力與人才軍備競賽,另一邊是向其拋出橄欖枝的資本市場。一邊是堅守技術理想的初心,一邊是應對商業競爭的現實壓力。
這家曾給中國AI行業帶來巨大驚喜的公司,能否在技術理想與現實之間找到可持續的平衡,將決定它下一階段的生存與發展走向。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.