![]()
來源:獵云精選;文/孫媛
沒等來正式版,預覽版先來了。
就在今天,DeepSeek官宣,全新系列模型DeepSeek-V4的預覽版本正式上線并同步開源。
根據官方資料顯示,DeepSeek-V4 擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。
而預覽版的出現,不僅把“萬億參數”、“1M上下文”這些令人炫目的技術指標塵埃落地,更預示著一場深刻的“AI革命”正在發生。
要知道,DeepSeek-V4將首次實現對華為昇騰、寒武紀、海光信息等國產AI芯片的同步深度適配,這標志著全球首個頂級 MoE 大模型全棧國產落地。
而就在今天,DeepSeek-V4昇騰首發也將在B站開播,意味著 DeepSeek V4 將在華為昇騰 AI 處理器上完成適配和部署——國產大模型 + 國產算力的標志性組合,國產替代正加速突圍。
兩相結合來看,DeepSeek這一步,無不在揭開國內AI基礎設施自主可控的序幕。
百萬上下文成標配,兩個版本即可調用
DeepSeek-V4作為深度求索最新一代基礎模型,最大亮點在于結構創新和超高上下文效率。
根據官宣資料顯示,DeepSeek-V4開創了一種全新的注意力機制,在 token 維度進行壓縮,結合 DSA 稀疏注意力(DeepSeek Sparse Attention),實現了全球領先的長上下文能力,并且相比于傳統方法大幅降低了對計算和顯存的需求。
![]()
要知道一年前,1M(一百萬)上下文還是Gemini獨家的王牌。而現在,DeepSeek直接把1M上下文變成了所有服務的標配。
而除了百萬上下文普惠化,DeepSeek-V4還對Agent能力進行專項優化,針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化,在代碼任務、文檔生成任務等方面表現均有提升。
目前,模型按大小分為DeepSeek-V4-Pro、DeepSeek-V4-Flash兩個版本。
其中,DeepSeek-V4-Pro性能比肩頂級閉源模型,分別體現在三方面。
![]()
一是,相比前代模型,Agent 能力顯著增強。
在 Agentic Coding 評測中,V4-Pro 已達到當前開源模型最佳水平,并在其他 Agent 相關評測中同樣表現優異。
目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。
二是,在世界知識測評中, DeepSeek-V4-Pro 世界知識儲備大幅領先全部開源模型,僅略遜于 頂尖閉源模型Gemini-Pro-3.1。
三是,通用推理能力,比肩全球頂級閉源。
在數學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro 超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優異成績。
而相比Pro版本,DeepSeek-V4-Flash則是更快捷高效的經濟之選。
雖然對比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識儲備方面、高難度任務上稍遜一籌,但卻分別展現出了接近的推理能力,以及在簡單任務上的旗鼓相當。
同時,由于模型參數和激活更小,V4-Flash還能夠提供更加快捷、經濟的API服務。
![]()
目前,V4-Pro 與 V4-Flash 最大上下文長度為1M,均同時支持非思考模式與思考模式,已開放調用。
其中思考模式支持 reasoning_effort參數設置思考強度(high/max),官方建議,對于復雜的 Agent場景使用思考模式,并設置強度為 max。
DeepSeek“王者歸來”,傳估值已近200億美元
DeepSeek-V4預覽版本的發布,標志著大模型進入“高效化、輕量化、場景化”的新階段,而MoE架構作為實現“大參數、高效率”的核心路徑,有望成為未來大模型研發的主流方向。
從當前適配情況來看,DeepSeek-V4系列可兼容主流GPU芯片,同時針對國產算力芯片進行了專項優化,為國產芯片的落地提供了重要場景支撐。
對于國產算力芯片(如寒武紀思元、壁仞BR100、沐曦MX1等)而言,DeepSeek-V4的輕量化設計(如V4-Flash型號)為其提供了適配場景——相較于傳統大模型對芯片算力的極致依賴,V4-Flash的激活參數量僅13B,對芯片顯存、算力的要求相對溫和,能夠讓國產芯片在中低端算力場景中實現“性能適配”,加速國產芯片的商業化落地。
由此,對于國產算力生態而言,DeepSeek-V4的突破為國產大模型與國產算力芯片、服務器的協同發展提供了重要契機,有望打破海外算力生態的壟斷,推動國產算力產業鏈的自主可控。
而除了推動中國AI行業發展外,DeepSeek-V4預覽版本的面世,也是DeepSeek現階段發展的一劑強心針。
DeepSeek成立于2023年,由量化資管公司幻方量化的創始人梁文鋒創立,一直以開源模型為核心,商業化上沒有太多動作,主要靠幻方量化提供資金支持。
但從去年下半年開始,其“江湖地位”開始撼動。
一方面,在字節阿里等大廠的重投入下,DeepSeek已經掉到了C端用戶量第三。
第三方數據機構QuestMobile數據顯示,截至2026年3月,AI原生App中,字節豆包、阿里千問、DeepSeek排名前三位,月活用戶規模分別為3.45億元、1.66億元和1.27億元。
另一方面,AI人才爭奪如火如荼,DeepSeek也被“挖墻角”。
據晚點LatePost,2025年下半年至今,DeepSeek至少5名核心研發成員確認離職——第一代大語言模型核心作者王炳宣去了騰訊,V3核心貢獻者羅福莉被雷軍千萬年薪挖至小米,R1核心研究員郭達雅以傳聞近億元總包入職字節跳動Seed團隊,OCR系列核心作者魏浩然和多模態成果核心貢獻者阮翀也先后離開。5個人,覆蓋了基座模型、推理、OCR、多模態四條核心技術主線。
而這邊,DeepSeek略顯失意,另一邊,同為大模型獨角獸,智譜科技和MiniMax IPO后,市值卻在一度沖頂。
諸此種種,都讓DeepSeek很難再保持低調。
4月17日,DeepSeek首次被曝出以不低于100億美元估值尋求融資,計劃募集至少3億美元。
僅一周時間,市場熱情就被點燃,阿里騰訊均被傳出入局競投的消息。雖然截至目前,以上公司均未公開確認或回應上述投資意向及具體數據。
但據《財經》,有接近交易人士稱,投資方為騰訊與阿里巴巴,兩家投資方預計共計投資18億美元,本輪融資估值約200億美元。
如果按照這一估值來看,DeepSeek首輪融資便將超過今年3月被披露新一輪融資估值約180億美元的月之暗面。
現如今,DeepSeek-V4預覽版雖比原計劃晚到了2個月,但卻顯得恰逢其時。
在這個融資節點,先推出預覽版,無不在預熱DeepSeek的“王者歸來”。
正如DeepSeek官宣內容的那句,“不誘于譽,不恐于誹,率道而行,端然正己。”
出自荀子《非十二子》,意思是:不被贊譽誘惑,不被誹謗嚇到,按自己認定的道往前走,端正自己。
這說的,何嘗不是DeepSeek呢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.