等了這么久,DeepSeek V4它終于來了
4月24日,DeepSeek全新系列模型V4預覽版正式上線并同步開源。這家以高效低成本訓練聞名的中國AI公司,終于在用戶近半年的翹首期盼中交出了答卷。
此次發布包含兩款模型:DeepSeek-V4-Pro(總參數1.6T,激活49B)和DeepSeek-V4-Flash(總參數284B,激活13B),兩者均支持1M超長上下文。官方宣布,百萬上下文將成為DeepSeek所有服務的標配,“邁入普惠時代”。
![]()
技術層面,V4開創了全新的DSA稀疏注意力機制,在token維度進行壓縮,大幅降低了對計算和顯存的需求。更關鍵的是,整個訓練過程完全基于國產算力集群,未使用任何英偉達芯片。
性能方面,V4-Pro在Agentic Coding評測中達到開源模型最佳水平。據官方透露,公司內部員工已將其作為日常使用的編碼模型,使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但與Opus 4.6思考模式仍有差距。
![]()
價格依舊是DeepSeek的殺手锏。V4-Flash輸入定價每百萬token僅1元,緩存命中時低至0.2元,輸出2元。V4-Pro輸入12元,輸出24元。兩個版本均支持非思考和思考模式,可通過reasoning_effort參數調節思考強度。
![]()
舊模型名deepseek-chat和deepseek-reasoner將在三個月后停用,目前分別指向V4-Flash的非思考和思考模式。API已同步更新,權重和技術報告已開源。
![]()
DeepSeek由量化私募巨頭幻方量化孵化,成立于2023年,總部位于杭州。公司以“技術開放、成本極致”著稱,此前推出的DeepSeek-R1模型在數學推理和代碼生成任務上比肩OpenAI o1,且完全開源免費商用。2026年4月,DeepSeek啟動了成立以來的首次外部融資,目標估值不低于100億美元,計劃募資3億美元。據“財聯社”報道,騰訊、阿里巴巴等科技巨頭已參與洽談,融資將用于采購算力、穩定人才隊伍及推動開源生態建設。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.