4月24日,剛剛,DeepSeek正式發布并開源新一代大模型DeepSeek-V4預覽版,同步上線官網及App,并開放API調用。
據介紹,該系列主打“百萬字上下文(1M tokens)”能力,在Agent執行、推理性能和世界知識等方面實現顯著提升。
![]()
DeepSeek-V4提供兩種版本:
V4-Pro:性能對標頂級閉源模型,在Agentic Coding、數學與STEM推理等評測中達到開源模型領先水平,官方稱其交付質量接近部分頂級閉源模型非思考模式。
V4-Flash:主打低成本與高響應速度,在保持接近推理能力的同時,提供更具性價比的API服務。
![]()
![]()
技術上,V4引入新的注意力機制與DSA稀疏注意力(DeepSeek Sparse Attention),通過token維度壓縮顯著降低計算與顯存開銷,使“1M超長上下文”成為默認配置。
在生態適配方面,DeepSeek-V4已針對多種Agent框架優化,包括代碼生成、文檔處理等典型場景。API層面兼容OpenAI與Anthropic接口,并支持“思考模式”與推理強度調節。
同時,DeepSeek宣布舊版模型接口(deepseek-chat、deepseek-reasoner)將于2026年7月24日停止服務。新模型權重已在開源社區發布,支持本地部署。(袁寧)
