今天,DeepSeek V4在萬眾期待中終于揭開了面紗,共兩個(gè)版本——V4-Pro和 V4-Flash,全系標(biāo)配 1M(百萬字)超長上下文,同步開源模型權(quán)重和技術(shù)報(bào)告。
即日起登錄官網(wǎng)chat.deepseek.com或官方App,即可與最新的DeepSeek-V4對(duì)話,探索 1M超長上下文記憶的全新體驗(yàn)。API服務(wù)已同步更新。
DeepSeek表示,相比前代模型,DeepSeek-V4-Pro的 Agent能力顯著增強(qiáng)。在Agentic Coding評(píng)測(cè)中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。
目前DeepSeek-V4已成為公司內(nèi)部員工使用的 Agentic Coding模型,據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。
DeepSeek-V4-Pro擁有更豐富的世界知識(shí),在世界知識(shí)測(cè)評(píng)中,大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。
此外,DeepSeek-V4-Pro還擁有世界頂級(jí)推理性能:在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro超越當(dāng)前所有已公開評(píng)測(cè)的開源模型,取得了比肩世界頂級(jí)閉源模型的優(yōu)異成績(jī)。
DeepSeek-V4-Flash則是更快捷高效的經(jīng)濟(jì)之選——相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下 V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的 API服務(wù)。
在 Agent 測(cè)評(píng)中,DeepSeek-V4-Flash在簡(jiǎn)單任務(wù)上與DeepSeek-V4-Pro旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。
值得一提的是,DeepSeek-V4開創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合 DSA 稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開始,1M(一百萬)上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。
DeepSeek-V4的發(fā)布不僅展現(xiàn)了團(tuán)隊(duì)在技術(shù)和架構(gòu)上的積淀,也標(biāo)志著開源大模型在國產(chǎn)算力生態(tài)下的實(shí)際落地能力。
V4技術(shù)報(bào)告第3.1節(jié)提到:“我們?cè)谟ミ_(dá)GPU和華為昇騰NPU兩個(gè)平臺(tái)上均驗(yàn)證了細(xì)粒度EP(專家并行)方案。”這是DeepSeek官方第一次在正式文檔中把華為昇騰和英偉達(dá)并列寫進(jìn)硬件驗(yàn)證清單。
經(jīng)過對(duì)華為昇騰、寒武紀(jì)等國產(chǎn)芯片的適配優(yōu)化,DeepSeek-V4系列實(shí)現(xiàn)了百萬token上下文的穩(wěn)定支持和高效推理,使長鏈路任務(wù)與多步Agent執(zhí)行成為可能,同時(shí)成本大降。
#DeepSeek #DeepSeekV4 #人工智能 #AI
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.