網易首頁 > 網易號 > 正文 申請入駐

主動“認輸”的DeepSeek,這次到底行不行?

0
分享至


實測V4長文本、代碼、推理能力。

AIX財經(AIXcaijing)原創

作者| 李夢冉

編輯| 魏佳

沒有發布會,沒有倒計時,DeepSeek V4就這樣直接上線了。

這已經是DeepSeek慣用的節奏。但這次不一樣的地方在于,他們在技術報告里主動寫下了一句話:V4的能力水平仍落后于GPT-5.4和Gemini-3.1-Pro,發展軌跡大約滯后前沿閉源模型3至6個月。

這句話放在國內AI圈的語境里,顯得有些格格不入。大多數模型發布,標配的是“全球領先”“行業第一”。DeepSeek反過來,主動劃出差距。

但如果細看這次發布的內容,就會發現這并不是謙虛,V4壓根沒打算在“誰最強”這個問題上和GPT-5掰手腕。V4想做的,是把百萬token的超長上下文變成所有用戶的標配,同時把價格打到競品的三分之一以下。

這篇文章我們想說清三件事:V4是什么、它能干什么,以及這次發布背后值得關注的信號是什么。

01.

V4最大變化:超長文本全系標配

V4模型按大小分為Pro和Flash兩個版本,在官方網頁端和APP界面分別是專家模式和快速模式。

Pro是旗艦版,主打能力上限,對標的是GPT-5、Gemini這類頂級閉源模型,適合對效果要求極高的復雜任務。Flash是輕量版,速度更快、價格更低,推理能力接近Pro,但世界知識儲備稍遜一些。


兩款模型都支持同一件事,也是這次發布最值得普通用戶關注的變化——百萬token的超長上下文,全系標配,不分版本,不加價。

“上下文”這個詞聽著技術,簡言之就是“AI一次能讀多少內容”。按照100萬token大約是75萬漢字換算,差不多把整部《三國演義》喂給V4,它都能完整理解和分析。

這源于V4采用了CSA(壓縮稀疏注意力)和HCA(重度壓縮注意力)的混合架構。同樣處理一百萬字的內容,V4只需要前代模型四分之一的算力和十分之一的顯存。

以前這個能力不是沒有,但價格都很貴,得單獨付費或者升級套餐。V4把它變成了所有用戶默認就有的基礎能力。對日常使用來說,感知最明顯的一點是:使用者不再需要把一份長報告剪來剪去分段喂給AI,整份材料可以一次性丟進去,讓它直接處理。

此外,V4提供了三檔推理強度:

Non-think直出模式,AI直接給答案,適合簡單問答和日常對話,速度最快;在網頁和APP上關閉深度思考即可。

Think High是常規深度思考,AI會在腦子里推導一遍再回答,適合需要分析計算的場景;

Think Max則適合極難推理,但耗時更長,消耗的token大約是普通模式的兩倍。思考的強度,由模型根據問題的復雜程度自動判斷,或者使用者可以通過API參數手動指定為High或Max。

定價方面,V4延續了DeepSeek一貫的激進風格。

V4-Pro每百萬token輸入1元(緩存命中)或12元(緩存未命中),輸出為24元;V4-Flash為每百萬token輸入0.2元(緩存命中)或1元(緩存未命中),輸出為2元。

粗算下來,DeepSeek的定價大約是競品的三分之一甚至更低。另外,V4同時支持OpenAI和Anthropic兩種API接口格式,對開發者來說,切換只需要改一個參數,遷移成本幾乎為零。

02.

三個場景實測:長文本、寫代碼、復雜推理

在實際使用中,V4表現如何?我們圍繞三個高頻使用場景對其展開測試:長文本處理、代碼生成與調試和復雜推理。

場景一:長文本處理

長文本處理是V4此次核心賣點,我們直接選用某上市公司2025財年年度報告作為測試材料。這份年報篇幅為324頁,涵蓋財務報表、附注及股東信息等多個模塊,信息密度高、數據分散,是測試長文本理解能力的理想素材。

我們的測試問題分兩層:第一層要求提煉年報核心要點;第二層追問兩個藏在文檔深處的具體數據——該年度回購股份的總數量與總對價,以及管理人員酬金排名第三的具體人員與金額。這兩個問題的答案分別散落在年報第212至213頁和第311至313頁,位置偏后,必須完整閱讀文檔才能準確定位。

V4響應時間約19秒,給出的答案完全符合原報告。


此外,在追加提問短期銀行借款利率區間時,我們關閉了“深度思考”,選擇Non-think模式,V4同樣準確找到年報數據,信息來源同樣精確到頁碼。


從整體表現來看,快速模式下V4對這份300余頁年報的處理相當穩定。數據定位準確、跨章節關聯清晰、單位換算無誤,且在回答過程中主動識別了潛在的口徑歧義并加以說明,并沒有因為文檔體量大而出現答非所問或信息遺漏的情況。

對于需要快速從大體量文檔中提取特定數據,V4的長文本處理能力已經達到了實際可用的水準,且在快速模式下便能完成,不需要開啟深度思考來換取準確性。

場景二:代碼生成與調試

這一場景我們分兩步進行測試:

第一步,讓V4生成一段含有隱藏Bug的Python代碼,要求故意埋入2至3個常見錯誤但不提示位置;

第二步,將這段代碼重新交回V4,要求找出所有問題、修復代碼并逐一解釋原因。兩輪分別在開啟和關閉深度思考的模式下各跑一次。


開啟深度思考模式響應時間15秒。V4在思考過程中主動梳理了代碼的所有潛在問題,最終給出了6項錯誤分析,超出原題預設的2至3個范圍。除了最核心的數據類型錯誤和文件未正確關閉之外,還額外識別出除零錯誤、列名不存在時的KeyError等。


關閉深度思考模式明顯更快,直接輸出結果,沒有可見的思考過程。識別出的問題同樣是文件未正確關閉、列數據類型錯誤、除零錯誤、列名不存在等,與開啟深度思考的核心結論基本一致。


對于不懂代碼的用戶來說,日常的代碼調試任務,關閉深度思考已經足夠可用,速度也更快;如果是生產環境的代碼審查,或者需要考慮各種異常邊界,開啟深度思考會給出更完整的分析。

場景三:復雜推理與分析

對于復雜推理測試,我們設定為一家中高端護膚品公司的經營困境分析:三年收入年均增長18%,但凈利潤率從12%腰斬至6%,同時面臨庫存積壓、營銷費用失控、電商渠道落后和競爭對手低價搶市等多重壓力。

要求V4以商業顧問身份,識別核心問題、按緊迫程度列出三個優先風險并說明判斷依據,隨后在同一對話中追問:若公司決定優先發力電商渠道,可能面臨哪些新風險。

深度思考響應用時9秒。V4在思考過程中先完成了問題拆解:將所有負面信號歸類為現金流威脅、盈利能力惡化、市場結構性風險三個維度,再依據“若不立即處理會導致現金流斷裂或持續虧損”的緊迫性標準完成排序,邏輯鏈條清晰可見。


最終它給出的三個優先風險依次是:庫存積壓與現金流風險排第一; 盈利能力持續惡化排第二,中端市場被搶占與渠道結構性短板排第三,并均給出了充分理由。

為了驗證連續推理能力,我們追問發力電商渠道的風險,響應用時僅3秒,直接在第一輪建立的背景基礎上繼續推導,V4識別出五項新風險。


關閉深度思考后結果也差不多,不過結論呈現上更結構化,增加了“止損時間窗口”,落地感更強,某種程度上比深度思考版本更像一份可以直接拿去匯報的分析文件。


這一輪測試最值得關注的有兩點:一是推理的連貫性。前后兩輪的分析形成了完整的邏輯鏈;二是結論的落地性。風險分析不停留在“可能會有影響”的泛泛層面,每條都給出了具體的傳導路徑。

比如它指出高端產品依賴線下BA服務和專柜體驗來支撐溢價,一旦在電商大力促銷,消費者會形成“不降價就不買”的預期,進而打擊線下門店的正價銷售能力,最終形成惡性循環。測試結果顯示出推理邏輯連貫性和縝密性。

03.

V4的真正影響力,在模型之外

DeepSeek主動說自己“落后3到6個月”,這不是謙虛。DeepSeek的牌是開源、是價格,承認差距,反而讓這張牌打得更穩。

一位長期關注大模型領域的從業者對「AIX財經」稱,“當一個開源模型把百萬上下文變成標配、把API價格打到競品的三分之一,你會發現閉源模型的護城河其實沒有想象中那么寬?!盫4最大的價值是讓用戶在成本可控的前提下,把很多以前想做但做不起的功能做出來了。

也因此,開源加低價,可能會動搖整個行業的定價邏輯。

對普通用戶和中小開發者來說,頂級推理能力的使用門檻被大幅拉低。以前要用上好模型,要么付高額訂閱,要么承受居高不下的API成本,現在這個壁壘被打薄了;對大廠來說,當一個性能接近的開源模型以極低價格提供服務,閉源模型的溢價空間會被持續壓縮,而且這個壓力是長期的,不會因為下一個版本發布就消失。

此外,V4技術報告里,首次把華為昇騰和英偉達GPU并列寫進了硬件驗證清單。


更值得注意的是,V4選用的FP4精度格式,恰好是華為今年新發布昇騰950芯片原生支持的精度,兩者之間的適配不是巧合。DeepSeek官方表示,等下半年昇騰950超節點批量上市之后,V4-Pro的價格還會繼續大幅下調。

在英偉達出口管制持續收緊的背景下,這次技術協同釋放的信號很清晰:DeepSeek在主動構建一條不依賴英偉達的算力通道。這件事的戰略意義,比V4本身的產品發布要深遠得多。

上述從業者稱,昇騰這條線如果真的跑通,對整個國內AI生態意義巨大,現在大家都在英偉達這根管子上排隊,一旦有一套可以平替的硬件基礎設施成熟起來,算力的定價權和供給穩定性都會發生根本變化。DeepSeek愿意在技術報告里公開背書昇騰,這個動作本身就不是普通的商業合作,更像是一個方向性的表態。

下半年隨著昇騰950上量、價格進一步下探,V4的實際影響力可能才會真正顯現。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“豆包你要收費了嗎?”它這樣回復記者

“豆包你要收費了嗎?”它這樣回復記者

極目新聞
2026-05-04 19:18:27
大把過路費賺到手!巴拿馬立馬對中國換了態度,嚴查中方過境人員

大把過路費賺到手!巴拿馬立馬對中國換了態度,嚴查中方過境人員

小曙說娛
2026-05-04 02:23:16
官宣!蛇吞象!3800 億!強買 eBay!

官宣!蛇吞象!3800 億!強買 eBay!

云頭條
2026-05-04 16:09:36
印前上將回憶錄曝:2020加勒萬河谷沖突印軍慘敗,震動印度政壇

印前上將回憶錄曝:2020加勒萬河谷沖突印軍慘敗,震動印度政壇

嘮叨說歷史
2026-03-20 16:18:39
如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明這兩個問題

如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明這兩個問題

心理觀察局
2026-05-04 09:23:46
英軍上將警告:若臺海開戰,英軍將同時打擊中俄,重點對付中國

英軍上將警告:若臺海開戰,英軍將同時打擊中俄,重點對付中國

花語輕吟
2026-05-04 21:36:08
艾倫最新采訪:決賽打滿4階段,吳宜澤會奪冠!回應了1局100分鐘

艾倫最新采訪:決賽打滿4階段,吳宜澤會奪冠!回應了1局100分鐘

求球不落諦
2026-05-04 14:44:56
兒子深夜生幻覺屢次性侵母親,婦女終于無法忍受,凌晨揮刀

兒子深夜生幻覺屢次性侵母親,婦女終于無法忍受,凌晨揮刀

長安一孤客
2026-04-26 13:18:18
80后家長發明“防早戀”發型,女兒面如死灰,網友都看不下去了

80后家長發明“防早戀”發型,女兒面如死灰,網友都看不下去了

妍妍教育日記
2026-04-27 09:20:13
廣東晉級八強,能淘汰北京隊嗎?聽聽粵媒京媒怎么說,一隊被看衰

廣東晉級八強,能淘汰北京隊嗎?聽聽粵媒京媒怎么說,一隊被看衰

南海浪花
2026-05-04 10:26:10
摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

草莓解說體育
2026-04-15 04:23:51
39歲前國腳現狀:定居美國踢野球,早已財富自由,有2個可愛女兒

39歲前國腳現狀:定居美國踢野球,早已財富自由,有2個可愛女兒

攬星河的筆記
2026-04-14 15:18:30
美國華裔部長駱家輝:在任時經常打壓華為,退休后回到中國撈金…

美國華裔部長駱家輝:在任時經常打壓華為,退休后回到中國撈金…

福建平子
2026-03-22 08:14:35
央視坐實!成本2元售價19800元!不少人受騙,趕緊別用了

央視坐實!成本2元售價19800元!不少人受騙,趕緊別用了

番外行
2026-03-10 08:01:42
推遲交付軍購,徹底斷絕軍援烏克蘭:歐洲已做好與美國決裂的準備

推遲交付軍購,徹底斷絕軍援烏克蘭:歐洲已做好與美國決裂的準備

鷹眼Defence
2026-05-04 18:14:12
男子五一帶朋友回家喝酒,不顧妻子隱私,當場大打出手,丟盡臉面

男子五一帶朋友回家喝酒,不顧妻子隱私,當場大打出手,丟盡臉面

天天熱點見聞
2026-05-04 06:21:57
拖了35年才上映,首日僅393萬,我感慨:票房之王也救不了港片

拖了35年才上映,首日僅393萬,我感慨:票房之王也救不了港片

靠譜電影君
2026-05-03 22:45:48
大特務毛人鳳子女現狀:長子是富士康董事長,三子是著名愛國華僑

大特務毛人鳳子女現狀:長子是富士康董事長,三子是著名愛國華僑

史之銘
2026-05-02 22:37:25
念念不忘的正規軍,腰臀比絕了!

念念不忘的正規軍,腰臀比絕了!

貴圈真亂
2026-05-04 11:39:21
暴跌60%,引來全國牙科關店潮,暴利的牙科生意真的走到了盡頭?

暴跌60%,引來全國牙科關店潮,暴利的牙科生意真的走到了盡頭?

小熊侃史
2026-01-17 07:50:11
2026-05-05 02:39:00
AIX財經 incentive-icons
AIX財經
AI新時代,財經新觀察。
47文章數 23215關注度
往期回顧 全部

科技要聞

在中國市場搞「付費訂閱」,豆包咋想的?

頭條要聞

媒體:霍爾木茲海峽一聲驚雷炸響 戰爭的引信已經點燃

頭條要聞

媒體:霍爾木茲海峽一聲驚雷炸響 戰爭的引信已經點燃

體育要聞

騎士破猛龍:加雷特·阿倫的活力

娛樂要聞

張敬軒還是站上了英皇25周年舞臺

財經要聞

魔幻的韓國股市,父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

房產
本地
藝術
手機
家居

房產要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

本地新聞

用青花瓷的方式,打開西溪濕地

藝術要聞

震驚!43歲媽媽曬女兒合影,30萬網友猜測身份!

手機要聞

小米17 Max本月發布 小米手機史上最大電池

家居要聞

靈動實用 生活藝術場

無障礙瀏覽 進入關懷版