文 | kiki
DeepSeek正在告別過去那個低調的自己。
MiniMax創始人閆俊杰曾講過一個關于DeepSeek創始人梁文鋒的故事。他說有一次約梁文鋒吃飯,當時雙方并未見過面。閆俊杰到早了看到一位穿T恤的小哥,對方和他聊了半小時的技術,直到閆俊杰開口問:“梁總什么時候來?”
這個他心目中是助理的T恤小哥,回了一句:“我就是梁文鋒”。
這個故事里,閆俊杰認為梁文鋒是一個低調專注的人,這和過去DeepSeek對外展現的形象一致:不融資、不pr,保持自身的獨立性。在大廠、MiniMax等模型創業公司的兩股力量外,DeepSeek走出一條特立獨行的路。
![]()
極客公園創始人張鵬形容此類公司的特點:“較高的利潤率、可觀的利潤規模、有砸幾十億美元的投入決心,以及創始人自己對大模型領域足夠深的投入,在技術決心和業務決定上的極度篤定。”
但現在,DeepSeek似乎變了。
從被曝出推進700億人民幣的融資,到公開組建Code Harness團隊,再到一向神秘的DeepSeek研究員們也開始在小紅書活躍......最新的動作是,DeepSeek官宣其原定于5月底結束的DeepSeek-V4-Pro模型API價格的折扣永久化。
從模型降價的老招式,到一改往日低調的高調融資、招兵買馬,梁文鋒真正想做的,是送給DeepSeek一個真正的成人禮。
1、一改低調的DeepSeek
DeepSeek正在變得越來越高調。
自4月DeepSeek-V4 發布、傳出融資需求后,「硅基研究室」觀察到,DeepSeek正在產品應用、模型能力以及人才組建上多箭齊發。
首先是,產品應用側全力瞄準Agent。
DeepSeek正在北京組建Code Harness團隊,據DeepSeek研究員陳德里的描述,DeepSeek的Agent業務目前主要聚焦AI Coding方向,旨在打造DeepSeek桌面端Agent產品。“或許你可以把它叫做 DeepSeek Code 或者其他什么名字”。
短期將Agent的主戰場定位Coding領域,而非通用型Agent,這并非是DeepSeek的特立獨行,而是當下大模型公司的共識。
一方面,Coding是模型心智和模型能力的加速器。
OpenAI借Codex的密集更新,迎來口碑翻轉。另一邊的Anthropic則是因為較早押注Coding 方向, 憑借Claude Opus系列編程模型和編程應用Claude Code反超OpenAI。
Coding場景也能給模型的能力帶來先發優勢。內生的思維鏈讓模型可自發完成推理與思考過程,Coding自身可驗證性強,用戶數據可以反哺模型訓練,實現能力提升。
據東方證券數據,Anthropic在今年2月至3月底,一個多月內迭代了30多項Harness層功能,因此更早拿到正向反饋,同時借其他AI Coding產品作為分發渠道,自身Claude Opus系列模型深度集成進IDE,作為分發渠道,使Anthropic積累到大量數據,來用于模型能力提升。
另一方面,Coding能更好地賣Token。
國內阿里、騰訊、字節等大廠,也聚焦基模的Coding能力和獨立的Coding工具建立自身的Token經濟閉環。
阿里云公共云事業部總裁劉偉光此前就談到:“Coding產生Agent,Agent產生AI應用,Agent又回到云上消耗算力。”這構成了做大Token經濟從「token-云-應用」的循環。
海外的大模型公司已經看到了Coding帶來的收入曲線。據Anthropic今年2月的融資公告,Claude Code年化收入已超25億美元,較2026年1月翻了一倍多。
其次,在模型能力上,用成本優勢換模型能力升級的時間窗口。
SemiAnalysis的研究曾指出,DeepSeek的技術迭代不僅關注智能水平,而是致力于極大提升「每單位Token的成本效率」,這也是其為什么被稱為「價格屠夫」的原因所在。
DeepSeek最新的動作是官宣其原定于5月底結束的DeepSeek-V4-Pro模型API價格的折扣永久化。
按百萬 tokens算,Pro 的緩存命中輸入是 0.025 元,緩存未命中輸入是 3 元,輸出是 6 元,原來的價格分別為 0.1 元、12 元、24 元,在國內模型普遍漲價的背景下,梁文鋒再度給了友商重擊。
![]()
X上的一位用戶這樣評價:“當你整天使用DeepSeek ,花費僅相當于一包薯片的價格時,你才會意識到它有多便宜。”
一位大模型行業人士告訴「硅基研究室」,DeepSeek此舉是在用成本為自身Coding Agent建生態。“這個動作主要會對國內模型廠商產生影響,因為大家模型性能的代際差距并不大,GLM、kimi的編程能力不錯,MiniMax強在多模態,一旦DeepSeek用‘最佳價格’,再加速模型迭代,各家間的差距會迅速縮短。”
最后,則是招兵買馬。
包括郭達雅等多位研究員離職后,DeepSeek開始快速招兵買馬。以Harness團隊為例,DeepSeek引入了「量化交易老兵」、TSY Capital聯合創始人崔添翼。DeepSeek研究員陳德里近期也在小紅書上高頻活躍,在社交媒體上發起「英雄帖」。
![]()
有大模型獵頭告訴「硅基研究室」:“今年DeepSeek的hc確實在變多,但要求和門檻并不低。”
「硅基研究室」還觀察到,除Agent崗位外,DeepSeek在招聘中釋放出測試開發工程師、預/后訓練研究員、模型策略產品經理等多個崗位,甚至還招起了HR、企業文化主管等非技術崗位,這都意味著,DeepSeek正朝著一個更大的組織擴張。
2、梁文鋒給DeepSeek的價格建模
梁文鋒曾給DeepSeek立下規矩:不接受外部融資、不稀釋股權、不被任何人的商業化時間表綁架。
「三不」源自DeepSeek的特立獨行——
背靠幻方量化輸血,極致的成本控制,所以不缺錢;沒有二把手,相對小且扁平獨立的研究性團隊,所以不會愿意稀釋股權;梁文鋒本人以AGI為追求,專注極致的策略,所以不會被任何人的商業化時間表綁架。
但為什么在當下,梁文鋒會一改往日低調態度?原因是,大模型競爭已走過了青春期。
智譜和MiniMax已經上市,kimi和階躍星辰也從未停止IPO計劃,今天的大模型競爭也已不再是單一的模型能力競爭,而是人才、產品、生態等系統化能力的比拼。
強模型依然是核心武器,前者DeepSeek固然可以通過小而美的組織形態和極致來實現,梁文鋒可以力出一孔不畏外界的噪音,但后者,卻是他最難以控制的地方,人才、產品、生態以及商業化,它難以只通過模型這一張牌去獲得。
當其他獨角獸都走過了成人禮,梁文鋒也意識到,是時候給DeepSeek一個成人禮了。
首先,要重新給DeepSeek找一個心智定位。「最強模型」「價格屠夫」都是過去時,DeepSeek通過開放融資,吸引外部資本,是在強化自己的一個新戰略定位:
國產AI基礎設施中的核心節點。
DeepSeek被傳的潛在投資方里,同時多方身影:包括國家大基金、寧德時代、京東、騰訊、Monolith等,一位AI投資人告訴「硅基研究室」:“投資DeepSeek戰略價值高于實際財務回報”。
他口中的戰略價值源自兩個方面:一是DeepSeek的開源路線帶動了早期國產AI生態鏈的形成:包括AI Infra公司硅基流動、無問芯穹、清程極智等,應用層的端側手機廠商以及一批B、C端AI應用。
二是DeepSeek是適配國產算力最堅決、最積極的。晚點曾提到,除了追求大模型的智能上限外,梁文鋒認為很重要的一項工作就是基于國產生態來做大模型。
DeepSeek 在V3.1 的技術報告里曾提到采用的 UE8M0 FP8「是針對下一代國產芯片設計」,在V4技術報告里,DeepSeek 在華為昇騰芯片上驗證了細粒度并行 EP 方案的技術可行性。
V4發布當天,8家國產AI芯片都宣布與V4完成適配,這說明,DeepSeek在原生支持國產芯片如重寫算子等方面花了較大的精力和時間。
同時DeepSeek對國產算力的工程化適配本身也契合國產芯片異構協同的技術方向。
不難發現,DeepSeek的角色已發生變化,從純模型公司轉化為國產AI基礎設施中的核心節點。
其次,要重新給DeepSeek找個「超級入口」。
在《DeepSeek“朋友圈”的B面:搶入口、爭流量,開打算力戰》一文中,資深芯片專家、中存算董事長陳巍曾告訴「硅基研究室」,DeepSeek所帶來的改變是,讓更多人知道了:“大模型也可以成為一個超越互聯網、甚至超越原先這些操作系統的超級流量入口。”
![]()
但一年過去,超級流量入口的競爭已上升為超級入口的競爭。
阿里的千問、字節的豆包都在嘗試進化為新的超級入口,這些AI應用的相似野心是,試圖用一個入口包攬用戶所有的使用場景。
今年618前夕,阿里宣布千問和淘寶完成深度整合,豆包也開始嘗試付費分級,它們在超級入口的探索中都不可避免地遇到挑戰。
DeepSeek和它們都不一樣,它既沒有字節的APP工廠,也沒有阿里的多板塊協同,它的C端入口當前只有一個,而且為chatbot。
因此梁文鋒必須重造一個超級入口,它瞄準的也是Agent。從目前披露的信息看,DeepSeek應該會雙管齊下:
第一,C端原有的入口會注重多模態能力和情感陪伴能力的升級。
此前DeepSeek灰測識圖功能,預告了多模態能力的進展。
![]()
「硅基研究室」還了解到DeepSeek-V4 強化了角色扮演能力,官方還上線了角色扮演的特殊控制指令說明,用于在思考模式下切換思維鏈風格。
5月,DeepSeek研究員陳德里在社交媒體上公開對角色扮演能力和情感陪伴能力進行了用戶調研。
![]()
第二,聚焦Coding Agent,也就是DeepSeek組建的Agent Harness團隊,可能會推出一款桌面級Coding Agent產品。
在招聘中,他們要求候選人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等產品。
最后,則是給DeepSeek的人才組織找一個新的市場定價。
不可否認的是,今天DeepSeek研究員已成為巨頭爭搶的對象,梁文鋒不可避免地也需要回答,今天的大模型世界里,DeepSeek到底值多少錢?員工手中的期權價值幾何?
除此以外,在token成為新的薪酬標配下,和大廠相比,DeepSeek的算力卻是相對有限,梁文鋒也必須要有更多的算力和未來的想象力,來留住人心。
心智定位、超級入口和人才定價,這些都在倒逼梁文鋒改變了想法。
梁文鋒曾說:“每當在工作中遇到困難的時候,我會想起量化之王的話:‘一定有辦法對價格建模。’”他口中的西蒙是“量化之王”。
![]()
現在,到了市場對DeepSeek定價的時刻,梁文鋒依舊是那個主導價格建模的人,這一點,依然未變。
*封面圖由AI生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.