无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek梁文鋒的大動作,黃仁勛慌了!

0
分享至


內容來源:筆記俠(Notesman)。

責編| 柒排版| 沐言

第 9561篇深度好文:4855字 | 11分鐘閱讀

商業思維

筆記君說:

最近AI圈炸鍋了,此前一直以低融資節奏、強自主可控著稱的DeepSeek,被曝出新一輪融資計劃——估值不低于100億美元,計劃募集至少3億美元。

消息一出,各種討論聲音立刻分成了兩派:

一種說,完了,連DeepSeek都頂不住AI燒錢的壓力;另一種說,AI圈要變天了,梁文鋒這是要憋個大的。

說實話,如果你只看到“缺錢”,就把梁文鋒和這件事,徹底看小了。

一、融資3億美金,

從來不是單純填窟窿

DeepSeek缺不缺短期運營的錢?

它背后是國內對沖基金巨頭幻方量化,創始人梁文鋒在量化領域深耕多年,早已實現財富自由。

2023年DeepSeek成立時,由幻方量化及創始團隊提供了充足的初始研發資金支持,核心投入全部聚焦大模型底層技術研發。

所以,顯然不缺。

過去兩年,AI大模型融資潮洶涌,數億美元的融資單一輪接一輪,唯獨DeepSeek是個異類。

那問題來了:之前一直嚴控融資節奏,現在為什么要啟動新一輪融資?

顯然,大模型之爭,不是接下來一兩年可以結束的,未來三年有可能爭出個分曉,現在進入了決戰期,或者決戰期前夜。

因此,必須算算財務賬。

第一筆,是算力的賬。

AI大模型的競賽,已經到了貼身肉搏的階段。

根據斯坦福大學2026年度AI指數報告,2025-2026年,中美頭部大模型在核心能力基準上的差距持續收窄,在多個垂直賽道已實現持平甚至反超。

但越往頂尖走,每往前追一步,邊際成本就越高。就像跑步,你從15秒跑到13秒,多練練就行;但你要從10秒跑到9秒9,每提升0.1秒,都要付出幾倍的努力和成本。

就在3月31日,OpenAI剛以8520億美元的估值完成了1220億美元的融資。 梁文鋒這次啟動融資,核心就是為長期研發儲備充足的算力彈藥。

第二筆,是人才的賬。

過去半年,DeepSeek有幾位核心研發成員陸續離職,被國內大廠挖走了。不是這些人不認同梁文鋒的技術理想,是外面給的條件,實在太有誘惑力了。

據財經媒體晚點了解,前DeepSeek研究員郭達雅近億元入職字節跳動負責大模型研發的組織Seed,但需要滿足一定條件才能拿全。

更別說,同期智譜、MiniMax這些同行紛紛上市,股價一路上漲,人家手里的期權,有了明確的市場化財富錨點。

而DeepSeek此前一直沒有進行大規模市場化融資,公司估值沒有明確的市場標尺,團隊成員手里的期權價值,也缺少清晰的參照。

這次融資,通過市場化方式給公司定了估值,本質上就是給團隊搭建了合理的長期激勵體系:我不會讓相信長期價值的人,吃虧。

二、真正的行業變量,

是國產算力生態的深度適配

很多人盯著融資的數字,卻忽略了這次事件里,最影響行業格局的一件事:

據國內多家行業媒體爆料,DeepSeek即將發布的V4模型,核心完成了對華為昇騰算力生態的深度適配,大幅降低了對英偉達生態的依賴。

這件事,也正是英偉達創始人黃仁勛在近期采訪中公開表達關注的核心原因。

過去全球絕大多數主流AI大模型,從OpenAI的GPT,到Anthropic的Claude,核心訓練與部署都深度綁定英偉達的生態:

訓練靠英偉達GPU,底層算子( 是深度學習框架與硬件之間的關鍵橋梁 ),是模型執行的最小可計算單元適配依賴英偉達的CUDA生態,相當于整個行業的核心算力命脈,很大程度上攥在老黃手里。

一旦出現供應鏈限制,整個公司的研發、訓練、推理都可能受到嚴重影響,這就是我們常說的“卡脖子”風險。

但DeepSeek這次,在主流開源大模型的國產適配這件事上,邁出了關鍵一步。

據行業爆料,V4將深度適配華為最新的昇騰芯片。

DeepSeek的工程師們花了大量時間,完成了算子層兼容、通信庫適配、訓練框架底層優化,實現了模型從英偉達CUDA生態到華為昇騰CANN架構的深度遷移。

如果V4能在昇騰芯片上跑出有競爭力的性能,它將成為國內少數實現從底層算力到模型層全棧國產適配的通用大模型之一。

要知道,華為盤古大模型從2020年立項起,就基于昇騰芯片+CANN計算架構+MindSpore框架的全棧國產生態開發,是國內最早實現完全不依賴英偉達CUDA生態的前沿大模型。

更早的悟道2.0、紫東太初等大模型,也早已實現了純國產芯片的落地部署。


而DeepSeek的核心突破,是把一款全球開發者廣泛使用的主流開源大模型,完成了對國產算力生態的深度適配,這會大幅降低整個行業對英偉達芯片的依賴。

這也是黃仁勛直言這件事“對美國來說將是一個糟糕的結果”的核心原因:一旦主流開源大模型在國產算力生態上實現了規模化落地,美國芯片在AI領域的護城河,就會被徹底打開一個缺口。

那這個讓行業高度關注的V4,到底有哪些值得期待的能力?

根據目前的行業爆料,核心有三個核心方向的升級。

1.極致的效率優化,延續花小錢辦大事的核心思路

據行業爆料信息顯示,V4將采用MoE(混合專家)架構,總參數規模達到萬億級別。

你可以把MoE混合專家架構,理解成一個分工明確的專家團隊:

遇到不同的問題,系統只會調用最擅長解決這個問題的幾位專家,而不是讓所有專家一起上,這樣就能在大幅提升模型總能力上限的同時,有效控制住單次推理的算力消耗。

2.長上下文能力的大幅突破

據行業爆料,V4引入了名為Engram的條件記憶架構,目標上下文窗口達100萬token,在內部測試中實現了較高的信息召回率。


你可能對這個數字沒概念,我給你舉個例子:100萬token的上下文窗口,相當于你可以一次性把幾十本長篇小說、整個公司的全年業務文檔全喂給它,它能精準定位到你需要的任意細節信息。

而目前全球公開商用的頭部模型中,Claude 3.7 Opus已開放200萬token上下文窗口,行業長上下文能力的競爭已進入白熱化階段。

3.代碼能力的針對性強化

V4從立項之初,就把代碼生成與長上下文代碼推理作為核心優化目標。

據內部測試爆料,V4在SWE-bench、HumanEval等行業通用代碼能力基準上的表現,已接近甚至部分追平全球頭部模型,核心優化方向是整個代碼倉庫級別的復雜bug修復、長鏈路代碼推理。

三、DeepSeek除了贏在技術,

其實它還贏在獨特的組織邏輯

為什么DeepSeek能在短短幾年里,從一眾大模型公司里殺出重圍,成為全球開發者都關注的標桿?

很多人會說,因為梁文鋒是天才,因為他們技術牛。但我告訴你,技術只是最終的結果,真正讓它能站穩腳跟的,是它3個和行業主流打法完全不同的組織邏輯。

第一個反常識:全球最卷的AI行業,它靠“拒絕無效加班”守住了研發效率

現在AI行業卷成什么樣,你應該有所耳聞。

全球頂尖的AI公司,從OpenAI到谷歌,再到國內的大廠,核心研發人員一周工作70-80小時是常態,996只能算基礎配置,甚至007連軸轉,咖啡當水喝、睡在公司都是家常便飯。

但DeepSeek,卻在這個卷到極致的行業里,保持了相對寬松的工作節奏。

它不強制打卡,不推行996,沒有所謂的“奮斗者協議”,平日里公司的多數員工,下午6-7點就可以準時收拾東西離開公司。

甚至,公司還給員工免費提供下班后的球類課程,運動場地可以報銷,明著鼓勵大家下班別耗在公司,多去運動、多休息。

核心管理團隊有一個共識: 一個人一天能高質量輸出的時間,很難超過6-8小時。

DeepSeek用結果證明了:真正的創新,從來不是靠熬時間熬出來的,是靠高質量的專注堆出來的。

第二個反常識:不搞繁瑣層級,它用極致扁平化干掉了內耗

很多人都好奇,據DeepSeek2025年公開采訪披露,其團隊規模超300人,其中核心研發團隊超200人,怎么能干出大廠幾千人都未必能做好的成果?

核心就在于,它保持了極致扁平化的組織架構,最大程度干掉了溝通內耗。

DeepSeek的核心研發團隊,采用了弱層級、強協同的管理模式,沒有大廠常見的層層匯報的繁瑣流程,也沒有涇渭分明的部門墻。

做基礎模型的團隊、做底層基建的團隊、做數據的團隊,不是各干各的,而是交叉分工、深度協同——模型還在定版階段,三個團隊就全鏈路參與進來了,徹底避免了大廠里常見的“內部乙方”的低效內耗。

更難得的是,它沒有僵化的分工限制,沒有強制的年度計劃,給了研發人員極高的創新自由度。

一個新方向的啟動,往往就是三五個人湊在一起,覺得一個技術方向有價值,就可以組隊開干;如果這個idea跑出了潛力,公司就會自上而下調配資源,全力支持。

所有的精力、所有的資源,全都砸在了技術創新本身。這就是它最核心的競爭力:用極致扁平的組織,把創新的效率,拉到了最高。

第三個反常識:不唯“大廠經驗論”,它給了年輕人足夠的創新空間

DeepSeek的人才體系,走了一條不一樣的路:它既不排斥資深專家,也給了年輕人足夠的成長和創新空間。

一方面,它通過社招引入了大量擁有數十年行業經驗的資深專家,包括首席科學家劉群、CTO林通等核心管理團隊成員,均擁有深厚的行業積累,官方招聘頁面也長期開放大量要求3-10年行業經驗的社招崗位,絕非外界傳言的“幾乎不社招”。

但另一方面,它也通過校招吸納了大量頂尖院校的年輕研發人才,核心研發團隊里,有大量本科、碩士學歷的年輕從業者,他們沒有被固化思維束縛,敢想敢干,反而做出了很多原創性的技術突破。

梁文鋒的人才觀,特別值得所有創業者學習: 創新需要的,是不知天高地厚的探索精神。

AI是一個全新的行業,沒有成熟的路徑可走,沒有固定的經驗可復用。這些年輕人,沒有包袱,沒有固化的思維,反而能在無人區里,走出一條新的路。

四、梁文鋒的底牌,

是穿透本質的認知

我給你拆解三個最核心的認知,也是他所有決策的底層邏輯,不管你是創業者還是管理者,都能用得上。

第一,第一性原理:所有的創新,都始于對本質的追問

梁文鋒團隊從一開始,就抓住了最核心的本質:他們認為,語言是通用智能的核心載體,因此在成立初期,就把核心資源聚焦于語言大模型的底層突破,沒有盲目跟風分散精力。

但同時,他們也并未放棄多模態賽道的布局,已于2025年3月官方發布了DeepSeek-VL2多模態大模型,實現了圖文理解、視覺問答等多模態能力的落地,做到了“核心聚焦,多點布局”。

還有他一直堅持的“效率優先”,本質也是第一性原理的應用。

他沒有跟著行業堆算力、堆參數,而是死磕模型效率優化,用遠低于行業頭部玩家的投入,做出了全球開發者都認可的頂尖模型。

這就是第一性原理的力量:

不跟著別人的規則卷,回到事物的本質,重新制定游戲規則。

你跟著別人的跑道跑,永遠只能拿第二;只有你自己開一條新跑道,你才有可能成為領跑者。

第二,長期主義:拒絕短期誘惑,才能拿到長期的最大回報

他之前嚴控融資節奏,是長期主義:他想保持DeepSeek的獨立性,不被短期商業變現的壓力干擾,能安安心心做長期的、看不到短期回報的原創研究,不用為了短期財報,去做不符合長期目標的事。

他現在選擇啟動新一輪融資,依然是長期主義。

他看清了行業終局,AI競賽已經到了生死關頭,想要實現通用人工智能的底層突破,想要打造自主可控的AI技術生態,必須要有充足的彈藥儲備,必須要給團隊搭建合理的長期激勵體系,才能打贏這場長期的硬仗。

真正的長期主義,是目標不變,路徑隨時調整。

第三,終局思維:你能走多遠,取決于你眼里的終局是什么

梁文鋒眼里的終局,從來不是做一家短期賺錢的上市公司,而是兩個核心目標:

第一,實現通用人工智能的底層技術突破,做出真正有原創性的技術成果;

第二,打造自主可控的AI技術生態,徹底擺脫核心技術被卡脖子的困境,讓中國AI有自己的根。

為什么他堅持開源?因為只有開源,才能建立起繁榮的開發者生態,才能讓更多人參與到AI技術的創新中來,實現真正的技術普惠;

為什么他死磕國產芯片適配?因為只有把根扎在國產硬件上,才不會被人卡脖子,才能真正實現全鏈路的自主可控;

為什么他愿意投入長期看不到回報的原創研究?因為只有原創,才能真正實現技術突圍,跟著別人的路走,永遠只能當老二。

當然,我們也要客觀地說,DeepSeek能取得今天的行業地位,核心離不開創始團隊在高性能計算、AI算法領域的多年積累,幻方量化多年沉淀的算力基建與工程化能力,以及巨額的研發投入,而獨特的組織管理模式,則為技術創新提供了良好的土壤,二者缺一不可。

結語

這個時代,從來都不缺聰明的跟風者,缺的是敢走無人區、敢啃硬骨頭、敢堅持長期主義的理想主義者。

中國科技的突圍,從來不是靠一個天才,而是靠一群愿意沉下心來,做底層 創新、做長期研究的人。

梁文鋒是我們眼中的第五代企業家佼佼者。

第五代企業家具備AI化、全球化、數智化、新興產業化的典型特征。

為此,我們專門為這類新生代企業家創立了筆記俠PPE(政經哲)書院,為了把握AI時代和未來3年的決策底牌,穿越周期。

筆記俠PPE課程26級招生即將截止,5月16日開課,現僅剩最后7個名額。


好文閱讀推薦:

“子彈筆記”是筆記俠的矩陣公眾號,聚焦職場效率追求、人際關系與高潛成長者,幫你3分鐘吃透核心觀點和方法論。歡迎關注~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
邁克-布朗:現場球迷的能量對我們的逆轉起到了很大的作用

邁克-布朗:現場球迷的能量對我們的逆轉起到了很大的作用

北青網-北京青年報
2026-06-11 19:51:11
實探北京新發地批發市場,單個鴨腿批發價約2.5元,比冷凍鵝腿便宜了5倍多

實探北京新發地批發市場,單個鴨腿批發價約2.5元,比冷凍鵝腿便宜了5倍多

界面新聞
2026-06-11 12:33:15
賴昌星不再隱瞞,被捕后曝出與董文華的關系,難怪老藝術家會退圈

賴昌星不再隱瞞,被捕后曝出與董文華的關系,難怪老藝術家會退圈

小彭談歷史
2024-10-22 13:10:55
美批準向韓出口2.9億美元導彈,上月剛批準超40億美元對韓軍售

美批準向韓出口2.9億美元導彈,上月剛批準超40億美元對韓軍售

澎湃新聞
2026-06-11 16:30:27
豐巢回應“取件得先看廣告”

豐巢回應“取件得先看廣告”

南方都市報
2026-06-11 09:35:31
謝杏芳曬西班牙生活,10歲小羽別墅內摘韭菜,林丹不在依舊很開心

謝杏芳曬西班牙生活,10歲小羽別墅內摘韭菜,林丹不在依舊很開心

往史過眼云煙
2026-06-10 17:00:10
美女總理拍半裸寫真引眾怒,身材苗條顏值驚艷,愛逛夜店跳熱舞

美女總理拍半裸寫真引眾怒,身材苗條顏值驚艷,愛逛夜店跳熱舞

聞識
2026-06-07 07:42:43
孫千本能躲進張凌赫懷里!190cm紳士臂護頭,安全距離全網吵翻了

孫千本能躲進張凌赫懷里!190cm紳士臂護頭,安全距離全網吵翻了

喜歡歷史的阿繁
2026-06-11 11:52:44
越來越多人存錢避開郵儲銀行?并非偏見,內行人道出3個關鍵問題

越來越多人存錢避開郵儲銀行?并非偏見,內行人道出3個關鍵問題

老特有話說
2026-06-11 16:08:06
72小時內,歐美都動了,他們終于發現:中國絕不是“大版俄羅斯”

72小時內,歐美都動了,他們終于發現:中國絕不是“大版俄羅斯”

丁丁鯉史紀
2026-06-11 17:49:42
高圓圓帶女兒逛博物館!穿同款長裙逛兩座城市,女兒眼睛小很普通

高圓圓帶女兒逛博物館!穿同款長裙逛兩座城市,女兒眼睛小很普通

阿紿聊社會
2026-06-09 16:47:18
“高考后不讓女兒染頭,她把家砸了”,失業母親哭訴,卻無人理解

“高考后不讓女兒染頭,她把家砸了”,失業母親哭訴,卻無人理解

澤澤先生
2026-06-11 19:25:45
女生夏天學車教練索要200元空調費,駕校確認收費但價格是100元,不想交可夏天過了再來練車,官方回應

女生夏天學車教練索要200元空調費,駕校確認收費但價格是100元,不想交可夏天過了再來練車,官方回應

極目新聞
2026-06-11 17:29:57
總價1.21億鎊創紀錄!曼城第2次報價23歲英格蘭國腳 或成英超標王

總價1.21億鎊創紀錄!曼城第2次報價23歲英格蘭國腳 或成英超標王

我愛英超
2026-06-11 06:48:46
蔣宋孔陳的后人現狀:蔣家多數遠離政壇,陳家孫輩皆成棟梁

蔣宋孔陳的后人現狀:蔣家多數遠離政壇,陳家孫輩皆成棟梁

野蠻不失女人心
2024-10-05 10:07:55
歐文點評穆帥即將回歸皇馬

歐文點評穆帥即將回歸皇馬

體壇周報
2026-06-11 19:32:10
法國海軍:在南海遭遇40艘中國軍艦,法軍的龐大力量使中國冷靜

法國海軍:在南海遭遇40艘中國軍艦,法軍的龐大力量使中國冷靜

一曲一場談
2026-06-10 23:03:21
海南龍鳳胎日夜啼哭,醫院查不出病因,保姆查看監控后發現真相

海南龍鳳胎日夜啼哭,醫院查不出病因,保姆查看監控后發現真相

懸案解密檔案
2025-05-19 14:35:42
小舅子結婚岳母讓我隨16萬,我正要轉賬,妻子密語:轉1600就行

小舅子結婚岳母讓我隨16萬,我正要轉賬,妻子密語:轉1600就行

熱心市民小黃
2026-06-10 14:49:46
八段錦這場“騙局”,到底忽悠了多少中國女人

八段錦這場“騙局”,到底忽悠了多少中國女人

七叔東山再起
2026-06-10 20:23:25
2026-06-11 20:24:49
筆記俠 incentive-icons
筆記俠
互聯網最前沿的創業筆記
10136文章數 77680關注度
往期回顧 全部

財經要聞

干細胞生意:17萬一針的希望

頭條要聞

天津港進口豪華車"崩盤" 曾有礦老板提著百萬現金買車

頭條要聞

天津港進口豪華車"崩盤" 曾有礦老板提著百萬現金買車

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

汽車要聞

奔馳C350L純電長軸距版申報信息曝光 雙電機 軸距超3米

態度原創

時尚
藝術
手機
數碼
游戲

畢業季,為林徽因正名的年輕女孩們

藝術要聞

東漢隸書出土!遠比學習“唐楷”靠譜

手機要聞

機圈德芙!OPPO ColorOS 17八月內測:基于安卓17深度定制

數碼要聞

惠普HyperX暗影精靈PRO新增“U7 251HX + RTX5060”,12999元

《戰爭機器:事變日》首次引入跳躍 戰役超14小時

無障礙瀏覽 進入關懷版