網易首頁 > 網易號 > 正文 申請入駐

32歲,全球第一開源模型掌舵人,說了聲bye就走了

0
分享至

3月2日,阿里千問發布了Qwen3.5小尺寸模型系列。馬斯克在X上點了贊,評價說「令人驚嘆的智能密度」。

林俊旸感謝了馬斯克的關注。


第二天下午,他向阿里提交了辭職申請。

3月4日凌晨,他發了一條推文:

"me stepping down. bye my beloved qwen."


24小時。從全球矚目到轉身離場。

一個語言學學生的意外路線

其實在所有標簽里面,我覺得最有意思的一個,大多數報道反而沒怎么展開。

林俊旸是北大計算機本科,這沒什么稀奇。但他的碩士,讀的是語言學——正兒八經的外國語學院語言學與應用語言學,不是CS方向的NLP。

一個學語言學的人,后來成了全球使用量最大的開源大語言模型的技術負責人。

這個路徑倒過來想就很有趣了。大語言模型的本質是什么?是對人類語言的建模。絕大多數做LLM的人從計算機科學出發,先懂算法再學語言規律。林俊旸反過來——他同時理解語言本身的結構,又有計算機的工程能力。

2020年GPT-3發布后,阿里達摩院內部調兵遣將。恰恰是因為他這個「語言學+技術」的復合背景,被分配到了周靖人領導的智能計算實驗室,成為M6模型團隊的核心開發者。

這個分配決定了后面所有的事情。

93年出生,2019年碩士畢業直接進阿里達摩院。沒有讀博,沒有海外經歷,純粹的本土培養路線。然后一路狂飆——M6(共同一作)、OFA(One-For-All)、Chinese CLIP,在多模態預訓練領域都是里程碑式的工作。Google Scholar被引量超過4萬次。

2022年底,達摩院AI團隊并入阿里云成立通義實驗室,林俊旸被任命為通義千問的技術負責人。

那年他29歲,成了阿里巴巴最年輕的P10級技術專家。阿里的技術體系里,很多工程師干了十幾年也到不了P10。他用了3年。

去年的AGI-Next峰會上,他和楊植麟、姚順雨、唐杰同臺,被媒體稱為「基模四強」。四個人代表了中國基礎大模型的主要力量。那個場景現在回看,多少有些唏噓。


全球第一,但全球第一的另一面

從2022年底接手到2026年初離開,林俊旸帶著千問走了大概3年。

這3年的成績單,數字說得比人清楚:在HuggingFace上,Qwen的衍生模型數量突破了20萬個,總下載量超過3億次,超越了Meta的Llama,成為全球被使用最多的開源模型。旗艦版Qwen3-Max超萬億參數,在多個權威評測中躋身全球前三,和GPT-5、Claude掰手腕。


注意,這里說的「全球第一」是指生態第一。全世界最多人下載、最多團隊基于它做二次開發的開源模型。某種意義上,這個「第一」的含金量比跑分更高。

而且產品側也終于打起來了。千問APP在2026年初經歷了爆發式增長。1月月活突破1億,春節期間DAU峰值飆到7352萬,到2月月活已經達到2.03億,增速552%全球第一,總量排全球第三。

我去年11月寫過一篇「橫掃硅谷的千問,殺回國內了」,當時Airbnb的CEO說他們大量依賴千問模型,「比OpenAI更好更便宜」。一個中國團隊做的開源模型,被硅谷公司當核心基礎設施在用。

但如果你從2024年一直跟到現在,會發現「全球第一」這個頭銜,其實藏著一些微妙的東西。

2024年的時候,Qwen確實是開源世界的領頭羊,沒什么爭議。但2025年DeepSeek爆發之后,整個格局變了。Kimi K2開源了,GLM-5開源了,MiniMax M2.5也開源了。開源不再是Qwen的獨家優勢,國內大模型的競爭格局變成了「一超三強」——DeepSeek一騎絕塵,Qwen、GLM、Kimi各有強項。

Qwen的位置變得有點微妙。它依然是全球下載量最大的開源模型,衍生模型數量也是全球第一。很多團隊拿Qwen當基座來做進一步訓練——Cursor的Composer模型被發現思考過程會輸出中文,有國產模型微調的痕跡;DeepSeek-R1也有基于Qwen的蒸餾版本。

某種意義上,Qwen成了AI世界的「Android」——底層無處不在,但品牌感知反而不那么強烈。

在具體賽道上也是這樣。Qwen采取的是「飽和式發布」策略——各種尺寸、各種模態不斷往外放,從0.6B到235B,從文本到視覺到語音,全覆蓋。開發者生態的優勢確實大,但也給人一種什么都做、什么都不夠極致的感覺。AI Coding領域Kimi K2的聲量更大,多模態世界模型方向Gemini 3系列走得更遠。Qwen什么都有,但沒有一個賽道是讓人第一時間聯想到它的。


產品側的問題更明顯。模型叫Qwen,產品叫通義,C端APP又叫通義千問——三個名字指向同一個東西但側重不同,品牌認知一直是割裂的。直到2025年11月APP才改名「千問」,而阿里正式把所有AI品牌統一為「千問」,是2026年3月2日的事——對,就是林俊旸提辭職的前一天。

開發者生態和消費者市場之間的鴻溝,千問一直沒有完全填上。APP月活突破2億是這個春節靠30億補貼砸出來的,留存率還是個問號。晚點小數據做過一張春節期間AI應用對比圖,很能說明問題:千問DAU在2月6日開始砸30億補貼后沖到高點,但不發紅包的DeepSeek反而用戶黏性最強——日均使用時長16分鐘,遠超其他三家。補貼能買來用戶,但買不來習慣。


Qwen在開發者圈子里的口碑確實好,但把模型優勢轉化成產品優勢,阿里走了很長一段彎路。

這種「模型很強但產品化一直差口氣」的狀態,可能是理解后面發生的事情的一個入口。

「團隊沒有跑路,我們還在」

在所有報道里,我翻到一個細節,挺能說明林俊旸是什么樣的人。

之前千問的代碼倉庫因為GitHub的標注問題被誤下架,網上一片恐慌,各種猜測滿天飛。林俊旸直接出來回應:「團隊沒有跑路,我們還在。」

就這么一句話,沒有官方聲明模板,沒有公關辭令,直接把事情說清楚了。

他的管理理念也挺有意思。他說過,做負責人「ego要小」——不要覺得自己無敵、能把所有事情做完。每個小團隊負責人最重要的事就是「招比自己更強的人」,如果做不到這一點,「是很失敗的」。

在AGI峰會上,當其他人聊模型能力的時候,他更關注客觀限制:「美國的算力可能整體比我們大1到2個數量級。」他說國內企業的算力主要用于交付,而美國公司在用算力做下一代的研究。這不是一個喜歡報喜不報憂的人。

他團隊里有很多00后。他說過,隨著這代年輕人進來,中國AI領域的冒險精神在增強。

這些細節拼在一起,你大概能感覺到這是一個什么樣的人——技術出身、性格直接、不太講客套、更信邏輯而不是關系。這種人適合從0到1地搭東西,但未必適合在復雜的組織架構里做政治博弈。

不是他自己的選擇

如果只看成績單,你很難理解林俊旸為什么要走。

千問剛發了新模型,馬斯克剛點了贊,全球第一的位置還坐著——按正常劇本,應該慶功、加薪、繼續沖。

但千問的核心貢獻者Chen Cheng在X上說了一句話:「離開似乎不是林俊旸自己的選擇。」


似乎不是自己的選擇。這句話的分量比什么分析都重。據晚點LatePost報道,有Qwen同事得知他將離職的消息后難掩情緒,「傷心地哭了」。

背后的直接原因,是通義實驗室正在進行的一場組織調整。

簡單說,阿里打算把Qwen團隊從「垂直整合」改成「水平分工」。原來的千問團隊是一個統一體,從預訓練到后訓練,從文本到多模態,一個團隊端到端負責。現在要拆——預訓練一個組,后訓練一個組,文本一個組,多模態一個組。

林俊旸的管理范圍,被縮小了。

這種拆法和他的技術理念直接沖突。他多次公開表達過,預訓練、后訓練和Infra團隊應該「更緊密地結合和溝通」,而不是拆開各自為戰。做大模型,他認為廚師得全程把控——從選材到烹飪到擺盤。公司覺得不行,選材的歸選材,烹飪的歸烹飪,流水線效率更高。

與此同時,阿里從外部引入了前DeepMind高級資深研究員周浩來接替后訓練負責人的位置。據晚點報道,周浩是Gemini 3.0、DeepResearch等項目的關鍵貢獻者,曾領導針對Gemini 3.0的多步驟強化學習——這恰恰是千問當前最需要補強的方向。一個從零搭建團隊的人,看著外來的人帶著更前沿的方法論接管自己搭建的東西——這種感受不難想象。

V2EX上有人說得挺扎心:「業務發展期強行提的P10,業務穩定后就守不住位置了。」

這話聽著刺耳,但確實點到了一個結構性的問題。大廠在「攻城」階段和「守城」階段需要的人是不一樣的。攻城的人被推到最高位,守城的時候就容易成為被優化的對象。不是能力不行,是公司進入了不同的階段。

而且林俊旸不是一個人走的。同一天,后訓練負責人郁博文也正式離職。Qwen Code負責人惠彬原早在1月就離開了,去了Meta。核心貢獻者Kaixin Li發文告別。Binyuan Hui也跟著說了句「bye qwen, me too」。

不是一個人的離開,是一群人的散場。

一代人的命運

把視角拉遠一點看,這不是千問一個團隊的故事。

字節跳動的Seed團隊,2025年走了7個研究骨干。喬思遠去了Meta,姜璐去了Apple,馮佳時成了騰訊多模態團隊的負責人。智譜AI半年內4名高管離職,包括副總裁和首席戰略官。阿里通義實驗室自己的NLP負責人、視覺負責人、語音負責人,也都先后離開了。

這一波人有個共同特征:大多是2019到2022年間加入公司的,趕上了大模型從零起步的黃金期。他們是親手搭地基的人。

林俊旸、郁博文、惠彬原——還有個更具體的共同點:都是應屆畢業直接進的阿里。據晚點報道,林俊旸2019年北大碩士畢業,郁博文2022年中科院博士畢業、當年的「阿里星」,99年出生的惠彬原2022年天津大學碩士畢業。三個人從零開始搭建,一路做到核心。不是空降的高管,不是挖來的大佬,是阿里自己培養出來的。

然后,阿里自己做了一輪組織調整,這批人就散了。

這不是誰對誰錯的問題。大模型賽道從「技術敘事」進入了「商業化」階段。公司開始算ROI了,開始問「開源到底能賺多少錢」了。千問的APP雖然春節期間靠補貼沖到了2億月活,但開源模型本身幾乎不產生授權收入,品牌認知也是剛剛才理順。公司自然會想:是不是該換個打法了?

我之前寫Dario Amodei那篇文章時說過一句話:「當信仰和生意完美對齊的時候,你無法分辨一個人到底是在堅持原則,還是在做精明的品牌定位。」放到這里也一樣——當技術理想和公司戰略對齊的時候,一切和諧美好。一旦出現分歧,走人往往是唯一的選項。

區別在于,AI行業的人才不愁去處。據晚點報道,在這次變動之前,已有多位投資人和大公司在接觸林俊旸,有人期待他創業,有人給出工作offer。

所以「bye my beloved qwen」這句話,讀起來有一種復雜的味道。不是悲情。更像是一個建造者對自己作品的告別——你傾注了3年心血做出的東西還在,還會繼續跑,全球第一的位置大概率能保持一陣子。但你已經不是開它的人了。

留下的問題

千問不會因此垮掉。模型在那里,代碼在那里,20萬個衍生模型在全世界的服務器上跑著。3800億砸下去,總會有新的人補上來。

但有些東西確實不一樣了。

去年他們花了將近一年時間攻克Qwen3的三個核心難題:讓強化學習框架穩定支撐長時序推理、平衡跨領域數據分布、強化多語言能力。這種過程靠的不是組織架構圖上的匯報線,而是一群人真的相信同一件事。

現在這群人散了。千問可能在新的架構下反而跑得更快。水平分工在規模化階段有它的道理。建造者和維護者本來就是兩種角色,沒有高下之分。

而林俊旸他們帶走的東西——經驗、直覺、踩過的坑——不管去了哪兒,都會繼續發揮作用。人散了,能力不會消失,只是換了個地方生長。

32歲,全球第一,說走就走。

在AI這個行業里,也許這就是某種正常。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
找到了!伊朗真正的內鬼,根本不是人!中國也要小心

找到了!伊朗真正的內鬼,根本不是人!中國也要小心

像詩一樣的姑娘
2026-04-24 10:23:00
廣東一名女子在洗車的時候,在備胎槽里竟然發現一個蘋果的定位器

廣東一名女子在洗車的時候,在備胎槽里竟然發現一個蘋果的定位器

周哥一影視
2026-04-24 03:45:19
4月23日大消息!國務院點名3行業,馬上要起飛了

4月23日大消息!國務院點名3行業,馬上要起飛了

生活新鮮市
2026-04-24 07:38:49
“千山翠”再現,比亞迪旗艦大唐重磅發布,第三代元PLUS全面升級

“千山翠”再現,比亞迪旗艦大唐重磅發布,第三代元PLUS全面升級

光電科技君
2026-04-24 08:11:06
英國王室久違拍“全家福”,緬懷已故女王,卡米拉的站姿又亮了

英國王室久違拍“全家福”,緬懷已故女王,卡米拉的站姿又亮了

照見古今
2026-04-23 18:11:45
安徽一女子同房后黃體破裂休克,送醫發現失血兩升!這事有多危險

安徽一女子同房后黃體破裂休克,送醫發現失血兩升!這事有多危險

科普大世界
2026-04-23 21:23:02
難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

科學發掘
2026-04-23 08:35:50
“暴力抗法”半月后,拼多多發生重大高管調整

“暴力抗法”半月后,拼多多發生重大高管調整

一見財經
2026-04-23 08:04:06
當不成總統了?美國四大前總統已經聯手,打響扳倒特朗普的第一槍

當不成總統了?美國四大前總統已經聯手,打響扳倒特朗普的第一槍

米老鼠的世界
2026-04-23 23:48:22
18+4+4+8失誤!哈登空砍全隊最高分 連迎兩大里程碑超越韋德帕克

18+4+4+8失誤!哈登空砍全隊最高分 連迎兩大里程碑超越韋德帕克

狍子歪解體壇
2026-04-24 10:34:23
老人擠公交插隊被乘客撞倒離世 家屬起訴公交公司索賠70萬被駁回

老人擠公交插隊被乘客撞倒離世 家屬起訴公交公司索賠70萬被駁回

封面新聞
2026-04-23 14:00:02
官方:深圳正式簽約前NBA中鋒伊布-巴吉,頂替阿爾法-卡巴

官方:深圳正式簽約前NBA中鋒伊布-巴吉,頂替阿爾法-卡巴

懂球帝
2026-04-24 11:04:07
馬科斯失算了!人民日報攤牌:中國不會救菲律賓,徹底死了這條心

馬科斯失算了!人民日報攤牌:中國不會救菲律賓,徹底死了這條心

影孖看世界
2026-04-24 12:31:59
阿里納斯:詹姆斯是最有統治力的老將,這數據99%球員都是頂薪

阿里納斯:詹姆斯是最有統治力的老將,這數據99%球員都是頂薪

懂球帝
2026-04-23 23:24:51
美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

琴音繚繞回
2026-04-23 10:11:11
張婉婷疑曾介入高云翔董璇婚姻,懷了對方的孩子,也太狗血了

張婉婷疑曾介入高云翔董璇婚姻,懷了對方的孩子,也太狗血了

話娛論影
2026-04-23 09:58:53
姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

千秋文化
2026-04-20 19:48:09
離譜出圈!歌手搶不到高鐵票,直接取消北京演唱會

離譜出圈!歌手搶不到高鐵票,直接取消北京演唱會

南萬說娛26
2026-04-24 11:46:48
DeepSeek-V4發布 脫離英偉達框架轉向華為

DeepSeek-V4發布 脫離英偉達框架轉向華為

泡泡網
2026-04-24 12:00:10
鬧大了!霍汶希發聲力挺張敬軒,遭內地網友抵制,謝霆鋒恐被連累

鬧大了!霍汶希發聲力挺張敬軒,遭內地網友抵制,謝霆鋒恐被連累

娛樂團長
2026-04-21 21:05:57
2026-04-24 13:12:49
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發者
191文章數 112關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

家居
旅游
房產
教育
公開課

家居要聞

自然肌理 溫潤美學

旅游要聞

達州大竹:農文旅融合添活力 “農事親子樂園”火爆出圈

房產要聞

三亞安居房,突然官宣!

教育要聞

“假聰明”的孩子,會有3種表現,長大難成大器,父母別高興太早

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版