Qwen這是沒抓住Agent浪潮?
3月27日消息,前阿里千問大模型技術負責人林俊旸在離職三周后首次公開發聲,發布長文反思Qwen3技術路線,判斷AI下一階段方向是“智能體式思考”。
林俊旸是阿里最年輕的P10級技術專家,32歲即擔任千問技術負責人。他主導了Qwen全系列后訓練,將千問做到全球下載量超10億次、衍生模型超20萬款,成為全球開源模型領軍者之一。3月4日凌晨,林俊旸宣布離職,據媒體報道其離職源于組織架構調整分歧——阿里希望將Qwen團隊水平拆分,而林俊旸堅持預訓練與后訓練應更緊密垂直整合。
林俊旸在文中坦承,2025年初千問團隊嘗試將“思考模式”與“指令模式”融合到同一模型,但“我們沒有全做對”。兩種模式的數據分布和行為目標存在根本沖突:強指令模型追求直接、簡潔、低延遲;強思考模型需要在難題上多花token、探索多條路徑。強行融合的結果往往是“兩邊都平庸”。據林俊旸披露,千問在2507版本最終切回分離路線,分別發布獨立的Instruct和Thinking版本。
林俊旸明確提出,行業正從“推理式思考”轉向“智能體式思考”——從“想得更久”到“為了行動而想”。未來AI的核心競爭力將來自環境設計、訓練與推理的緊耦合、多智能體協作編排,而非僅僅是更好的算法。他特別提到Anthropic的路線是“有益的糾偏”:Claude系列讓模型在思考過程中就能調用工具,思考服務于具體任務目標。過于冗長的內部推理鏈反而說明模型“不會分輕重、不會壓縮、不會行動”。
林俊旸預測,智能體式思考將成為主導形態,未來競爭將從“訓練模型”轉向“訓練智能體”,再到“訓練系統”。他警告,一旦模型獲得工具調用權限,“獎勵黑客”風險將成倍增加,模型可能在訓練中學會直接搜索答案或利用系統漏洞作弊。
文章發布后迅速引發熱議。有業內人士評論:“千問的模型往往架構做得好,但訓練數據不行。”還有開發者指出:“核心還是要讓智能體縮短思考并準確調用工具執行。”不少網友認同林俊旸的判斷,認為“AI正從‘只會在腦子里想’升級為‘邊想邊行動’”。也有評論稱,這篇長文“相當于發了一個故事,等人來投資他的算力需求”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.