網易首頁 > 網易號 > 正文申請入駐

大廠最年輕AI一號位姚順雨交卷：入職騰訊4個月，一邊糾偏一邊降價

2026-04-24 18:40:36　來源: 時代在線網

廣東舉報

分享至

本文來源：時代周報作者：謝斯臨趙鵬

圖片來源：時代周報記者攝

入職4個月后，騰訊首席AI科學家姚順雨交出了第一份答卷。

4月23日，騰訊混元發布Hy3 preview語言模型并將模型開源。據騰訊方面介紹，這是一個快慢思考融合的混合專家模型，總參數295B，激活參數21B，最大支持256K上下文長度。這是混元重建后訓練的第一個模型，在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅提升。

騰訊在AI的布局和投入節奏一向被人評價為“慢”。在今年1月騰訊年會上，騰訊董事會主席兼首席執行官馬化騰也公開承認，騰訊比友商“慢了9個月到1年時間”。他認為，基礎設施不足，模型迭代頻率偏低以及平臺能力有待提升。

高層的反思無疑加速了騰訊AI的變革。2025年開始，騰訊混元大模型完成了“深度重構”：在人才引進、組織結構等方面做出了重大調整，吸引了更多原生AI領域人才。其中，姚順雨的加入被普遍視作重要拐點。

在被騰訊挖角之前，姚順雨在OpenAI工作過一年，深度參與智能體產品Operator與Deep Research的開發，成為這兩大項目的關鍵貢獻者。憑借在AI領域的突破性研究，2025年姚順雨還入選《麻省理工科技評論》TR35榜單，成為該獎項中國區最年輕的入選者之一。

為了吸引姚順雨，騰訊可能提供了國內大模型人才戰中的職位和薪酬的最高標準。曾有市場傳聞稱騰訊為了挖走他開出了上億元的薪水，騰訊隨后辟謠。但即便這個數字并不真實，1998年出生的姚順雨仍是國內大廠中最年輕的AI一號位。

入職后，姚順雨獲得了前所未有的資源支持。騰訊分散在不同事業群的AI研發業務被重新整合，就連成立10年的騰訊AI Lab也悄然解散，研究能力并入姚順雨的大模型體系。

正因如此，外界對姚順雨在騰訊的舉動高度好奇。這位只有28歲的年輕人，究竟能為騰訊AI帶來何種變化？騰訊AI的未來技術路徑與戰略重心又將走向何方？

希望團隊不要盯著榜單做事

姚順雨入職騰訊之后的一項重要任務是，幫助騰訊找到混元大模型長期表現欠佳的原因。而在姚順雨一番內部調研后發現，混元的評測出現了問題。

據晚點此前報道，姚順雨曾在內部會議上指出，過去的混元模型過度追逐榜單成績，將打榜的語料放入訓練集以致數據被污染，影響了在真實場景中的表現。他希望團隊以后不要打榜，也不要盯著榜單做事。

在2026年1月的一次公開亮相中，姚順雨也曾談及模型“刷榜”。他指出，國內對刷榜或數字看得更重，而DeepSeek做得比較好的一點是，他們可能沒有那么關注榜單的數字。DeepSeek可能會更注重：第一，什么是正確的事情；第二，什么是自己能體驗出好或者不好的。

“這需要大家走出這些榜單的束縛，能夠堅持自己認為正確的過程。”姚順雨說。

姚順雨首先要做的就是改變混元團隊對刷榜的依賴。時代周報記者獲悉，2026年2月，騰訊混元重建了預訓練和強化學習的基礎設施，并提出了三個原則：能力體系化、評測真實性、性價比追求。

騰訊想要以此跳出“刷榜”的怪圈，通過自建題目、人工評測、產品眾測等多種方式，評估和改進模型的“真實戰斗力”。具體來看，在Hy3 preview中，混元團隊沒有完全依賴行業通用的公開評測集，而是自建了50多個Benchmarks（評測基準，即用來衡量模型真實能力的標準化測試集）來評估模型的實際能力和落地性。

與此同時，姚順雨也在追求模型與騰訊內部業務的貼合，讓模型在實際應用中學習進化。

在上述公開發言中，姚順雨也曾強調，大型科技公司應利用自身龐大的內部場景進行驗證。與初創公司依賴外部標注商不同，一家擁有10萬員工的大廠本身就是巨大的實驗場。

“把真實世界的數據利用好，而不是僅僅依賴于標注商或者外部采購，是更有意思的事情。”姚順雨說。

為此，正式上線之前，Hy3 preview也在騰訊主要AI業務進行了產品測試。比如，混元就與元寶進行了深度協同設計（Co-Design）。一方面，Hy3 preview針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現；另一方面，Hy3 preview對文風、文筆、交互情商、內容組織與專業度上進行精細化調優。

在公眾號AI分身和AI客服的場景評測中，Hy3 preview在用戶意圖理解、復雜上下文承接和知識信息組織方面的表現也更為成熟。結合知識庫、用戶記憶與上下文生成回答時，Hy3 preview更貼合AI分身和AI客服的角色，過度腦補、主觀代入和情緒化表達問題明顯減少。

得益于這些動作，Hy3 preview的實用性有所提升。特別是在Agent、上下文學習、復雜推理和代碼等主推能力上，Hy3 preview的表現已經接近或超越Kimi-K2.5和GLM-5，但相比Gemini-3.1-Pro與GPT-5.4 xhigh仍有一定差距。

姚順雨進一步指出，騰訊將繼續擴大預訓練和強化學習的規模，提升模型的智能上限，并通過與騰訊眾多產品的深度Co-Design，持續提升模型在真實場景中的綜合表現，并開始探索特色模型能力。

成本相比上一代模型大幅下降

除去能力上的變化之外，Hy3 preview的另一項顯著變化在于成本的降低。

據騰訊方面介紹，得益于模型和推理框架上的深度協同，以及在推理框架、算子性能、量化算法等全方面優化，Hy3 preview整體推理效率提升40%，成本相比上一代模型也大幅下降。

在騰訊云大模型服務平臺TokenHub上，Hy3 preview輸入價格最低1.2元/百萬tokens，緩存命中輸入價格0.4元/百萬tokens，輸出價格最低4元/百萬tokens。同時，騰訊云還聯合混元推出Hy3 preview Token Plan定制套餐，個人版定價最低每月28元。

這無疑是對“Token經濟”的一次回應。當OpenClaw成為全民關注點，各大廠商加入“龍蝦潮”，Token的消耗就開始呈現出指數級的增長趨勢。據國家數據局披露，2026年3月中國日均Token調用量已突破140萬億，較2024年初的1000億增長超千倍，較2025年底的100萬億增長40%以上。

自此，一場無聲的“座次重排”已然開啟。流量不再是衡量互聯網公司競爭力的唯一標尺，Token正崛起為新的硬通貨。如何吸引用戶消耗更多Token，也隨之成為AI時代競爭的關鍵。

不過，價格只是Token戰爭當中的一環。上海期智研究院研究員李彪曾撰文指出，如果今天仍有人只討論“哪個模型每百萬Token更貴”，這說明只看到了底層供給的一部分。真實情況是，企業目前購買的是一段被組織過的智能勞動，裸模型只是其中的一小部分。它可能同時包含模型推理、搜索、檢索、緩存、上下文駐留、運行時、容器、團隊席位、動作配額，乃至一個被明確定義的“完成件”。

“AI經濟正在經歷的，不是一場簡單的價格戰，而是計費對象的擴散。”李彪寫道。

在這種情況下，只關注Token的消耗，而忽視模型本身的輸出能力和成本效率，客戶終將流失。唯有聚焦產品本身，為客戶創造切實的價值，才能自然形成真實、可持續的Token消耗。

也正是因此，各家大廠之間，模型能力的競爭仍在不斷升級。今年2月，字節跳動先后發布了Seed 2.0大語言模型和新一代視頻生成模型Seedance 2.0，此后持續高頻更新；4月，阿里也發布了Qwen 3.6的多個版本，并認領了近期“屠榜”的神秘視頻生成模型HappyHorse；DeepSeek-V4的預覽版本也已經在4月24日正式上線并同步開源。

此外，對于C端用戶的爭奪也在加劇。移動數據調研機構Quest Mobile報告顯示，元寶在一季度新增用戶820萬，豆包和千問的增量則分別達到了1億和1.26億。截至2026年3月，國內月活用戶規模最大的三個AI App分別是豆包、千問和DeepSeek，豆包的月活用戶數量已經達到3.45億；千問月活超越DeepSeek，達到1.66億；元寶則排在第四，月活只有5735萬。

激烈競爭之下，騰訊仍需不斷加速迭代，才能追平因起步慢帶來的差距。正如姚順雨所說，Hy3 preview只是混元大模型重建的第一步。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.