本文來源:時代周報 作者:謝斯臨 趙鵬
![]()
圖片來源:時代周報記者攝
入職4個月后,騰訊首席AI科學家姚順雨交出了第一份答卷。
4月23日,騰訊混元發布Hy3 preview語言模型并將模型開源。據騰訊方面介紹,這是一個快慢思考融合的混合專家模型,總參數295B,激活參數21B,最大支持256K上下文長度。這是混元重建后訓練的第一個模型,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅提升。
騰訊在AI的布局和投入節奏一向被人評價為“慢”。在今年1月騰訊年會上,騰訊董事會主席兼首席執行官馬化騰也公開承認,騰訊比友商“慢了9個月到1年時間”。他認為,基礎設施不足,模型迭代頻率偏低以及平臺能力有待提升。
高層的反思無疑加速了騰訊AI的變革。2025年開始,騰訊混元大模型完成了“深度重構”:在人才引進、組織結構等方面做出了重大調整,吸引了更多原生AI領域人才。其中,姚順雨的加入被普遍視作重要拐點。
在被騰訊挖角之前,姚順雨在OpenAI工作過一年,深度參與智能體產品Operator與Deep Research的開發,成為這兩大項目的關鍵貢獻者。憑借在AI領域的突破性研究,2025年姚順雨還入選《麻省理工科技評論》TR35榜單,成為該獎項中國區最年輕的入選者之一。
為了吸引姚順雨,騰訊可能提供了國內大模型人才戰中的職位和薪酬的最高標準。曾有市場傳聞稱騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。但即便這個數字并不真實,1998年出生的姚順雨仍是國內大廠中最年輕的AI一號位。
入職后,姚順雨獲得了前所未有的資源支持。騰訊分散在不同事業群的AI研發業務被重新整合,就連成立10年的騰訊AI Lab也悄然解散,研究能力并入姚順雨的大模型體系。
正因如此,外界對姚順雨在騰訊的舉動高度好奇。這位只有28歲的年輕人,究竟能為騰訊AI帶來何種變化?騰訊AI的未來技術路徑與戰略重心又將走向何方?
希望團隊不要盯著榜單做事
姚順雨入職騰訊之后的一項重要任務是,幫助騰訊找到混元大模型長期表現欠佳的原因。而在姚順雨一番內部調研后發現,混元的評測出現了問題。
據晚點此前報道,姚順雨曾在內部會議上指出,過去的混元模型過度追逐榜單成績,將打榜的語料放入訓練集以致數據被污染,影響了在真實場景中的表現。他希望團隊以后不要打榜,也不要盯著榜單做事。
在2026年1月的一次公開亮相中,姚順雨也曾談及模型“刷榜”。他指出,國內對刷榜或數字看得更重,而DeepSeek做得比較好的一點是,他們可能沒有那么關注榜單的數字。DeepSeek可能會更注重:第一,什么是正確的事情;第二,什么是自己能體驗出好或者不好的。
“這需要大家走出這些榜單的束縛,能夠堅持自己認為正確的過程。”姚順雨說。
姚順雨首先要做的就是改變混元團隊對刷榜的依賴。時代周報記者獲悉,2026年2月,騰訊混元重建了預訓練和強化學習的基礎設施,并提出了三個原則:能力體系化、評測真實性、性價比追求。
騰訊想要以此跳出“刷榜”的怪圈,通過自建題目、人工評測、產品眾測等多種方式,評估和改進模型的“真實戰斗力”。具體來看,在Hy3 preview中,混元團隊沒有完全依賴行業通用的公開評測集,而是自建了50多個Benchmarks(評測基準,即用來衡量模型真實能力的標準化測試集)來評估模型的實際能力和落地性。
與此同時,姚順雨也在追求模型與騰訊內部業務的貼合,讓模型在實際應用中學習進化。
在上述公開發言中,姚順雨也曾強調,大型科技公司應利用自身龐大的內部場景進行驗證。與初創公司依賴外部標注商不同,一家擁有10萬員工的大廠本身就是巨大的實驗場。
“把真實世界的數據利用好,而不是僅僅依賴于標注商或者外部采購,是更有意思的事情。”姚順雨說。
為此,正式上線之前,Hy3 preview也在騰訊主要AI業務進行了產品測試。比如,混元就與元寶進行了深度協同設計(Co-Design)。一方面,Hy3 preview針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現;另一方面,Hy3 preview對文風、文筆、交互情商、內容組織與專業度上進行精細化調優。
在公眾號AI分身和AI客服的場景評測中,Hy3 preview在用戶意圖理解、復雜上下文承接和知識信息組織方面的表現也更為成熟。結合知識庫、用戶記憶與上下文生成回答時,Hy3 preview更貼合AI分身和AI客服的角色,過度腦補、主觀代入和情緒化表達問題明顯減少。
得益于這些動作,Hy3 preview的實用性有所提升。特別是在Agent、上下文學習、復雜推理和代碼等主推能力上,Hy3 preview的表現已經接近或超越Kimi-K2.5和GLM-5,但相比Gemini-3.1-Pro與GPT-5.4 xhigh仍有一定差距。
姚順雨進一步指出,騰訊將繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。
成本相比上一代模型大幅下降
除去能力上的變化之外,Hy3 preview的另一項顯著變化在于成本的降低。
據騰訊方面介紹,得益于模型和推理框架上的深度協同,以及在推理框架、算子性能、量化算法等全方面優化,Hy3 preview整體推理效率提升40%,成本相比上一代模型也大幅下降。
在騰訊云大模型服務平臺TokenHub上,Hy3 preview輸入價格最低1.2元/百萬tokens,緩存命中輸入價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊云還聯合混元推出Hy3 preview Token Plan定制套餐,個人版定價最低每月28元。
這無疑是對“Token經濟”的一次回應。當OpenClaw成為全民關注點,各大廠商加入“龍蝦潮”,Token的消耗就開始呈現出指數級的增長趨勢。據國家數據局披露,2026年3月中國日均Token調用量已突破140萬億,較2024年初的1000億增長超千倍,較2025年底的100萬億增長40%以上。
自此,一場無聲的“座次重排”已然開啟。流量不再是衡量互聯網公司競爭力的唯一標尺,Token正崛起為新的硬通貨。如何吸引用戶消耗更多Token,也隨之成為AI時代競爭的關鍵。
不過,價格只是Token戰爭當中的一環。上海期智研究院研究員李彪曾撰文指出,如果今天仍有人只討論“哪個模型每百萬Token更貴”,這說明只看到了底層供給的一部分。真實情況是,企業目前購買的是一段被組織過的智能勞動,裸模型只是其中的一小部分。它可能同時包含模型推理、搜索、檢索、緩存、上下文駐留、運行時、容器、團隊席位、動作配額,乃至一個被明確定義的“完成件”。
“AI經濟正在經歷的,不是一場簡單的價格戰,而是計費對象的擴散。”李彪寫道。
在這種情況下,只關注Token的消耗,而忽視模型本身的輸出能力和成本效率,客戶終將流失。唯有聚焦產品本身,為客戶創造切實的價值,才能自然形成真實、可持續的Token消耗。
也正是因此,各家大廠之間,模型能力的競爭仍在不斷升級。今年2月,字節跳動先后發布了Seed 2.0大語言模型和新一代視頻生成模型Seedance 2.0,此后持續高頻更新;4月,阿里也發布了Qwen 3.6的多個版本,并認領了近期“屠榜”的神秘視頻生成模型HappyHorse;DeepSeek-V4的預覽版本也已經在4月24日正式上線并同步開源。
此外,對于C端用戶的爭奪也在加劇。移動數據調研機構Quest Mobile報告顯示,元寶在一季度新增用戶820萬,豆包和千問的增量則分別達到了1億和1.26億。截至2026年3月,國內月活用戶規模最大的三個AI App分別是豆包、千問和DeepSeek,豆包的月活用戶數量已經達到3.45億;千問月活超越DeepSeek,達到1.66億;元寶則排在第四,月活只有5735萬。
激烈競爭之下,騰訊仍需不斷加速迭代,才能追平因起步慢帶來的差距。正如姚順雨所說,Hy3 preview只是混元大模型重建的第一步。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.