在6月5日舉行的2026騰訊云AI產業應用大會現場,所有人的目光都聚焦在臺上兩個人身上——騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生,和坐在他身旁、略顯拘謹的年輕人。
![]()
這個年輕人就是姚順雨,被外界稱為“騰訊史上最年輕的核心部門掌舵者”,騰訊首席AI科學家、混元大模型及AI Infra負責人。他身上有太多標簽:ReAct架構提出者、前OpenAI研究員、普林斯頓大學博士、清華“姚班”出身。2025年12月17日加入騰訊后,外界對他的好奇和質疑從未停止:為什么選擇騰訊?騰訊在AI上是不是慢了?混元大模型到底能不能打?
這是姚順雨加入騰訊后的第二次公開亮相,也是他首次線下真身出現在公眾面前。
這一次,姚順雨沒有“回避”任何問題。他與湯道生進行了一場近一小時的開放對談,主題是《騰訊AI下半場》。兩個人在臺上互相提問、互相作答。我們把這場對話切開、重組,試圖拼出一張騰訊AI的真實地圖。
萬能“錘子”與找“釘子”的哲學
對談剛開始,湯道生直接開門見山的就拋出了那個所有人最關心的問題:“你為什么下半場會選擇來騰訊?”
![]()
姚順雨沒有馬上回答,而是先厘清了一個被“用濫了”的概念——AI下半場。這個概念源自他去年的一篇博客。在他看來,AI上半場的主題是“找方法”:為了下圍棋,發明AlphaGo;為了做翻譯,訓練專門的翻譯模型。每個任務都需要定制化的技術方案,就像為每一種釘子單獨打造一把錘子。
但預訓練和后訓練的成熟,改變了這一切。“我們現在好像有了一把萬能錘子,它可以去砸任何釘子。”姚順雨說,“它是一個通用方法論,可以解決各種各樣的問題,反而更困難的是怎么尋找好的問題去解決。”
這就是他選擇騰訊的第一個理由。這里有海量的“好釘子”。微信、QQ、騰訊會議、企業微信、元寶……這些國民級產品每天都在產生真實的使用場景和交互數據。在姚順雨的詞典里,這些場景和數據共同構成了一個關鍵的詞:Context(上下文)。
“模型越來越擅長把一個非常復雜的輸入變成輸出。你的競爭壁壘就在于,你有沒有最原始的輸入,你到底知不知道這個人在干什么?知不知道這個企業各種各樣的信息?”他認為,騰訊在這方面擁有非常強的優勢。
但這只是第二重要的原因。最重要的原因,是文化。
姚順雨回憶起第一次與湯道生和總辦其他成員聊天的場景,印象最深的不是技術愿景,不是資源承諾,而是一種罕見的坦誠。“大家做得好、做得不好都非常實在,不會去掩蓋。我知道這里做好了,我知道那里沒做好,我知道應該怎么做。”他說,“騰訊總體是一個基于信任、而不是基于指標來運轉的公司。我們的文化里有非常低的low ego,有非常solid的一面。這些東西對于長期做AI的組織來說,太重要了。”
在他看來,AI下半場的核心目標,不是造出一個超級應用,而是在中國建立一個長期主義的、可持續積累的AGI組織。他把這個組織畫成一個“均衡三角形”:底層是Foundation(基礎模型),把預訓練和后訓練做到極致;中間是Product(產品),讓技術真正產生社會價值;頂層是Frontier(前沿探索),不斷尋找新的研究范式和機會。
![]()
“只做好其中一塊不夠,必須三塊均衡發展。”他說。而支撐這個三角形的,正是他感受到的那種文化——不追短期風口,不粉飾問題,愿意為長期價值承受暫時的誤解。
湯道生在一旁補充道,這種務實坦誠的氛圍,也是他經常從客戶那里得到的反饋。“我們做的好的和不好的都得認。AI賽道是長跑,認知很重要。這是一個多維度的競賽。”
比刷榜更重要的,是學會“換位思考”
如果說“三角形”是騰訊AI的骨架,那么Co-Design(協同設計)就是連接骨架的韌帶。
湯道生提了一個很實在的問題:騰訊有這么多產品,從元寶這樣的聊天機器人,到CodeBuddy、WorkBuddy這樣的效率智能體,都深度依賴模型能力。怎么把模型和產品真正結合在一起?
姚順雨的回答直指一個中國AI行業的普遍問題:“中國大家有個不好的傾向,就是喜歡刷榜。”
雖然這句話說得很輕,但分量不輕。他解釋,Benchmark(基準)并非完全沒有價值,但問題在于很多公開榜單容易被“過擬合”。榜單上的題目通常是描述精確、邊界清晰的單輪問題,但真實用戶的使用場景完全不同——問題模糊、多輪追問、充滿歧義。
騰訊的選擇是:把評價體系從“榜單導向”拉回到“真實場景導向”。混元大模型的Preview版本,最重要的目的之一就是獲取真實世界反饋,去發現那些榜單上永遠不會出現的“底線問題”。
他講了一個很少有人注意到的細節。在混元自己的預訓練還沒有完全準備好時,他就做出了一項讓很多算法同學不理解的決策——派出后訓練最強的骨干力量,優先幫元寶把后訓練做好。
“維護好元寶這樣的產品以及它的DAU,對我們接下來做模型非常非常重要。”姚順雨說,“當時很多算法同學不理解,我需要很努力地去解釋。但現在回頭看,這個動作讓產品團隊意識到,模型的同學是真的在為他們著想。包括Hy3 preview在元寶上成功上線起到了非常重要的作用。”
這引出了Co-Design中最核心也最難的一點:建立信任。因為做模型的人和做產品的人,天然存在目標上的張力。模型團隊追求能力越強越好,產品團隊追求用戶需求被滿足。姚順雨認為,最難的不是技術細節,而是“換位思考的能力”,是彼此愿意為了共同目標做出短期“犧牲”。
![]()
湯道生從產品視角印證了這一點。他把傳統產品比作“預制菜”:用戶只能在固定的菜單里選擇。但在AI時代,自然語言成了主交互界面,產品方永遠不知道用戶下一句會問什么。這就要求產品的所有設計:評測、對齊、工具調用都要前置,和模型訓練融為一體。
湯道生認為“以前瀑布式的研發流程很清晰,需求、設計、開發、測試,一步一步來。但今天大部分代碼都是AI生成的,工程師更多在做架構設計,把寫代碼的工作交給AI,定期指導、修正。測試也要左移,更前置地想清楚評測標準和用戶風格的對齊。”湯道生說,“今天做產品要求的能力更全面。”姚順雨緊接著回答:“更難了。”
而混元3本身的技術升級,也順著這套邏輯展開。姚順雨把它總結為三件事:一是重建了預訓練和強化學習基礎設施。二是對數據做了很大改變,包括定義更真實的問題、豐富data taxonomy等。三是許多關鍵決策沒有清晰公式,需要在招人、模型節奏、資源取舍中不斷做trade-off。
慢慢來,比較快
這場對話進行到中后段,湯道生把那個最尖銳的問題擺上了臺面:“很多人都說,騰訊在AI上沒有及時抓住一些機會。你覺得我們真的慢了嗎?”
姚順雨沒有急著辯解,而是回到了兩個更底層的判斷。
第一個判斷:AI是一場短期游戲,還是一場長期游戲?他說,硅谷現在彌漫著一種焦慮情緒:兩年后所有人都會失業,我們要趕快賺兩年錢然后退休。但騰訊的判斷很明確,這是一個剛剛開始的長期游戲。“我不認為ChatGPT和Claude Code會是唯一的Super App,那是一個非常灰暗的世界。肯定還會有源源不斷的新機會誕生。今天就像70年代PC剛剛產生的時候,還有很多很多事情需要做。”
第二個判斷:AI的未來是線性單一路徑,還是多元生態?過去幾年,行業似乎有一條清晰的主線:Pre-training、post training、Agent、Coding Agent,所有人都在做一樣的事,都在Copy。但在姚順雨看來,這同樣是“非常灰暗”的圖景。“我的個人看法是,未來會變得更多元。Coding Agent的生產力革命才剛剛開始,這個世界還有很多空間沒有被填滿。多模態、具身智能,很多新的事情正在發生。”
基于這兩個判斷,他給出了一個學者式的回應:“過去模型、產品上做了很多探索,走過彎路。這是正常的,沒做過的事情第一次做,肯定有曲折。但更重要的事情是說能不能誠實面對自己,能不能Be Real,能不能看到feedback(反饋)然后改變,能不能保持耐心。這才是下半場最重要的事。”
湯道生接過話題,坦然承認騰訊是一個多業態、多賽道的復雜公司,不同業務線的進度本來就有快有慢,也會有失敗和反復。“這些提醒都非常好,有些地方我們確實可以做得更好。但就像你說的,這是長跑,是馬拉松。”他特別提到,騰訊多年積累的全產品線場景數據,是這場長跑中最大的護城河。
事實上,變化已經悄然發生。2026年以來,騰訊AI動作明顯加快:混元大模型Hy3 preview憑借實用性和性價比,連續數周登頂OpenRouter全球調用榜首;AI桌面智能體WorkBuddy以DAU計已成為國內最受歡迎的效率工具。今年初的Agent熱潮中,騰訊也反應迅速。
![]()
姚順雨特別強調了一個關于“性價比”的認知誤區。很多人以為降本關鍵是模型架構壓縮,但他認為真正的核心首先在于性能本身。“如果性能不好,性價比就很難成立。用更好的模型一次把事情做對,比用更差的模型反復試錯省錢得多。把相對簡單的任務一次性做對、做到足夠robustness(魯棒),這可能在很多長程的上面提升一兩個點的提升。”在此基礎上,用更小的模型去完成更高價值的任務,才是適合中國市場的務實路徑。
湯道生補充了來自組織層面的觀察。他注意到,WorkBuddy等新產品的團隊呈現出完全不同的組織形態:不是傳統的多層級架構,而是三五個人一個小組,圍繞某個特定方向快速試驗、驗證。大部分試驗拿不到正向反饋,但公司需要包容這種試錯。“原來的工程師大量時間花在寫代碼上,現在這些工作可以交給AI了。每個工程師更像一個有想法的leader,同時驅動多個Coding Agent干活,還要參與評測、測試,把對齊工作做到前面來。”
一個28歲年輕人的“慢選擇”
對談過程中,姚順雨回憶起一個令他感慨的瞬間。前幾天他重新翻看了自己2019年的博士論文,標題是《Language Agents: From Next-Token Prediction to Digital Automation》。那時候還是Literally也就是我們的GPT-2,模型生成的文本經常不連貫,沒人能想到它會成為改變世界的力量。
但他當時在論文結尾寫下的“future work(未來工作)”,第一條就是“train models for Agent(為Agent訓練模型)”。七年后,他真的在做這件事。
他描述起2022年7月的某個夜晚,他第一次把PaLM 2的API和當時手寫的一個Wikipedia API連在一起,看到模型能夠基于互聯網進行多輪交互時,那種感覺“就像微弱的電燈絲突然亮了一下”。當時他隱約覺得,這東西可能會在五到十年內改變世界。但后來發生的一切,比他想象中還要快。
小編突然意識到,姚順雨看騰訊AI的視角,本質上就是這個比喻的延伸。他不迷信點燃鎂光燈式的爆發,更相信那根微弱燈絲持續通電、緩慢點亮整個房間的過程。在一個急切追求“快”的時代,這位28歲的年輕人選擇了一家愿意讓他“誠實面對問題、慢慢做對事情”的公司。也許,這才是姚順雨視角下的騰訊AI最真實的模樣:不完美,但足夠誠實;不激進,但準備好跑一場長跑。
“可能我想的還是不夠大。”他笑著說。
騰訊AI能跑多快,或許還需要時間給出答案。但至少在這場對話里,外界看到了一個不再急于自證、而是選擇誠實面對自己的騰訊。它把AI定義成一場數十年的長跑,把場景和上下文看作最深的壁壘,把信任和換位思考視作比技術更難也更有價值的事。
![]()
慢慢來,有時候反而比較快。
Be Real,在AI下半場,這或許是一種比速度更稀缺的能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.