網易首頁 > 網易號 > 正文申請入駐

15句話，總結姚順雨第一次肉身亮相

2026-06-05 15:53:05　來源: 字母榜

北京舉報

分享至

在6月5日的騰訊云AI下半場大會上，騰訊集團高級執行副總裁湯道生，和騰訊首席AI科學家姚順雨做了個對話。

此次談話圍繞騰訊如何理解AI下半場展開：當大模型的方法論逐漸成熟，競爭重點正在從單點模型能力，轉向真實場景、產品反饋、上下文網絡和Agent工程化落地。

湯道生與姚順雨的對話，也透露出騰訊內部，正在用模型與產品Co-Design對內部進行重組。

我們整理了兩人的所有談話，并將其歸納為了15個核心觀點。

關于AI下半場

1. “下半場”被濫用了，姚順雨加入騰訊的原因是騰訊“有問題”，有真正的AI需要的好問題

姚順雨表示，“AI下半場”這個概念有些被濫用。他認為，過去幾十年AI更重要的是尋找好方法，比如為了圍棋做AlphaGo，為了翻譯做特定模型。但在預訓練和后訓練成熟后，大模型變成了一把“萬能的錘子”，可以解決各種問題。于是，真正稀缺的開始變成“好問題”。模型能力具備通用性之后，企業需要判斷應該把它用在哪里，解決什么問題，產生什么價值。

這也是姚順雨加入騰訊一個很重要的原因。“騰訊有很多好的問題，有很多很多產品。”姚順雨說，好的產品能夠解決第一個問題，就是做了好的預訓練和后訓練之后，到底要把它應用在什么樣的場景，它的價值在哪里。

2. 環境很重要，context更重要，競爭壁壘有時來自于有沒有最原始的輸入

姚順雨強調了環境的重要性。沒有好的環境，Agent就沒有辦法去做各種各樣的事情。如果你沒有一個點外賣的tool，那你就沒有辦法去點外賣。

但最重要的是context。姚順雨說，無論企業還是個人，越來越重要的事情是context。因為模型越來越擅長把一個非常復雜的輸入變成一個輸出，很多時候你的競爭壁壘就來自于你有沒有那個最原始的輸入。你知不知道這個人他在干什么，你知不知道這個企業的各種各樣的信息。這一點，騰訊有非常強的優勢。

3. 在AI下半場最重要的目標是在中國建立長期的、基于AGI的組織

姚順雨個人的目標是，在中國建立一個長期的、基于AGI的組織。他提到，今天的AI主要有三個部分。

首先是foundation的部分，怎么樣去把預訓練和后訓練這些最基礎的東西做得非常solid。

第二部分是產品，怎么去把這樣的技術真正為人和社會產生價值。

第三就是frontier，怎么去探索新的研究范式，探索新的機會。

最重要的是，要構建一個非常均衡的、像三角形一樣的組織。對于做foundation來說，第一最重要的是有充足資源，第二就是需要正確的做事的方式。對于產品來說，有好的產品的sense，有這種做產品的人是至關重要的。第三個，在中國今天所做的前沿探索不夠多，所以姚順雨希望能把frontier exploration的精神能更多地注入到組織中。

4. 騰訊追求模型與產品Co-Design，但姚順雨認為一切的前提依然是模型

談到騰訊內部高頻提到的Co-Design，姚順雨認為，第一前提是模型本身要做得扎實。預訓練是相對product-agnostic的事情，它提供可泛化的foundation，能夠讓各種下游任務持續受益。

后訓練方面，最重要的是設立好正確的eval。姚順雨吐槽，國內可能有一個不太好的傾向，就是比較喜歡刷榜。但更應該關心的是，如何實事求是地基于產品、基于真正的應用去構造更加真實的eval。實用性的價值是大于刷榜價值的。

這一點上，騰訊做了大量工作，跟各種各樣的產品進行了深度的Co-Design。姚順雨說，Co-Design很關鍵的一點是要產生相互的信任，這一點騰訊做了大量工作去取得互信。怎么把產品的數據用好，怎么把這種回流用好，怎么把eval做好，這里有很多細節。

5. 真實產品反饋能發現benchmark看不到的問題

姚順雨也不否認benchmark的價值，但相比之下，真實世界的數據至少有三類價值。

第一，發現榜單無法暴露的底線問題。姚順雨說，騰訊想要發一個preview模型，最重要的目的之一，就是希望能獲得真實世界的反饋，修復各種榜單中沒法發現的底線問題。這一點會在正式版上有非常大的改進。

第二，理解真實用戶的prompt distribution。因為現實用戶的問題往往模糊、短促、多輪追問，而benchmark題目通常更精確、更單輪。比如benchmark上面的題目可能都是非常精確的，有非常長的concrete description，而且一般來說是一個單輪問題。但是在現實場景中，大家問的問題可能都是比較模糊的，可能就一兩句話，然后他會不停追問。這些setup上的difference，就可以啟發怎么去更好地做這樣的訓練。

第三，產品本身還可能啟發新的評測方向，推動尚未被很好定義的能力領域。姚順雨說，甚至可以在這些產品上獲得一些靈感，去推進現在還沒有的榜單，或者還沒有被很好定義的領域。比如騰訊最近做了很多Context learning的工作，包括元寶的反饋也給了很大的啟發和幫助。

關于模型泛化

6. 以模型之名，騰訊的不同產品終于有了點“互相流通”

姚順雨指出，LLM時代與過去AI的根本差異是泛化性。過去做翻譯模型，只需要翻譯數據。做圍棋程序，只需要圍棋數據。但今天即便只做Coding Agent，也需要聊天、搜索、指令遵循、推理等多種能力。

因此，擁有多個產品場景的公司會具備體系化優勢。姚順雨說，和元寶的Co-Design可以使模型產生很強的聊天和搜索能力。但這樣的能力又可以被遷移到ima、WorkBuddy等其他產品。所以這些產品能夠提供不同的數據，而這些數據之間又可以相互擴散、相互遷移，形成一個像網絡一樣的體系。這一點的價值會越來越重要。

此前，騰訊的打法被外界形容為“賽馬”。不同業務做相同方向的產品，彼此競爭，很少有形成合力的感覺，現在似乎以AI之名開始有所改變。

7. Hy3的核心變化是重建基礎設施、重做數據，并依賴大量taste-driven的決策

對于Hy3 Preview，姚順雨說“大模型沒有什么秘密”。要把infrastructure做好，把數據做好，算法部分反而相對簡單。

他提到，混元3主要做了幾方面改變。一是重建了預訓練和強化學習基礎設施。二是對數據做了很大改變，包括定義更真實的問題、豐富data taxonomy、提高數據質量，這是一個永無止境的追求。三是許多關鍵決策沒有清晰公式，需要在招人、模型節奏、資源取舍中不斷做trade-off，本質上是一個很taste-driven的過程。

8. 元寶與混元的合作，最難的部分不是技術，而是信任

姚順雨透露，元寶早期階段，混元曾派出很強的算法骨干，幫助元寶先把DeepSeek的后訓練做好。彼時混元自己的預訓練模型還沒有ready，不少算法同學一開始不理解。

但姚順雨認為，維護元寶這樣的產品和DAU，對后續做模型和長期合作都很重要。所以當時其實很多同學也不理解，然后他需要去很努力地解釋。但現在看起來，這些努力都是pay off。這樣的一個動作，讓產品和模型的同學意識到，模型的同學是真的在為產品著想。這個對于之后的合作，包括混元在元寶上成功的上線，起到了非常重要的作用。

姚順雨說，做模型的目標和產品的目標有很多align的部分，也有很多不align的部分。模型的人希望能力越強越好，但產品的人希望用戶的需求滿足得越好。所以天然有很多不align的部分。很重要的一點就是要換位思考的能力。當然有很多技術的部分可以探討，但可能最難的部分其實反而是怎么樣去建立信任，怎么樣換位思考。

9. AI時代做產品的范式變了，從“預制菜”變成開放式服務

湯道生認為，做產品的第一性原理沒有變，最終還是奔著用戶到底有什么需求，怎么去解決他的痛點，怎么給用戶或者客戶創造價值。在不同的時代，甚至不同的行業，做一個產品還是需要能夠給用戶帶來價值，他才會買單，才會使用。

但是確實，在PC互聯網、移動互聯網時代做產品，跟今天在AI時代做產品，還是有蠻多不一樣的地方。首先從范式的角度來看，在AI時代以前，做產品很多時候想的是通過功能來滿足用戶的需求。作為一個產品提供方、服務提供方，要想清楚提供怎樣的能力，讓用戶可能通過界面、通過某些菜單去選擇。這有點像預制菜，用戶只能在里面點一樣。

但是在AI時代做產品，它這種開放式的服務形態會帶來很不一樣的要求和挑戰。用戶通過簡單的交互方式，可能是自然語言，可能是語音。作為產品方，你也不知道用戶會問什么，所以要充分利用模型能力去理解用戶的需求。然后，通過今天大模型的推理能力、調用工具的能力，產品給模型提供各種各樣可以使用的工具，來應對這種開放式的需求。

湯道生說，今天AI時代做產品，對能力的要求更全面，也更難了。尤其今年，大部分代碼都由AI生成。工程師可能會花更多時間去做設計、做架構設計，把寫代碼的工作交給AI，然后定期去指導一下、修正一下。測試也要左移，更前置地想清楚，針對各種案例、環境，以及對于開放式答案的一些要求，甚至alignment，怎么對齊用戶所需要的風格。

10. 姚順雨的博士論文在2019年就預見了今天，但他覺得自己“想的還是不夠大”

姚順雨透露，他重新讀了自己的博士論文，感覺又回到了一個很遠古的時代。他的博士論文的title叫做《Language Agent：from Next Token Prediction to Digital Automation》（語言智能體：從預測下一個Token到數字自動化）。那是2019年，七年前，那是GPT-2的時候，它當時只能做Next Token Prediction，而且它產生的可能一段話還不太連續，或者還有很多毛刺。所以當時人們是很難想象到，它會有一天成為一個改變世界的力量。

當時姚順雨的想象力比較狂野。他覺得GPT是一個非常優美的東西，吐下一個token是一個非常極簡且非常通用的事情。他覺得它有一天潛力不僅僅是在于吐下一個token，而是在于把這個世界上所有的事情全部automate。他當時想的是digital automation，但是現在看起來也有可能是digital and physical automation。

姚順雨的博士期間主要做兩部分。第一，如何建立一個Agent的方法論。如何把一個Next Token Prediction的機器變成一個Agent，變成一個自動化的機器。最重要的一篇工作可能是React。

他還記得22年7月份的時候，某一天晚上，當他第一次把當時是Palm 2的API和自己手寫的一個Wikipedia的API連在一起，然后它第一次可以基于這個網頁回答問題，并且多輪的交互的時候，他當時感覺就像微弱的電燈絲突然亮了的感覺一樣。據他所知，可能這是第一次人類把LLM和真正的互聯網連在一起，并且去做這種多輪的交互。

他當時的感覺這個可能在5年或者10年會改變這個世界。但是可能比想象中還要更快。包括當時第一次提出SWE-bench的時候，他覺得如果這個事情能做到，那很顯然它會帶來巨大的價值。當時可能是幾百億上千億，但現在可能是數萬億，數十萬億，可能想的還是太小了。

第二，怎么去定義Digital Automation的任務。比如說WebShop是第一個基于互聯網的Web Agent的task。然后包括InterCode和SWE-bench是最早的Coding Agent這樣的任務。現在看起來Agent的基礎最重要的兩個部分，確實是Web的Agent和Coding的Agent。

姚順雨說，他看博士論文的結尾，就是他在2024年的時候寫的future work，第一個是train models for agent，第二個是safety and robust deployment，第三個是scientific discovery，第四個是怎么樣去help human。他很感慨，說現在很幸運，確實在做當時列的future direction。可能想的還是不夠大，當時已經覺得自己想的夠大了，但可能還是不夠大。

關于Agent

11. Agent與Coding Agent已成為模型公司的基礎能力

姚順雨認為，今天Agent，尤其Coding Agent，有點像預訓練一樣，是每家模型公司都不得不做的基礎能力。Coding Agent之所以本質，是因為當模型能控制file system、擁有container時，它就接近一個complete system。

但他也強調，做好Coding Agent需要遠遠超過coding數據本身，還需要聊天、搜索、推理等綜合能力。因為大模型最重要的點是泛化性。騰訊的做法會更強調體系全面化、線上回流，以及對新范式的探索。

姚順雨提到，即使可能今天Coding Agent也是最重要的事情，但騰訊還是會強調體系的全面化。他始終認為，真的要把Coding Agent做好，其實需要的遠遠不止Coding Agent的數據。也需要聊天、指令遵循、推理，各種各樣不同的東西。

第二，產品的作用越來越重要。如何利用好線上的回流，是一個每一個模型廠商都在應對和思考的問題。這里騰訊積累了很多Co-Design的這些經驗會變得非常重要。

第三，還需要更多想象力。無論是技術的演進，還是產品的演進，還是甚至下一個范式的演進，騰訊還是需要做一些探索性的，甚至不確定性的工作。

12. 性價比的核心是performance，一次把簡單任務做對比模型架構更重要

湯道生提到，從產品側來看，大家越來越多有token焦慮的聲音，token成本持續爆發式增長。很多客戶，甚至用戶，包括身邊同事，也在緊盯積分消耗或者token消耗。怎么可以讓模型在解決某個問題、完成某一個任務時，token效率最高？

姚順雨認為，現在中國大家討論性價比，可能更多討論的是模型架構。但它其實是一個很復雜的體系。最重要的事情首先是performance。很多人跟他說，用一個更強的模型，有時候比用一個更弱的模型最后更省錢，因為你更快地把這個事情做對了，也省了人的精力。所以最重要的事情是performance。如果你的performance好，其實它就是性價比最關鍵的事情。

尤其今年，很多簡單任務的魯棒性會變得更加重要。如何一次把很多相對簡單的任務做對，這可能是性價比更關鍵的部分，而不僅僅是模型架構。

第二部分是成本。成本本身也是性價比的一部分。第一是“性”，如果性能不好，性價比就很難成立。第二是“價”，也就是成本。成本上，中國其實是領先于世界的，騰訊做了大量工作去優化成本。

成本里，可能最重要的事情是，怎么用一個更小的模型，把更高價值的任務做好。在這個基礎上，當然架構創新、長文管理、腳手架都有很多需要做的事情。但姚順雨個人看法是，如果能做一個相對較小的模型，同時又能夠比肩大模型的性能，而且在大部分任務上做到很強的robustness，這可能在很多長程的上面提升一兩個點的提升，可能在今天的中國更有價值。

13. 不同場景的Agent需要不同的context，這是騰訊的優勢

湯道生說，騰訊做的Agent，針對不同場景有不同的產品形態。在Agent設計上面，很大程度是發揮好模型能力，當然模型在迭代它能力越強Agent需要做的工作越來越少。騰訊好幾個產品在過去這段時間是隨著模型能力加強，可以把產品，把Agent做的更簡化，更多的給模型提供更多不同的工具，創造更多的skills，來讓模型能夠更高效的去完成任務。

給模型提供更多的所謂記憶，用戶過去使用一些習慣，能提取出來的一些用戶preference的信息作為上下文。在Coding環境有相關的context給到模型，在Workbuddy里邊辦公協作，做個PPT，可能大家關注的內容或者該給到模型的context也會不一樣。

所以在做不同的Agent，湯道生覺得更重要是了解場景下什么內容，什么信息，是重要的，比較relevant的，能夠跟模型配合好，讓模型有它需要的信息，同時也發揮它的能力。

14. AI時代的產品組織要更扁平化，每個工程師都是產品經理

湯道生透露，他前陣子在幫Workbuddy做一個組織發文，看了一下他們那個非常扁平化的組織，跟過去的其他產品組織架構有很大差異。更多小團隊三個人五個人，可能圍繞某一個領域來做攻堅，而且有很多試驗在里面，還要支持Infra做實驗，讓不同的小分隊可以去探索然后再驗證。因為試驗大部分拿不到正向反饋，也要包容團隊去試錯，這種通過大量試驗去提煉出對于用戶流程，對于想要的這個結果有正向幫助，這個是今天做Agent，做原生AI產品，這個組織形態要能夠比較好去支撐。

另外，原來可能有很多工程師有很多時間花寫代碼，但是今天毫無疑問他們這些工作可以交給AI了。所以會看到更多角色的融合，大家都是產品經理，都要去了解透徹用戶需求，以及設計出想要的產品形態。每一個工程師更像一個有想法的leader，驅動多個Coding Agent，針對想要的產品需求去做研發、開發。同時要參與評測、測試，比較前置，也用好AI能力，把這些質量保證工作，對齊工作要做到前面來。

15. 回應“騰訊AI慢了”，下半場剛剛開始，AI會是長期且多元的游戲

對于外界“騰訊慢了”的討論，姚順雨給出兩個判斷。

第一，AI是長期游戲，而不是短期游戲。在硅谷大家蔓延很多情緒，說兩年后所有人都要失業，AI要取代所有人的工作，要趕快賺兩年錢退休。但很顯然騰訊的判斷AI是一個長期游戲，其實AI剛開始，下半場才剛剛開始。姚順雨不認為ChatGPT和Claude Code會是唯一的super App，他覺得那是一個非常灰暗的世界，肯定會有源源不斷新的機會誕生。可能今天就像是70年代PC剛剛產生的時候，還有很多很多事情需要做。

第二，AI會變得更多元，而不是沿著單一主線前進。因為確實過去幾年大家能看到的是Pre-training、post training，然后Agent，Coding Agent，似乎有一個非常清晰的主線，這個主線是所有人都在做一樣的事情，都在copy，這也是非常灰暗的事情。但到底未來變得更單一還是更多元？姚順雨個人看法會變得更多元，毫無疑問Coding Agent生產力會變得更加重要，但這個世界還有很多空間沒有被填滿，多模態、具身智能，很多很多新的事情都在發生，或者剛剛發生。

所以從這個角度來說，如果認為下半場剛剛開始，可能確實不是完了。過去模型、產品做了很多探索，走很多彎路，姚順雨覺得這是正常的，如果沒有做過一個事情，第一次做肯定有曲折。但可能更重要的事情是能不能誠實面對自己，能不能Be Real，能不能夠去看到feedback然后去改變，能不能夠保持耐心，這個事情是下半場最重要的事情。

湯道生也回應說，大家對于騰訊經常喜歡挑某一個點來批評，當然騰訊也很歡迎大家給更高的要求。騰訊是一個非常多業態的公司，有很多產品分布在很多的賽道，同時也有很多的團隊在推進不同的項目、事情。所以毫無疑問，在這樣一個復雜的組織里面有一些地方可能做得快了，有的地方做得慢了，有一些地方可能會做失敗，在探索。所以這些提醒都非常好，確實有一些地方可以做得更好。

但就像姚順雨說的，這是一個長跑，這是一個馬拉松，騰訊還是有非常豐富的場景。就姚順雨一開始提到選擇騰訊，因為AI需要Context，模型需要很多的這些上下文，其實騰訊在過去多年不同產品，在不同賽道的這些積累，其實都是可以針對每一個場景去為模型提供有用的信息，提供這些Context來發揮價值。

在這樣一個長跑，湯道生相信模型會不斷迭代，用戶的需求也在不斷變化，也會有新的產品形態出現。比如說今年年初對Agent這一波熱潮也反應比較快。同時也有像WorkBuddy這樣的智能體產品，其實也是幾年前開始做的產品，沿著原來做Coding、CodeBuddy，慢慢看到非程序員也有很強的需求，也能比較快去應對，今天也聽到很多客戶對于不同產品怎么去組合起來有非常高的期待。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.