无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

姚順雨回應(yīng)“騰訊慢了”!AI 才剛剛開始,今天就像是70年代PC剛剛產(chǎn)生的時候

0
分享至

加入深圳的科學(xué)家姚順雨正面回應(yīng):

為何選擇加入騰訊?AI下半場在哪里?

6月5日上午消息,今日舉辦的2026年騰訊云AI產(chǎn)業(yè)應(yīng)用大會上,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生,對談騰訊首席 AI 科學(xué)家姚順雨,對話主題為騰訊AI下半場。

談及為什么選擇來到騰訊,姚順雨表示,“最重要的原因是文化,我記得第一次和你(湯道生)聊天的時候,包括和很多其他總辦的老板們聊天的時候,我的第一印象就是大家都非常的誠實,就是哪里做得好,哪里做得不好,都非常直白,不會去掩蓋,我覺得這種坦誠是我的第一個重要原因。”

姚順雨還談到,“第二個原因在于騰訊總體是一個基于trust,而不是基于metric去運轉(zhuǎn)的公司,我覺得這一點對于做AI是非常重要的,包括我們對長期主義的這種堅持。”

資料顯示,姚順雨畢業(yè)于著名的“清華姚班”,之后在普林斯頓大學(xué)進修計算機科學(xué)博士。2024年8月,姚順雨加入了OpenAI。在OpenAI期間,他擔任研究科學(xué)家,專注于將大型語言模型從理論研究推向?qū)嶋H應(yīng)用,特別是AI Agent的開發(fā)。據(jù)悉,其主導(dǎo)開發(fā)了OpenAI 首個發(fā)布的智能體模型及產(chǎn)品,同時參與了Deep Research項目。2025年姚順雨還入選《麻省理工科技評論》TR35榜單,成為該獎項中國區(qū)最年輕的入選者之一。

2025年12月,騰訊升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部,全面強化其大模型的研發(fā)體系與核心能力。姚順雨(Vinces Yao)出任“CEO/總裁辦公室”首席AI科學(xué)家,向騰訊總裁劉熾平匯報;同時兼任AI Infra部、大語言模型部負責(zé)人,向技術(shù)工程事業(yè)群總裁盧山匯報。

會上,湯道生向姚順雨提問,“很多的自媒體提到騰訊慢了,在AI 上面我們沒有及時的去抓住一些機會,你覺得我們真的慢了嗎?到底下半場是什么?”

對此,姚順雨答道,“今天我覺得有兩個重要的判斷,第一個就是說我們認為 AI 是一個短期的游戲,還是長期的游戲?在硅谷蔓延著很多情緒,就是說兩年后所有人都要失業(yè)了, AI 要取代所有人工作,那我們應(yīng)該趕快賺兩年錢,然后退休,這是一個判斷。我覺得,很顯然我們的判斷是這是個長期的事,其實我覺得 AI 才剛剛開始,從某種程度來說下半場才剛剛開始。我不認為 ChatGPT 和Claude Code會是唯一的 Super App,肯定會有源源不斷的新機會誕生。”

他繼續(xù)表示,“第二個判斷,就是說它會是一個更線性還是多元的游戲。我個人看法就是說,我覺得會變得更多元,我覺得它是一個剛剛開始的事情,還有很多新的事情都在發(fā)生,或者剛剛發(fā)生,從這角度來說,我認為下半場是剛開始,可能確實不是晚。”

姚順雨稱,“過去在模型、產(chǎn)品等方面做了很多探索,走了很多彎路,我覺得很正常。你如果沒有做過一個事情,那第一次做肯定還是會有曲折。但我覺更重要的事情是說,能不能誠實的面對自己,能不能夠 be real,能不能夠看到 feedback 去改變,能不能夠去保持耐心。”


湯道生、姚順雨對談騰訊AI的下半場!(附全文)

騰訊如何做AI?目標是什么?在2026騰訊云AI產(chǎn)業(yè)應(yīng)用大會上,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生提出了三個關(guān)鍵詞:實用、好用、可規(guī)模化。他說,騰訊做AI最核心的經(jīng)驗,就是扎根場景。真實場景里有用戶需求,也有模型迭代最需要的數(shù)據(jù);騰訊豐富的產(chǎn)品場景、交互數(shù)據(jù)和生態(tài)連接,既能為模型提供高質(zhì)量上下文,也能讓模型調(diào)用工具、連接系統(tǒng),真正完成任務(wù)閉環(huán)。

進入2026年以來,騰訊在AI方面的布局動作不斷加快,重新出發(fā)的混元大模型Hy3 preview以實用性和性價比著稱,發(fā)布以來連續(xù)數(shù)周登頂全球大模型API調(diào)用榜單OpenRouter周榜首位;騰訊AI桌面智能體WorkBuddy以DAU計已成為國內(nèi)最受歡迎的效率工具。

不斷清晰的目標,不斷迭代的經(jīng)驗,不斷加快的動作之后,進入AI下半場,騰訊在AI賽道的最新布局和思考是什么?湯道生和騰訊AI首席科學(xué)家姚順雨進行了同臺對話。

騰訊集團高級執(zhí)行副總裁湯道生與騰訊混元大模型及AI應(yīng)用負責(zé)人姚順宇展開深度對話,圍繞AI下半場定位、產(chǎn)品與模型關(guān)系、組織變革及行業(yè)趨勢進行系統(tǒng)闡述。


“下半場“的本質(zhì)是從找方法轉(zhuǎn)向找問題。 姚順宇指出,預(yù)訓(xùn)練和后訓(xùn)練讓方法論趨于成熟,真正的挑戰(zhàn)已變?yōu)椤罢业街档媒鉀Q的好問題”。騰訊擁有豐富產(chǎn)品場景和Context優(yōu)勢,這是他選擇加入的核心原因之一。而更深層的原因是文化,騰訊總辦團隊的坦誠務(wù)實、基于Trust而非Metrics運轉(zhuǎn)、Low Ego的氛圍,以及對長期主義的堅持,讓他認為騰訊適合構(gòu)建一個基于AGI的長期組織。


姚順宇強調(diào),產(chǎn)品為模型提供Context和真實場景數(shù)據(jù),模型為產(chǎn)品提供通用能力,兩者需深度耦合、建立互信。他明確表示實用性價值大于刷榜價值,基于真實用戶反饋發(fā)現(xiàn)問題比Benchmark更重要。LLM時代與過去AI最本質(zhì)的區(qū)別在于泛化性——即使只做一個Agent,也需要聊天、搜索、指令遵循、推理等復(fù)合能力。

訪談中,姚順宇還回憶了自己2022年首次將AI與真實互聯(lián)網(wǎng)連接時“像微弱電燈絲突然亮了“的感覺,感慨當年博士論文中寫下的四個Future Work,Train Models for Agent、Safe and Robust Deployment、Scientific Discovery、Help Human。如今正在逐一實現(xiàn),“但當時想的還是不夠大”。

以下是對談全文:

// 做模型與做產(chǎn)品,“第一性原理”是什么?

湯道生:非常歡迎順雨。

姚順雨:大家好。我平時都是在海淀區(qū),很少來朝陽區(qū),很高興。

湯道生:今天我們兩個對話,可能是一個比較新的形態(tài),如果有什么出乎意料的,我想也是給大家一個驚喜。順雨,你加入騰訊前,我記得我當時問過你一些問題 ,為什么下半場會選擇來騰訊?而且你認為AI下半場最重要的是什么?

姚順雨:首先解釋一下什么叫做下半場,我最近感覺這個詞有點被濫用,這個概念是我去年的一個博客提出來的,什么意思?其實我覺得在去年之前AI已經(jīng)發(fā)展幾十年,但是更加重要的是怎么去解決問題,去尋找好的方法,最近我覺得很明顯就是說方法論已經(jīng)變得非常成熟,但尋找問題變得更加困難。

舉個例子,比如說過去我們發(fā)明AIphaGo這樣的方法去下圍棋,但是這個方法只用來適合下圍棋或者下各種棋類。你會為了翻譯做一個特別的模型,但是它只能做翻譯,不能做其他事情。

但是有了預(yù)訓(xùn)練和后訓(xùn)練之后我們發(fā)現(xiàn),我們像有一個萬能錘子,它可以砸任何釘子,它是一個通用方法論,可以解決各種各樣的問題,反而更困難的是怎么尋找好的問題去解決。

其實我覺得加入騰訊很重要一點,就是說這里有很多好問題、有很多產(chǎn)品,我覺得這一點在接下來變得越來越重要。

一方面,好的產(chǎn)品能夠解決第一個問題:我們做預(yù)訓(xùn)練和后訓(xùn)練之后到底要把它應(yīng)用在什么地方產(chǎn)生價值;第二個是環(huán)境是非常重要的,如果沒有好的環(huán)境,那Agent沒有辦法做各種各樣的事情,比如說如果沒有一個點外賣的tool的話,就沒有辦法點外賣,很多事情做不到,我覺得最重要的是context,無論是企業(yè)還是個人,就像我上一次在AGI-Next說的一樣,我覺得越來越重要的事情是context,因為模型越來越擅長把一個非常復(fù)雜的輸入變成輸出,很多時候你的競爭壁壘就在于你有沒有最原始的輸入,你知不知道這個人他到底在干什么,你知不知道這個企業(yè)各種各樣的信息,這一點我覺得騰訊有非常強的優(yōu)勢。

但其實我覺得這只是第二大的原因,最重要的原因是文化,我記得我第一次跟你聊天,包括和其他總辦老板聊天的時候,我第一印象大家都非常誠實,哪里做的好哪里做的不好,非常直白不會掩蓋,我覺得這種坦誠是我第一印象。

第二個就是說騰訊總體是一個基于trust,而不是基于metric去運轉(zhuǎn)的公司,我覺得這一點對于做AI是非常重要的,包括我覺得我們的文化有非常low ego,有非常solid的這一面,我覺得這些文化對于長期做一個AI的組織是非常重要的,包括我們對長期主義的堅持,所以AI下半場最重要是什么?

我個人覺得就是,我們應(yīng)該在中國建立一個長期的基于AGI的組織,今天的AI主要有三部分:首先是foundation的部分,我們怎么樣把預(yù)訓(xùn)練和后訓(xùn)練最基礎(chǔ)的東西做得非常solid。第二部分是產(chǎn)品,我們怎么樣把這樣的技術(shù),真的為人和社會產(chǎn)生價值。第三個是frontier,我們怎么樣探索新的研究范式,探索新的機會。我覺得最重要的是我們構(gòu)建一個非常均衡的三角形一樣的組織。

我覺得對于做foundation來說:第一最重要的是有充足資源。第二就是需要正確的做事的方式,這些和我剛才說的文化也是吻合的。對于產(chǎn)品來說,有好的產(chǎn)品的sense,有這種做產(chǎn)品的人是至關(guān)重要的。第三個,在中國我們今天所做的前沿探索不夠多,所以我希望能把frontier exploration的精神能更多地注入到我們組織中。

湯道生:你提到的聊的過程中感受到的真誠或者務(wù)實的氛圍,也是經(jīng)常我跟客戶交流得到的反饋,我覺得我們的做事方式,做產(chǎn)品的理念,其實也是比較實事求是的,畢竟AI賽道是長跑,我覺得有時候認知也很重要,我們做的好的和不好的也得認,但關(guān)鍵是一個多維度的競賽,我們看到現(xiàn)在模型有很多進步,我們做產(chǎn)品其實也是有越來越多的形態(tài),不同的場景有不同的需求,我覺得未來還是非常可期的。

// Co-Design,模型和產(chǎn)品如何相互成就?

湯道生:你剛剛提到模型跟產(chǎn)品,產(chǎn)品可以說提供一個環(huán)境,里面要給模型提供context上下文,我想問一個問題,我們平時開會提的有一個詞比較多是Co-Design,怎么把產(chǎn)品關(guān)模型能夠比較緊密底結(jié)合起來,尤其今天有這么多豐富的產(chǎn)品,從我們合作非常緊密的像元寶這樣的一個聊天機器人,包括AI搜索,企業(yè)里面也有部署智能客服、智能營銷,另外最近非常火的類龍蝦像CodeBuddy、WorkBuddy這樣的產(chǎn)品,其實對于模型依賴很深,你怎么思考Co-Design這個方式?

姚順雨:有三點:首先CoDesign的前提就是說模型本身要做的很solid,有很多foundational的work要做好。首先我覺得預(yù)訓(xùn)練是一個相對就是產(chǎn)品agnostic的事情,它做的非常solid可以提供非常強的foundation,而且預(yù)訓(xùn)練它最大的特點就是它是一個可泛化學(xué)習(xí)過程,它的進步可以帶給各種各樣下游任務(wù)持續(xù)的價值提升。后訓(xùn)練我覺得最重要一點是要設(shè)立好正確的Eval,中國大家有個不好的傾向是大家喜歡刷榜,但是我覺得更重要的是如何實事求是的基于產(chǎn)品,基于真正的應(yīng)用,構(gòu)造更加真實的Eval。

第二要意識到可能“實用性”價值是大于刷榜價值,這一點我們做大量工作,跟各種各樣產(chǎn)品進行了深度Co-Design,Co-Design很關(guān)鍵一點就是要產(chǎn)生相互信任,這一點我們做了大量工作,取得互信,怎么把產(chǎn)品數(shù)據(jù)用好,怎么把回流,怎么把Eval做好,有很多細節(jié),我就不贅述。

第三點我想說,LLM時代和過去的AI最本質(zhì)的區(qū)別就是泛化性,在LLM之前比如說做翻譯產(chǎn)品,只要把翻譯數(shù)據(jù)做的特別好就行了。你做一個圍棋的程序,你只需要把圍棋的數(shù)據(jù)準備特別好就行。但是今天即使你想只做一個Coding Agent,你會發(fā)現(xiàn)其實需要的不僅是Coding Agent的數(shù)據(jù),你需要非常好的聊天能力,非常強的搜索能力,非常強的指令遵循能力,非常強的推理能力,它其實是非常復(fù)合的data的taxonomy,我覺得需要對這個事情有一個taste。

這個事情的推論就是說有很多產(chǎn)品的體系化地方,會有比較大的優(yōu)勢,比如說我們和元寶的Co-Design使我們模型產(chǎn)生很強的聊天和搜索能力,這樣的能力又可以被遷移到ima和Workbuddy其他的產(chǎn)品,所以這些產(chǎn)品能夠提供不同的數(shù)據(jù),但是這些數(shù)據(jù)之間又可以相互泛化,它形成一個像網(wǎng)絡(luò)一樣的體系,我覺得這一點的價值越來越重要。

湯道生:對,外部的榜也屬于Eval的一種,所以我們內(nèi)部做Eval跟外部的這種榜有什么區(qū)別?

姚順雨:首先benchmark還是有它的價值的,不是完全沒有價值,只是說這些榜非常容易overfitting。基于真實世界的數(shù)據(jù)會對模型的研發(fā)有幫助:首先就是你能發(fā)現(xiàn)模型很多底線問題,實際上我們先發(fā)一個Preview模型最主要的目的之一是希望能夠獲得真實世界反饋,能修復(fù)各種各樣榜單中沒有發(fā)現(xiàn)的問題,這個在會在正式版上面有很大的改進。

第二點,你對真實的Prompt distribution會有一個更深的了解。我舉個例子,比如說benchmark上面的這些題目可能它都是非常精確的,有非常長的concrete description,它可能一般來說是一個單純的問題,但是我們知道在現(xiàn)實場景中可能大家問的問題都是比較模糊的,可能就一兩句話,它會不停追問,這些場景可以啟發(fā)我們怎么去更好做這樣的訓(xùn)練。

第三點,我覺得甚至我們可以在這些產(chǎn)品上面獲得一些靈感去推進現(xiàn)在還沒有的榜單或者是沒有領(lǐng)域的推進,比如說我們最近做了很多Context learning的工作,包括元寶的反饋也給我們很大的啟發(fā)和幫助。所以我覺得產(chǎn)品和模型的互相成就是越來越重要的一個AI的話題。

湯道生:我記得我們早期做元寶的時候還碰到多輪遵循的問題,好像在使用產(chǎn)品,大家這種迭代Prompt的方式跟benchmark還有差異,真正在產(chǎn)品里面大家使用所需要的能力確實好像跟benchmark還有蠻大的差異的。

姚順雨:你問我這么多問題,我也問你一個問題。

湯道生:歡迎。

姚順雨:其實我記得我第一次跟您聊的時候,你跟我講了很多你過去的經(jīng)歷,從QQ空間、QQ秀的時代,一直到我小學(xué)時候最喜歡的產(chǎn)品。

到QQ音樂,到云到現(xiàn)在的元寶,其實跟你聊天很有意思,因為你做過各種各樣的產(chǎn)品,to C也有,to B也有,遠古時代的也有,最近AI時代的產(chǎn)品也有。我比較好奇,你覺得你做產(chǎn)品的第一性原理是什么,你覺得哪些經(jīng)驗和價值是不變的?哪些東西是變的?

湯道生:我覺得其實最終做產(chǎn)品還是本著用戶到底有什么需求,我到底怎么去解決他的痛點,怎么去給用戶或者客戶創(chuàng)造價值。在不同的時代,甚至不同的行業(yè),你做一個產(chǎn)品還是需要能夠給用戶帶來價值,他才會買單,才會使用。所以我倒覺得從PC互聯(lián)網(wǎng)時代我們做空間、移動的時代做各種各樣的產(chǎn)品、內(nèi)容的產(chǎn)品,到產(chǎn)業(yè)互聯(lián)網(wǎng)做云,其實我們也要花好多的時間、精力去聽客戶的聲音,嘗試去幫助他們?nèi)ソ鉀Q他的問題。底層的邏輯其實沒有這么大的變化。

但確實我覺得在PC互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)時代做產(chǎn)品跟今天在AI時代做產(chǎn)品還是有蠻多不一樣的地方。首先從范式的角度來看,在AI時代以前我們做產(chǎn)品很多時候想的是通過功能來滿足用戶的需求,你作為一個產(chǎn)品提供方、服務(wù)提供方,你想清楚我提供怎么樣的一個能力,讓用戶可能通過某些菜單去選,好像是一些“預(yù)制菜”,你只能在里面去點一樣。

但在AI時代做產(chǎn)品,它的那種開放式的服務(wù)形態(tài)就會帶來很不一樣的要求跟挑戰(zhàn),用簡單的交互方式可能是自然語言,可能是語音,其實作為產(chǎn)品方你也不知道用戶會問什么。所以要充分利用模型能力去理解用戶的需求,然后通過比如說今天大模型的這種邏輯推理,能去調(diào)用工具的能力,產(chǎn)品去給模型提供各種各樣可以用的工具,來應(yīng)對這種開放式的需求,這個是我覺得跟我們過去做產(chǎn)品很不一樣的地方。

甚至也包括你剛剛提到的Eval,以前我們做產(chǎn)品有很清晰很具體的產(chǎn)品的細節(jié)功能的描述,怎么去做設(shè)計、做研發(fā)、做測試,我覺得那個瀑布式的流程也比較清晰。但是做AI產(chǎn)品,我發(fā)現(xiàn)最大的變化是我們整個流程可能都要重新設(shè)計,尤其今年大部分的代碼都由AI生成,我們的工程師可能會花更多的時間去做設(shè)計,架構(gòu)的設(shè)計,把寫代碼的工作都交給AI了,然后定期去指導(dǎo)一下、修正一下。然后測試也要左移,更前置去想清楚針對我們各種案例Eval、環(huán)境,我們對于開放式答案的要求,甚至alignment怎么對齊,我們用戶所需要的那種風(fēng)格,我感覺今天時代做產(chǎn)品其實要求的能力更全面。

姚順雨:更難了。

湯道生:更難了。我問你一下混元3,大家都在說Hy3 preview是你騰訊的首秀,具體混元3做什么改變,你能給大家介紹一下嗎?

姚順雨:其實我覺得沒有什么秘密,今天做大模型從某種程度來說比較Trivial的事情,我們應(yīng)該把Infrastructure做好,我們應(yīng)該把數(shù)據(jù)做好,算法的部分反而是比較簡單的。其實我覺得主要幾個點吧。

第一,我們把Infrastructure重建了,無論是預(yù)訓(xùn)練還是強化學(xué)習(xí)。第二是我們把數(shù)據(jù)和EVA做了很大的改變,如何去定義更真實的問題,如何豐富數(shù)據(jù)的taxonomy,如何去提高數(shù)據(jù)的質(zhì)量,這是一個永無止境的追求。

第三,我覺得很重要的很多決策其實包括怎么去招人,怎么去設(shè)立模型的節(jié)奏,怎么去每天有很多的Decision 要考慮很多Trade off,我覺得可能沒有一個很清晰的公式,我覺得是一個很Taste driven的事情。所以我其實挺好奇問你一個問題的,因為您剛剛跟我討論Co-Design這個概念,我很好奇您對Co-Design這件事情是怎么想的,你覺得哪些事情是應(yīng)該模型做的,哪些是產(chǎn)品應(yīng)該做的?

湯道生:我覺得Co-Design在不同階段,過去這兩年其實是一直在變化的,我覺得這個變化某種程度來講是隨著模型能力的升級而變化,當然整個行業(yè)、市場、用戶的需求他在變化的過程中也會帶來我們兩邊模型跟產(chǎn)品需要更好去滿足。給我一個比較深的感受是怎么去對齊,因為在我們一起去做產(chǎn)品,去做對齊會的時候,我們有很多不同的決策,產(chǎn)品可能要針對某個方向去解決一些問題,模型到底怎么做去滿足這個需求,但是你要回到模型需要數(shù)據(jù),數(shù)據(jù)應(yīng)該怎么標注,到什么顆粒度,到底什么是好的標注,什么是不好的標注,因為有一些地方要獎勵,有一些地方要懲罰。

然后還有Eval,還有評測,因為如果產(chǎn)品認為好的產(chǎn)品體驗,評測是不認同的話,大家其實做出來的產(chǎn)品就會不一致了。所以Co-Design給我的感覺更多是在項目組里面不同的角色參與到產(chǎn)品的設(shè)計,定了一些產(chǎn)品的目標方向,怎么讓多個角色能夠?qū)τ谝恍╅_放式問題有比較好的對齊,如果沒有做到這樣一個對齊的話,你會發(fā)現(xiàn)產(chǎn)品的行為會不可預(yù)測。甚至有時候會有一些隨機性,因為模型訓(xùn)練的過程可能也被混淆了。所以這是我這兩年跟做產(chǎn)品跟模型團隊做Co-Design的一個比較深的感受。您覺得呢?

姚順雨:其實我是覺得,就像我剛剛說的,首先最難的一點是要建立Trust,畢竟我覺得同理心很重要,因為說到底做模型的目標和做產(chǎn)品的目標有很多align的部分,也有很多不align的部分。就是模型人希望我能力越強越好,但是產(chǎn)品的人覺得用戶需求越滿足越好。所以天然有很多不align的部分,我覺得很重要的一點是要有換位思考的能力。

其實就是你剛剛問我元寶我們是怎么一步一步Co-Design的,其實一個很重要的細節(jié)是,我們當時是派了后訓(xùn)練最強的骨干力量,去幫助元寶把后訓(xùn)練做好。當時我們自己的預(yù)訓(xùn)練還沒有準備好,但是我們知道維護元寶這樣的產(chǎn)品以及它的DAU會對我們接下來做模型也非常非常重要,而且對于創(chuàng)新的合作非常重要。

所以當時其實很多算法同學(xué)不理解,我需要去很努力解釋,但是現(xiàn)在看起來這些努力都是Trade off,我覺得這樣一個動作讓產(chǎn)品意識到模型的同學(xué)是真的在為產(chǎn)品著想,我覺得這個其實對于我們之后的合作,包括Hy3 preview在元寶上成功上線起到了非常重要的作用。當然有很多技術(shù)的部分可以探討,但是最難的部分反而是怎么樣建立信任,怎么樣換位思考。

湯道生:對,非常認同。

// Agent技術(shù)往哪走?產(chǎn)業(yè)怎么落?

湯道生:我換一個話題,你是ReAct架構(gòu)的提出者,博士研究也是圍繞著語言智能體展開的,你幾年前的一些觀點到今天兌現(xiàn)了嗎?比如有哪些?

姚順雨:那天我挺感慨的,我重新讀了自己的博士論文,感覺又回到一個很遠古時代,我的博士論文的title叫做《language Agent from next token prediction to digital automation》,是2019年。

湯道生:7年前。

姚順雨:那個時候Literally就是我們的GPT2,那個時候它只能做Next token prediction,而且它產(chǎn)生一段話不太連續(xù),或者有很多毛刺,所以當時人們很難想象到它有一天成為一個改變世界的力量,當時我覺得可能大家做的研究,稍微有想像力做一些研究,比如說中國首都是,如果做Next token prediction它會回答北京,somehow它是一個有Knowledge的事情,能做到這一點大家當時非常開心,覺得這個技術(shù)很有意思。

當時我的想象力比較狂野,我覺得GPT是一個非常優(yōu)美的東西,吐下一個Token是一個非常極簡且非常通用的事情,我覺得它有一天潛力不僅僅是在于吐出下一個Token,而在于把這個世界上所有的事情全部automate,我當時想的還不夠大,我想的是digital automation,但是現(xiàn)在看起來也有可能是digital and physical automation。

我覺得其實我博士期間主要做兩部分,第一部分就是如何建立一個Agent方法論,如何把一個Next Token prediction的機器變成一個Agent,變成一個自動化的機器,最重要的工作可能是你說的react。

我記得2022年7月份的時候某一天晚上,當我第一次把Pump two的API和當時手寫的一個Wikipedia API連在一起,它第一次可以基于這個網(wǎng)頁回答問題,并且多輪交互的時候,我當時感覺就像微弱電燈燈突然亮的感覺一樣,我感覺據(jù)我所知,人類第一次把LLM和互聯(lián)網(wǎng)連在一起并且做多輪交互,我當時的感覺是,這個感覺可能在5年或者10年會改變這個事情,但是可能比我想象中還要更快。

我記得當時我們第一次提出SWE-bench的時候,我覺得OK,如果這個事情能做到,那很顯然它會帶來巨大價值,當時可能是幾百億、上千億,但現(xiàn)在可能是數(shù)萬億,數(shù)是萬億,可能我想的還是太小了。

另一部分我做的工作就是怎么定義Digital automation的任務(wù),比如說WebShop是第一個基于互聯(lián)網(wǎng)的Web Agent task,包括InterCode和SWE-bench是最早的Coding Agent這樣的任務(wù)。現(xiàn)在看起來Agent技術(shù)最重要兩個部分確實是外部Agent和Coding Agent。

那天我在群里跟大家聊天,我看我博士論文結(jié)尾,就是我在2024年寫我的future work,第一個是train models for Agent,第二個是shift and robust deployment,第三個是scientific discovery,第四個是怎么樣去help human,我很感慨,我說我現(xiàn)在很幸運確實在做當時列的future direction。

湯道生:太厲害了,都一一看到整個行業(yè)這些方向在推進。

姚順雨:可能想的還是不夠大,我覺得已經(jīng)覺得自己想的夠大了,但是可能還是不夠大,我覺得。

湯道生:技術(shù)的發(fā)展往往超乎我們的預(yù)期。智能體今天大家都說需要消耗很多的Token,Token的調(diào)用,這對于混元做下一代模型研發(fā),你覺得什么是你的側(cè)重,有哪些地方比較重要?

姚順雨:毫無疑問今天Agent或者Coding Agent有點像預(yù)訓(xùn)練一樣,是不得不做的事情,是最基礎(chǔ)能力。我個人覺得Coding Agent非常本質(zhì)有很多原因。還有一個重要原因就是說它是一個優(yōu)點像圖靈完備的事情,當你有能力去控制自己的file system,當你有一個container的時候,其實你是一個complete這樣一個system,今天我覺得Agent毫無疑問是每一家模型所發(fā)力的重點,我覺得我們做的方法可能會有幾個區(qū)別:

第一,即使今天Coding已經(jīng)是最重要的事情,但是我們還是會強調(diào)體系的全面化,我始終認為要把Coding做好,其實需要遠遠不止Coding的數(shù)據(jù),也需要聊天、推理,各種各樣不同的東西,因為大模型最重要的點是泛化性。

第二,很顯然產(chǎn)品作用越來越重要,如何利用好線上回流,我覺得是一個每個模型廠商都在應(yīng)對和思考的問題。這里剛剛積累很多CoDesign經(jīng)驗變得非常重要。

第三,我覺得還需要更多想象力,無論是技術(shù)演進,還是產(chǎn)品演進,甚至下一個范式演進,我們需要做探索性甚至不確定性的工作。

湯道生:從產(chǎn)品側(cè),因為大家越來越多有Token焦慮的聲音,Token成本爆發(fā)式增長,我也聽到很多客戶甚至用戶身邊的同事們也在緊盯著積分消耗或者Token消耗,怎么可以讓我們的模型在解決某個問題,或者完成某個任務(wù),Token效率貴高,我之前做過一些任務(wù)可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型還會試,試完之后走不下去再試下一個,里面有什么可以optimize的地方讓Token整體使用效率更高?

姚順雨:我覺得在中國討論性價比更多討論模型架構(gòu),但其實它是很復(fù)雜的體系,我覺得最重要的是首先是你的performance,很多人跟我說,他最后發(fā)現(xiàn)用OPUS這樣的模型比用更差的模型更省錢,因為更快的把這個事情做對了,也省得人的精力,最重要的事情是performance,如果你的performance好,性價比是最關(guān)鍵的事情。尤其我覺得今年可能很多簡單任務(wù)的robustness會變得更加重要,一次把相對簡單任務(wù)做對,這可能是性價比更關(guān)鍵的部分,不僅是模型架構(gòu)。

第二部分就是成本它本身,性價比第一是性能,如果性能不好性價比無從談起。

第二點是成本,中國是領(lǐng)先于世界的,就是我們做大量工作優(yōu)化我們的成本,成本可能最重要的事情是怎么用一個更小的模型把更高的價值任務(wù)做好,在這基礎(chǔ)上架構(gòu)創(chuàng)新,包括長文管理,腳手架有很多需要做的事情。

如果我們做一個相對較小的模型,但是它比肩大模型性能,而且在大部分任務(wù)上做很強的robustness,這可能在很多長程的上面提升一兩個點的提升,可能在今天的中國更有價值。

我很好奇,您覺得Agent,你是什么時候意識到它是一個什么新的產(chǎn)品的機會,以及你現(xiàn)在認知是什么,你覺得現(xiàn)在我們離一個好用的Agent bottlenck在哪里呢?

湯道生:我們做的Agent,針對不同場景有不同的產(chǎn)品形態(tài),在Agent設(shè)計上面,很大程度是發(fā)揮好模型能力,當然模型在迭代它能力越強Agent需要做的工作越來越少,我看我們好幾個產(chǎn)品在過去這段時間是隨著模型能力加強,我們可以把產(chǎn)品,把Agent做的更簡化,更多的給模型提供更多不同的工具,創(chuàng)造更多的skills,來讓模型能夠更高效的去完成任務(wù),給模型提供更多的我們叫記憶,用戶過去使用一些習(xí)慣,我們能提取出來的一些用戶preference的信息作為上下文,在Coding環(huán)境有相關(guān)的context給到模型,在Workbuddy里邊辦公協(xié)作,做個PPT,可能大家關(guān)注的內(nèi)容或者該給到模型的context也會不一樣。

所以在我們做不同的Agent,我覺得更重要是了解場景下什么內(nèi)容,什么信息,是重要的,比較relevant的,能夠跟模型配合好,讓模型有它需要的信息,同時也發(fā)揮它的能力。

姚順雨:最近我們確實推出一些像WorkBuddy口碑不錯的產(chǎn)品,背后很多小團隊在快速迭代產(chǎn)品,我其實挺好奇,相對于傳統(tǒng)的產(chǎn)品研發(fā),你覺得在新的Agent時代的研發(fā)和組織管理上,產(chǎn)品團隊發(fā)生什么變化,你的思考是什么?

湯道生:我前陣子在幫WorkBuddy做一個組織發(fā)文,我看了一下他們那個非常扁平化的組織,跟我們過去的其他產(chǎn)品組織架構(gòu)有很大差異,更多小團隊三個人五個人,可能圍繞某一個領(lǐng)域來做攻堅,而且有很多試驗在里面,還要支持Infra做實驗,讓不同的小分隊可以去探索然后再驗證,因為試驗大部分拿不到正向反饋,我們也要包容團隊去試錯,這種通過大量試驗去提煉出對于用戶流程,對于我們想要的這個結(jié)果有正向幫助,這個是我覺得今天做Agent,做原生AI產(chǎn)品,這個組織形態(tài)要能夠比較好去支撐。

另外,原來可能有很多工程師有很多時間花寫代碼,但是今天毫無疑問他們這些工作可以交給AI了,所以我們會看到更多角色的融合,大家都是產(chǎn)品經(jīng)理,都要去了解透徹用戶需求,以及設(shè)計出我們想要的產(chǎn)品形態(tài),每一個工程師更像一個有想法的leader,驅(qū)動多個Coding Agent,針對我們想要的產(chǎn)品需求去做研發(fā)、開發(fā)。同時要參與評測、測試,比較前置,也用好AI能力,把這些質(zhì)量保證工作,對齊工作要做到前面來。

// AI下半場,新的機會在哪里?

湯道生:我也想再問一下一個可能大家比較多討論的一個問題,其實很多人都會提到騰訊慢,說在AI上面我們沒有及時抓住一些機會,你覺得我們真的慢了嗎?到底下半場是什么?你能再多說一下嗎?

姚順雨:感覺應(yīng)該是我問你的問題。

湯道生:哈哈。

姚順雨:我覺得首先AI其實今天有兩個重要判斷,第一個就是說我們認為AI是一個短期的游戲還是長期游戲?在硅谷大家蔓延很多情緒,哎呀,2年后所有人都要失業(yè),AI要取代所有人的工作,我們要趕快賺2年錢退休。但很顯然我們的判斷AI是一個長期游戲,其實我覺得AI剛開始,下半場才剛剛開始,我不認為ChatGPT和CloudCode會是唯一的super APP,我覺得那是一個非常灰暗的世界,我覺得肯定會有源源不斷新的機會誕生。

可能今天就像是70年代PC剛剛產(chǎn)生的時候,我覺得還有很多很多事情需要做。

第二個判斷,它會是個更線性還是多元游戲?因為確實過去幾年大家能看到的是Pre-training、post training,然后Agent,Coding Agent,似乎有一個非常清晰的主線,這個主線是所有人都在做一樣的事情,都在copy,這也是非常灰暗的事情。

但未來變得更單一還是更多元?我個人看法會變得更多元,毫無疑問Coding Agent生產(chǎn)力會變得更加重要,我覺得它是剛剛開始的事情,這個世界還有很多空間沒有被填滿,但是多模態(tài)、具身智能,很多很多新的事情都在發(fā)生,或者剛剛發(fā)生,所以從這個角度來說,如果我們認為下半場剛剛開始,可能確實不是完了。

過去模型、產(chǎn)品做了很多探索,走很多彎路,我覺得這是正常的,你如果沒有做過一個事情,第一次做肯定有曲折,但是我覺得可能更重要的事情是說能不能誠實面對自己,能不能Be Real,能不能夠去看到feedback然后去改變,能不能夠保持耐心,這個事情是下半場最重要的事情。

湯道生:大家對于騰訊經(jīng)常喜歡挑某一個點來批評,當然我覺得我們也很歡迎大家給我們提更高的要求。

我們是一個非常多業(yè)態(tài),很多產(chǎn)品在很多的賽道,同時也有很多的團隊在推進不同的項目、事情。所以毫無疑問,在這樣一個復(fù)雜的組織里面有一些地方可能我們做得快了,有的地方做得慢了,有一些地方可能會做失敗,在探索。所以我覺得這些提醒都非常好,我覺得確實有一些地方我們是可以做得更好,但是就像你說的,這是一個長跑,這是一個馬拉松,騰訊還是有非常豐富的場景。

就你一開始提到選擇騰訊,因為AI需要Context,模型需要很多的這些上下文,其實騰訊在過去多年不同產(chǎn)品,在不同賽道的這些積累,其實都是可以針對每一個場景去為模型提供有用的信息,提供這些Context來發(fā)揮價值。

在這樣一個長跑,我相信模型會不斷迭代,用戶的需求也在不斷變化,也會有新的產(chǎn)品形態(tài)出現(xiàn),我覺得我們比如說今年年初對AI這一波熱潮也反應(yīng)比較快。同時也有像WorkBuddy這樣的智能體產(chǎn)品,其實也是幾年前開始做的產(chǎn)品,沿著原來做Coding、CodeBuddy,慢慢看到非程序員也有很強的需求,我們也能比較快去應(yīng)對,今天也聽到很多客戶對于我們的不同產(chǎn)品怎么去組合起來有非常高的期待。

所以我們正在長跑中,也請各位多給我們提醒,給我們建議,也多用我們的產(chǎn)品來給我們正向的反饋。

我看時間其實都超時了,我想我來首先感謝順雨今天的分享,我們剛才其實圍繞了做模型、做產(chǎn)品,談到了Co-Design,談到了Agent的演進,也提到了組織變革,行業(yè)的一些機會,在過去一年其實我們看到非常多企業(yè)也有共同的困惑或者面臨同樣的挑戰(zhàn)。產(chǎn)品如果用不好,企業(yè)不能持續(xù)去投入,或者ROI不夠,這都會影響AI在企業(yè)里面普及的進度。

為此,其實我們今天也會發(fā)布一套效率智能體的工具集,幫助企業(yè)可以更安全、更高效去部署應(yīng)用的智能體。

這背后有騰訊的三個核心能力:第一是場景聯(lián)接的能力,通過騰訊的微信、企業(yè)微信、元寶等等高頻的場景觸點,來把大模型嵌到真實的業(yè)務(wù)流,跟用戶、數(shù)據(jù)、生態(tài)能夠深度聯(lián)接。

第二是工程的駕馭能力,通過完整的Harness體系,讓Agent能夠穩(wěn)定、可信、可持續(xù)運行,具備強大的AI Infra,讓包括高速的網(wǎng)絡(luò)、高吞吐的存儲,還有高性能的Agent Runtime來保證GPU的高利用率。

第三是模型驅(qū)動力,依托混元大模型和模型產(chǎn)品 Co-Design ,兼顧實用性、性價比和 ROI。

同時 ,我們也啟動“騰訊AI共創(chuàng)營(二期)”, 攜手ISV、MSP伙伴,一起共創(chuàng)行業(yè)解決方案,打造更多的標桿案例。

接下來的環(huán)節(jié),我的同事將圍繞這些內(nèi)容做進一步分享。今天下午我們將圍繞個人、企業(yè)提效多個場景設(shè)置產(chǎn)品技術(shù)、行業(yè)場景與生態(tài)共創(chuàng)等多個平行論壇,以及AI產(chǎn)品發(fā)布專場,把20多個新產(chǎn)品、新能力介紹給大家。

今天我們的對談到這里,謝謝順雨 ,感謝大家!

來源:騰訊

為偉大思想而生!

AI+時代,互聯(lián)網(wǎng)思想(wanging0123),

第一必讀自媒體

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
C羅常年體脂率7%,梅西8%!他們的身材,都是怎么保持的?

C羅常年體脂率7%,梅西8%!他們的身材,都是怎么保持的?

馬拉松跑步健身
2026-06-17 21:17:32
美伊談判,大消息!特朗普最新表態(tài)!國際油價拉升!美股突變,芯片股下挫!

美伊談判,大消息!特朗普最新表態(tài)!國際油價拉升!美股突變,芯片股下挫!

證券時報e公司
2026-06-17 07:47:00
2026 河北清北保送完整名單曝光!競賽路大幅收緊這條路還值得走嗎

2026 河北清北保送完整名單曝光!競賽路大幅收緊這條路還值得走嗎

一口娛樂
2026-06-18 02:27:13
吳清最新發(fā)聲:將嚴查借科技之名炒概念行為,A股多項新政即將發(fā)布

吳清最新發(fā)聲:將嚴查借科技之名炒概念行為,A股多項新政即將發(fā)布

東方豪俠
2026-06-17 18:29:26
東山精密:目前光芯片業(yè)務(wù)相關(guān)利潤水平符合預(yù)期 盈利空間會進一步提升

東山精密:目前光芯片業(yè)務(wù)相關(guān)利潤水平符合預(yù)期 盈利空間會進一步提升

每日經(jīng)濟新聞
2026-06-17 21:37:18
我給省長當秘書對外只說會開車,和老婆去同學(xué)聚會,被嫌棄寒酸

我給省長當秘書對外只說會開車,和老婆去同學(xué)聚會,被嫌棄寒酸

曉悅流年
2026-06-16 17:47:41
“蘇超”出圈 江蘇分管文體副省長陳忠偉“入常”

“蘇超”出圈 江蘇分管文體副省長陳忠偉“入常”

新浪財經(jīng)
2026-06-17 22:31:11
籃網(wǎng)獲2026NBA選秀6號簽

籃網(wǎng)獲2026NBA選秀6號簽

體壇周報
2026-06-17 22:45:24
死亡率降13%,超時無效!哈佛大學(xué):力量訓(xùn)練每周90-119分鐘最佳

死亡率降13%,超時無效!哈佛大學(xué):力量訓(xùn)練每周90-119分鐘最佳

時光派長壽觀察
2026-06-17 18:15:07
無解的陽謀!菲律賓傻眼,美國做夢也不敢想,黃巖島中國會這樣干

無解的陽謀!菲律賓傻眼,美國做夢也不敢想,黃巖島中國會這樣干

阿訊說天下
2026-06-18 03:07:50
突發(fā)心梗,浙江一公交車司機在昏迷43秒后掙扎醒來,踩下生命中最后一腳……

突發(fā)心梗,浙江一公交車司機在昏迷43秒后掙扎醒來,踩下生命中最后一腳……

都市快報橙柿互動
2026-06-18 00:30:51
董路回應(yīng)與孫臣曦一家已經(jīng)斷絕來往,才懂"幫得越多,恨得越深"

董路回應(yīng)與孫臣曦一家已經(jīng)斷絕來往,才懂"幫得越多,恨得越深"

觀星娛記
2026-06-17 11:45:12
日本天皇發(fā)出警告,接班人已浮現(xiàn),對華態(tài)度不簡單

日本天皇發(fā)出警告,接班人已浮現(xiàn),對華態(tài)度不簡單

怪味歷史連連看
2026-06-16 21:43:17
月跑300公里查出癌癥!南京跑友大璐璐,熬夜加5點晨跑警示所有人

月跑300公里查出癌癥!南京跑友大璐璐,熬夜加5點晨跑警示所有人

星娛叨叨社
2026-06-17 14:21:21
C羅獲最低分!葡萄牙首秀被逼平大跌眼鏡:3個現(xiàn)象太反常

C羅獲最低分!葡萄牙首秀被逼平大跌眼鏡:3個現(xiàn)象太反常

邱澤云
2026-06-18 03:56:59
英格蘭王牌太冤了!踢爆英超卻無緣世界杯!圖赫爾的理由太雙標

英格蘭王牌太冤了!踢爆英超卻無緣世界杯!圖赫爾的理由太雙標

瀾歸序
2026-06-17 07:52:20
白嫖女化妝師底褲被扒光!家住高端小區(qū)愛健身,4年薅羊毛近百萬

白嫖女化妝師底褲被扒光!家住高端小區(qū)愛健身,4年薅羊毛近百萬

普陀動物世界
2026-06-17 16:53:07
雷軍又被網(wǎng)暴!攝像頭前吃早餐,被罵模仿黃仁勛,網(wǎng)友不給面子

雷軍又被網(wǎng)暴!攝像頭前吃早餐,被罵模仿黃仁勛,網(wǎng)友不給面子

譚談社會
2026-06-16 18:10:12
1-2大冷門,世界第7遭世界第142掀翻,高芙止步柏林站16強

1-2大冷門,世界第7遭世界第142掀翻,高芙止步柏林站16強

凌空倒鉤
2026-06-18 03:45:13
美聯(lián)儲“鷹”聲四起 美股三大股指跳水收跌

美聯(lián)儲“鷹”聲四起 美股三大股指跳水收跌

中新經(jīng)緯
2026-06-18 05:01:46
2026-06-18 06:31:00
互聯(lián)網(wǎng)思想 incentive-icons
互聯(lián)網(wǎng)思想
AI時代,互聯(lián)網(wǎng)思想觀察
2508文章數(shù) 16918關(guān)注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊史世界杯首分

頭條要聞

C羅啞火!葡萄牙1-1爆冷 送民主剛果隊史世界杯首分

體育要聞

梅西帽子戲法:紀錄厚重,球王輕盈

娛樂要聞

陳紅一反常態(tài)保持沉默

財經(jīng)要聞

拉加德警告:AI可能引爆下一場金融危機

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
旅游
軍事航空

藝術(shù)要聞

235米!曼谷地標“金字塔”動工,BIG操刀

親子要聞

你把我也嚇一跳,真的沒必要

家居要聞

綠意盎然 自然之境

旅游要聞

南博“朋友圈”|在普洱,一群年輕人要造一顆“土星”

軍事要聞

美被指拒絕以色列看美伊諒解備忘錄

無障礙瀏覽 進入關(guān)懷版