大數據文摘受權轉載自智源社區
2026年以來,“Agent”正在加速從學術概念走向產業落地,而諸葛鳴晨已在這條賽道上深耕數年。
![]()
圖注:諸葛鳴晨
他的博士生涯始于論文 Mindstorm,該工作系統描繪了智能體社會的整體圖景及其潛在經濟形態。此后,他又以共同第一作者身份主導完成了 MetaGPT,使其迅速成為近年來智能體編程領域最具代表性、也最具影響力的現象級工作之一;與此同時,他也是 OpenHands(原 OpenDevin)的早期核心貢獻者。
圍繞 Agent 系統方法論,他進一步發展出 GPTSwarm,將多智能體建模為可優化的圖(graph),為 Agent 的系統化構造與演化開辟了新路徑;他提出的 Agent-as-a-Judge,則切中了長時程任務自動評估這一關鍵瓶頸,為持續迭代優化提供了核心機制。尤其值得一提的是,早在 2023 年,他便已在 MetaGPT 附錄中明確指出,“recursive self-improvement” 與 “learning from experience” 將構成 Agents 下一階段發展的核心方向,顯示出極強的前瞻判斷力。
這位師從 Jürgen Schmidhuber 的 KAUST 博士生,早在 2021 年就將博士研究錨定為多模態 Agent。回看他的路徑,核心是一件事:更早判斷方向,并把判斷落成研究。
Agent 的未來究竟是怎樣的圖景?長時程任務中智能體該如何實現自我評估?被調侃為“老頑童”的導師又給他帶來了怎樣的科研啟迪?在這篇深度專訪中,他將圍繞 Agent 技術演進的關鍵路徑展開分享,深入討論智能體社會、智能體經濟、自動化評估與遞歸自我改進(RSI,Recursive Self-Improvement)以及神經計算機(NC,Neural Computer)。
采訪&編輯:夢佳 迪陽
要點速覽
研究起點與選擇:2021年末將博士課題鎖定為多模態智能體(Multimodal Agents);并始終認為Coding Agent是最易落地、最具商業價值的方向。
Agent進化的核心引擎:他判斷下一階段突破將集中在 recursive self-improvement,Agent-as-a-Judge 則為長時程任務提供自動評估信號。
開源實踐:深度參與 MetaGPT,用角色分工與 SOP 規范化破解大模型幻覺與上下文瓶頸;提出 GPTSwarm,將 Agent 創新性地抽象為圖結構,讓智能體的構建與優化等價于對節點(Node)與邊(Edge)的系統性求解。
“現代AI之父”的言傳身教:導師 Jürgen Schmidhuber 不僅在學術寫作上嚴謹嚴格,更在合作項目中親自撰寫“Economy of Mind”章節,為其注入了“Agent 社會將由經濟規律驅動”的超前洞察。
未來方向:(1)即將推出 “Neural Computer”。(2)Agent 將從代碼編寫全面滲透至日常全場景,始終堅信:人類具備強的適應力與創造性,越早擁抱AI的收益會越大。
智源專訪欄目意在展現行業頂尖技術研究者和創業者的研究經歷和故事,記錄技術世界的嬗變,激發當代AI從業者的創新思維,啟迪認知、關注突破性進展,為行業注入靈感光芒。本次專訪為總第36期。
簡介:諸葛鳴晨是沙特阿卜杜拉國王科技大學(KAUST)的計算機科學博士生,青源會成員,師從被譽為“LSTM之父”的Jürgen Schmidhuber教授。他的研究領域集中于大語言模型和多模態智能體。他曾在Meta AI實習,博士就讀前,曾在微軟、阿聯酋起源人工智能研究院和阿里巴巴等知名機構任職。他以第一作者身份在ICML、ICLR、CVPR、TPAMI等頂級會議和期刊上發表了多篇論文,榮獲NeurIPS研討會最佳論文獎,EMNLP杰出論文候選,CVPR杰出審稿人等獎項,論文累計被引用近5500次。最近2年,他積極參與的開源項目共取得約130K Stars。此外,他近幾年智能體的研究工作在頂級ML會議共獲得6次口頭報告(Oral Presentation)。他發起并組織了ICLR 2026遞歸自我改進(RSI)研討會,同時擔任COLM 2026與CAIS 2026的領域主席(Area Chair)。
01
于浪潮未至時落子:研究課題和個人選擇
"我不太在乎agent最終的呈現形式,但我非常喜歡這個課題,未來大家都會從multimodal agent中受益。"
Q1:博士就讀前你曾在微軟、阿聯酋起源人工智能研究院等機構,圍繞多模態預訓練和大語言模型開展研究,是什么契機讓您在2021年末申請博士時,將研究方向鎖定在多模態智能體領域?
諸葛鳴晨:那是2020年,確實我在讀博之前做的是多模態預訓練 (VLP),是受到VLBERT、ViLBERT等工作的啟發,但當時國內做這塊比較多的主要是微軟和阿里。在阿里碰到了對前沿課題非常感興趣的manager。盡管多模態在那個時間點是作為區別于NLP和CV的獨立課題存在的,但我認為未來任何子topics都會圍繞“多模態”展開的。在阿里的時期,我在CVPR2021發表了名為 Kaleido-BERT的工作。盡管當時整個CVPR 2021多模態預訓練的工作似乎就5篇左右,我覺得這個 topic 未來會很火熱。
但當時,大多數相關工作都是基于BERT等工作,參數量遠遠不夠,所以大多停留在基礎的多模態Understanding,具體任務基本是圖片描述、圖文相互檢索、以及分類,應用,主要以拿到好的embeddings來服務搜推廣,距離具備推理和規劃能力的 Agent 還很遠。所以離 reasoning(推理)及真正能夠做 planning(規劃)還差得很遠。所以我申請博士時,研究提案就叫“多模態智能體”(Multimodal Agent),希望現有的模型能夠跟真實環境進行交互。
我對agent的最初想象,不完全來自論文,也來自幾部科幻電影,比如:a. 《生化危機》里以全息影像現身的"紅皇后",背后是一個真正在決策、在控制整個設施的AI;b. 《機械姬》讓我開始認真思考智能體的主體性和具身化;c. 《頭號玩家》則讓我想象,agent在數字世界里會以什么方式存在和演化。
![]()
圖注:電影《生化危機》
所以我當時寫 proposal 的時候就說,其實有一個很明確的想法:我并不太在意Agent 最終會以什么形式出現,但會考慮哪個方向更能直接產生影響力。我非常喜歡這個課題,并且覺得未來它一定能夠得到廣泛的應用,大家都會從 multimodal agent 中受益。
Q2:在眾多AI細分領域中,Agent領域兼具學術深度與工程落地潛力,您認為這個領域最吸引您的核心特質是什么?有沒有某個具體的研究場景或問題,讓您當時就判斷一定值得投入研究?
諸葛鳴晨:說實話,對于PhD而言,真正可用的窗口并不寬裕,所以更需要選擇那些長期繞不開的問題。Agent的本質,就是讓日常或非日常任務自動化。如果堅信這一點,那么未來可能很多研究方向,最終都會繞不開 agents。
最開始ChatGPT 只能寫20到100行代碼,而且你可能還得自己去編譯、去修改。并且一開始基礎模型的context window只有2k到4k,也就是遠遠不夠用來理解一個repo級別的代碼的。但那時候我就覺得 Agent 在這個領域能夠產生非常大的價值。作為研究課題,當時也有足夠多低垂果實。比如ICLR 2024的Oral Papers,關于Coding Agents的唯二工作,一篇是MetaGPT,另一篇是SWE-Bench,在后面的影響力都挺大的。
![]()
圖注:ICLR 2024的Oral Papers
Q3:2021年放棄大廠的offer,gap之后申請博士,您認為這個選擇背后,除了對科研的熱愛,還有哪些關鍵考量?
諸葛鳴晨:和我同期去阿里實習的人,我認識的其他10人都加入了阿里或者其他大廠,我反而成了少數派。因為那個時候,阿里是世界市值第6的公司,彼時Facebook我記得是第7。并且我在的team同事都很nice,所以我個人其實很喜歡阿里。這確實讓我認真糾結過一段時間。
我對科研確實有興趣,這是一部分原因。不過在碩士畢業前,也就是 2020 年底到 2021 年初那段時間,我和室友結合一些宏觀指標、房地產數據以及政策變化,做過一個比較樸素但也比較務實的判斷:從當時往后看,未來 5 年大概率會是一段不太明朗的周期。
去讀博某種意義上不僅剛好可以把這段周期“覆蓋”過去,而且對于整個人生來說,也算是一筆不錯的投資。
當然,趨勢是會變化的。假如現在讓我給面臨類似選擇的學弟學妹一些建議,我會覺得:在當下這個階段,做 AI 研究未必還像過去那樣強依賴高學歷。隨著 Vibe Coding 和 Vibe Research 的快速發展,我會認為讀博這件事需要更加謹慎地權衡。工具能力提升,會導致發表論文的門檻顯著下降,論文數量會開始暴漲。不過,即將讀 PhD 的同學也不必因此灰心。我的良心建議是:利用自己積累的經驗,只要盡可能去做足夠高質量、真正有內容的工作,不會有問題。
02
Recursive Self-Improvement:Agent進化的核心引擎
"未來一年的突破就集中在這個方向。"
Q4:您曾參與智源社區“邁向Super Agent”研討會,提到2023年Agent框架開始收斂,2024年MCP協議、Computer Use等關鍵能力推動領域規模化落地,結合2025-2026年的發展,目前Agent領域的最新突破集中在哪些方向?
![]()
圖注:三年前MetaGPT的附錄
諸葛鳴晨:三年前,我已經在 MetaGPT 附錄中寫下這些方向。回頭看,它們正在逐步進入行業討論的中心。也許你會意外的發現,2025年David Silver和Richard Sutton主推的Learning from Experience,以及2025年下半年到2026年上半年硅谷各大公司的老大比如Elon、Sam、Dario最近愛談的Recursive Self-Improvement,三年前我以精準的terminology將其寫入 MetaGPT 附錄,如今它們正在逐步成為行業討論的重點。
![]()
![]()
來源:https://blog.samaltman.com/the-gentle-singularity; https://www.anthropic.com/news/the-anthropic-institute
我們正在推動一個聚焦 recursive self-improvement 的 workshop。2026年的突破,就集中在 recursive self-improvement。
Q5:Agent-as-a-Judge如何解決長時程任務的評估問題?
諸葛鳴晨:Agent-as-a-Judge 是我 2024 年的工作。對于傳統 benchmark 任務,給定輸入、得到輸出,Agent 往往只需要幾分鐘或幾十分鐘就能完成,這時當然可以設計明確的 rubric 來評估結果。但現在的 agent 已經能夠持續工作 6 小時、24 小時,甚至未來穩定運行半個月或一個月。對于這類長時程任務,我們更應該優先做什么:A.是繼續構建帶固定 rubric 的 benchmark,B.還是探索一個真正 open-ended 的 Agent-as-a-Judge?我個人認為是后者。
固定 rubric 適合驗收已知問題,但它默認"好解法"大體落在人的預設框架之內;一旦 agent 給出超出預設維度的方案,固定 rubric 就未必能夠充分評估它的價值。
那如果已知很難有高質量的Benchmarks來監控長程問題的話,理想情況下,最好由人類持續監控并提供反饋,因為人類仍然最有機會識別真正重要的突破。但這件事成本太高,也很難規模化。Agent-as-a-Judge的核心價值,是為長時程任務提供持續反饋信號。這種反饋不一定需要 100% 精準,只要它有意義、能提供方向性,就足以支撐整個迭代閉環繼續優化。
就像 AlphaGo 的 Move 37:固定 rubric 的 benchmark 更容易給出最終結果(如:AlphaGo贏了),而Agent-as-a-Judge 不僅給最終結果打分,也在中間過程實時反饋(如:Move 37很漂亮)。
![]()
圖注:2016年AlphaGo與李世石的對局,來源網絡
追問:這個反饋和強化學習中的reward 有什么區別?
諸葛鳴晨:兩者不是一個維度的事情。RL里的reward是訓練階段的優化信號,目標是更新策略;而Agent-as-a-Judge的核心是在任務執行過程中持續提供評估反饋,服務于長期演化和多主體協作,而不是單輪優化。當然它也可以被復用到agentic post-training場景里作為輔助信號,但那不是它的設計初衷。
03
Agent開源三部曲:
MetaGPT、GPTSwarm與Agent-as-a-Judge
"好的工作,是解決領域公認的問題,或明確指出新的方向。"
Q6:您主導的開源項目MetaGPT、GPTSwarm、Agent-as-a-Judge,在GitHub開源社區和學術社區均有較大反響,其中MetaGPT在軟件設計、編程題解答等任務中表現突出,當時開發這些開源項目的初衷是什么?
諸葛鳴晨:我會先回答MetaGPT,同時說一下OpenHands。
MetaGPT 當時解決的是什么問題呢?以前大模型的上下文窗口很短,代碼如果稍微包含一兩個文件就超出了這個上下文長度。MetaGPT 的做法是把不同的職責劃分開,論文里稱為SOP,也是現在skill的早期原型:CEO 下達命令,然后有系統架構師、產品經理、engineer 等角色,每一個 agent 的輸入輸出格式都很清晰規范,同時設計了共享的對話窗口。這樣就解決了兩大問題:一是由上下文長度不足導致的 inconsistency(不一致性),二是 hallucination(幻覺)。這在2022年、2023年對于coding Agent都是非常嚴重的問題。
而OpenHands我也很喜歡,作為參與者我覺得它相比于MetaGPT指出了另一條路,就是不用多智能體,而用單智能體。OpenHands算是我所有論文里面非一作論文里最喜歡的項目,同時這次合作也認識了幾個我特別欣賞的researchers。
說到初衷,其實有一點很實在:做開源項目,一方面是想在社區里建立一定的visibility;另一方面,每次把東西推出去,都是一次對自己know-how的重新評估。
Q7:GPTSwarm 的核心設計理念是什么?
諸葛鳴晨:GPTSwarm 的核心想法很直接,就是用圖來統一建模 single agent 和 multi-agent system。在這個框架里,節點代表工具、函數或能力,邊代表它們之間的連接關系與信息流動方式。這樣一來,智能體的構建與優化就可以被統一理解為一個圖優化問題:優化節點,是提升單個能力;優化邊,是改善協作關系。進一步地,多個 agent 之間的信息傳遞,也可以表示為圖中的跨節點連接。
![]()
圖注:GPTSwarm概念圖
GPTSwarm的價值不只是"用graph構建agent",更在于把optimization納入同一框架,并延伸到self-improvement的問題。我們2023年9月啟動,2024年2月發布,和LangGraph幾乎同期——但GPTSwarm多走了optimization或者self-improve這一步。
Q8:談談Agent-as-a-Judge?
諸葛鳴晨:Agent-as-a-Judge 之所以重要,不只是因為它能評估,更因為它為 recursive self-improvement 提供了持續反饋機制。沒有持續反饋機制,就不可能形成真正穩定的自我迭代閉環。
最近有一個叫Ralph Loop的概念,他們強調在循環過程中,重要的不僅僅是智能體的能力,還需要好的評測手段。這個評測手段可以由智能體自身來定義,也可以由另一個智能體來定義。從一開始就定義好指標,智能體就一直朝著這個指標去優化,直到達到滿意為止才停下來。
Q9:您的論文累計被引用超過5000次,多個研究成果獲得頂級會議口頭報告機會,這些成果中,您個人最滿意的是哪一個?
諸葛鳴晨:我最向往的研究,是那種真正解決領域公認問題、或明確指出新方向的工作——既能攻克當下的痛點,也能推動社區打開新的討論空間。說實話,以這個標準回望,我對過去幾年自己的工作,都還挺滿意的。
Q10. 在博士階段,目前有沒有錯過或者押錯的方向?
諸葛鳴晨:最遺憾的,是錯過了 AI Scientist 這個方向。2023 年下半年,我同時構想了 GPTSwarm 和 GPT-Scientist 兩個方向,也都寫了 Proposal給Jürgen(如下圖是關于GPT-Scientist的Proposal)。
![]()
圖注:諸葛鳴晨關于GPT-Scientist的Proposal
當時判斷 GPT-Scientist 可能過于超前,可以先緩一緩——要知道,像 Devin 這樣的系統直到次年,也就是 2024 年 3 月才發布。于是我選擇了自認為學術貢獻更扎實的 GPTSwarm 來推進。加上我有做完一個項目后放松一段時間的習慣,GPTSwarm 收尾之后就沒能及時跟上做 GPT-Scientist。后來,Sakana AI 于 2024 年 8 月發布了《The AI Scientist》,正面命中了我當初擱置的那個方向,一時間爆火。這個錯過,實在不應該。
04
師從現代AI之父Jürgen Schmidhuber
"他腦子像藏了一部百科全書。"
Q11:在開展這些研究的過程中,您的導師Jürgen Schmidhuber教授給予了哪些具體的指導和支持?是否有某個關鍵建議,幫助您突破了研究瓶頸?
諸葛鳴晨:在組里氛圍很自由,沒有固定的weekly meeting。不用每周應付匯報,我就有更多空間去思考,這對我幫助很大。
![]()
圖注:Jürgen Schmidhuber教授,來源網絡
具體指導方面,他會非常詳細地看我的論文,甚至會因為某句話、某個詞表述不清楚而給出很強烈的批評意見。但你跟他交流,他會告訴你為什么覺得不對,該怎么寫、怎么做可能更好。他不是手把手教你的類型,你帶著問題去問他,他往往能迅速指出關鍵所在——這源自于他長期的積累,他確實很博學。
一個具體案例:我博一剛入學時,他讓我主導一個叫 Mindstorm 的項目,當時有20多號人,有一大部分都是senior PhDs。當時我壓力很大,但他非常支持我。他親自撰寫了那篇論文的 outlook 章節,叫做"Economy of Mind"。那篇 paper 叫做《Mindstorms in Natural Language-Based Societies of Mind》。你想他已經60多歲了,還會親自從文本層面幫你撰寫一整個章節。雖然這是他在我整個博士期間唯一一次親自撰寫一個章節,但對于一個初級研究者的成長而言,這是非常有幫助的。
![]()
圖注:論文《Mindstorms in Natural Language-Based Societies of Mind》
那個章節也非常超前。他提出智能體的獎勵直接等同于“Cash”——就像人類需要薪酬來維持生活,agent 社會也可能由經濟因素驅動。一些 agent 可能非常“富足”,有自己的“baby”(數字分身);一些 agent 可能會“破產”。
他的意思是Agent 也會有自己的“社會”,也有自己的經濟行為。在這個框架下,未來agent 的 reward 不再只是完成任務后的分數——無論是人類偏好、rubric 得分,還是來自類似于Agent-as-a-Judge 的反饋。未來的 agentic incentive更可能是現實社會里的現金激勵,比如美元或歐元,這樣更自然地驅動 agent 的長期演化和多主體協作。
Q12:目前您在Meta AI實習,這段實習經歷是否會影響您未來的研究方向?
諸葛鳴晨:最大的影響有兩點:一是驗證了自己的一些判斷,很多在學校里不確定的想法,發現確實是業界需要的;二是結識了很多優秀的研究者,那些更資深的人在交流中也確實幫助了我。后面兩年Meta和KAUST基本相輔相成,掛靠Meta做research。
Q13:Jürgen Schmidhuber教授被譽為“LSTM之父”“現代人工智能之父”,您曾形容他是“典型的德國學者,嚴謹且精益求精”,在日常相處中,有哪些具體的小事,能體現他的這種特質?
諸葛鳴晨:他性格非常鮮明,有什么就直接說——在某種程度上像個"老頑童"。外界說他桀驁不馴,但相處下來你又覺得他和藹可親。
但他在論文上非常嚴厲。論文里某句話不清楚,他會批評,然后會告訴你哪些引用需要加上,不只是他自己的工作,他會列舉 AI 歷史上所有值得尊重的工作,我覺得他腦子像藏了一部百科全書。
他很嚴謹,比如他會說 CNN 其實是由日本的福島邦彥(Fukushima)貢獻的,不應該完全歸功于 LeCun。他不是只為自己伸張。他還寫過一篇 blog 討論到底是誰發明了飛機,大家公認是萊特兄弟,但實際上萊特兄弟嚴格來說只是發明了某種特定形式的飛機,在他們之前的1890年就有工程師做出了“有動力的飛行器”,這些人都被忽略了。他用這個類比來說明 AI 領域也應該給每一位做出貢獻的人應有的 credit。
![]()
來源:https://people.idsia.ch/~juergen/planetruth.html
拋開他之前讓他出名的的很多文章,比如LSTM,現在另一批他的早期個人研究最近也顯露鋒芒:從 Godel Machine(Recursive Self-Improvement 的早期工作),到 Making the World Differentiable以及World Models(與 David Ha 共同推動了World Model的定義和流行),再到 Fast Weight Programmer 以及與 Imanol 合作的 Delta Network(Linear Attention 的重要參考)等等,都在逐步證明他在“大氣層”。
05
Agent的下一個十年
"人類的適應性一定是比agent強的。"
Q14:開源項目在您的研究中占據重要地位,未來您在項目的迭代上,有哪些具體規劃?是否會嘗試推動這些項目的商業化落地?
諸葛鳴晨:我參與的OpenHands、MetaGPT 等項目,2年前就已經由其他主導人推動商業化,而且融資情況也相當可觀。相比之下,我過去在學校或實習中做的項目大多偏學術,更關注未來兩三年甚至更長遠的需求。
但接下來這個狀態會變化。進入工業界后,我會更多聚焦當前半年內真正需要解決的問題。目前這一兩年,最終我想做的是一個“過往項目的集大成者”,把過去幾個項目的思路整合起來:多智能體協作、sandbox執行、圖優化、自動評估等等,設計一個真正可長期運行的長程Agent,優先落地在automatic engineering場景。同時會找找有沒有機會自己或者和惺惺相惜的researchers一起推 Completely Neural Computers (完備神經計算機),我快畢業了,會告別paper-oriented research了,接下來的日子,拭目以待吧。
Q15:同樣是Agent領域的研究者,您如何看待Shunyu Yao的《The Second Half》?在您看來,AI的下一步是什么?
諸葛鳴晨:他很擅長在關鍵時間節點提出足夠大的問題——ReAct 和《The Second Half》都是這樣,能讓更多研究者聚焦到同一個方向上來,這本身很有價值,也是他 research taste 的體現。
但說實話,把 AI 的“下半場”概括為 evaluation,這個口徑是偏寬的。好處是足夠包容、易于理解,也確實能快速形成共識;但代價是技術上會變得模糊——你很難從這個判斷直接推導出下一步該做什么。
傳統 benchmarks 不夠用這一點已經是共識。圍繞這個問題,社區確實在往更貼近真實世界的方向推進,比如:
(1)Agent-as-a-Judge,本身就是在補長時程任務評估的空缺。它不只看最終結果,而是為任務執行過程持續提供評估信號;
(2)以arena.ai為代表的Arena類系統,提供接近真實的用戶偏好評估;
(3)類似OpenRouter的真實調用量數據,在一定程度上反映了市場對模型實用性的綜合判斷。
![]()
圖注:概念圖
但這些變化,本質上還是在改進“儀表盤”,而不是重寫“發動機”。
在我看來,更務實的 AI"下半場",關鍵還是解決兩個更直接的問題:一是 Recursive Self-Improvement,二是 Neural Computers。前者決定AI如何持續進化,后者決定AI以什么形態存在。這兩者更直接說明了當前大家可能共同面對的挑戰。
Q16:您剛剛提到的Neural Computers是什么?
諸葛鳴晨:其實這是我即將公開的一篇論文,提前透露一些思考。
先說它和現有范式的區別。傳統計算機圍繞顯式程序運行,Agent圍繞任務執行,World Model圍繞環境建模——而Neural Computer關注的是runtime本身:讓系統在運行中持續沉淀能力。Agent是在計算機上跑任務,而Neural Computer本身就是那臺計算機。
![]()
圖注:概念圖
對傳統計算機,你安裝的是軟件;對Agent,你描述的是任務;對Neural Computer,你更像是在給機器安裝能力,并期待這些能力以后繼續留在機器里。
這個工作我去年2月開始探索,去年11月基本做完了,因為雜事很多,一直拖到現在,但是應該4月前會發布。
Q17. 有什么心得,能提前抓住一些熱點?
諸葛鳴晨:我有一套判斷思路,其實就是反復自我追問:“當前的主流技術下一波會在哪里匯聚?”
我覺得這個思維,可以作為“公式”被所有人復用:
(1)2020年multimodal還不火的時候,預判各類子課題(CV、NLP、RecSys)最終會匯入Multimodal,快速以身入局;
(2)2022年AI Agents還不火的時候,預判Multimodal、LLM等技術最終會匯入Agents,快速以身入局;
(3)2025年Neural Computers還不火的時候,預判World Model、AI Agents以及傳統計算機技術,最終會匯入Neural Computers,快速以身入局。
每次利用好這一招基本管3年溫飽,但能不能大富大貴看個人造化。
Q18:最后,結合當前Agent領域的發展,您對這個領域的未來5-10年,有怎樣的期待?AI Agents會不會取代人類?
諸葛鳴晨:Agent已經基本覆蓋了編程和各類工程師場景,能幫大家實實在在地提速。Agent會從編程擴展到所有日常場景。我個人最期待的,是有一天我睡覺的時候,它能替我同時跑實驗和處理各種雜事。
最后想說的是:人類的適應力和創造性,始終會比Agent更強。AI不會淘汰人,但會用AI的人,會淘汰不會用AI的人。這個窗口現在還開著:先進去的人,已經在建立優勢了。
最后,我也想借用我導師Jürgen Schmidhuber在11年前Reddit的回答來替我補充:
![]()
來源:https://www.reddit.com/r/MachineLearning/comments/2xcyrl/comment/cp46hxc/
追問:如果Agent持續普及,以后大家是不是也不用996了?
諸葛鳴晨:遺憾的是,996恐怕不會消失。Agent普及之后,生產力提升,但需求也會隨之被放大,每個人的負擔未必真的減少。但至少,很多重復執行型工作會被自動化。
由于現在講究Move Fast,996好像難以避免。但72小時的工作量如果工資到位、做的又是真正有意義的事,其實沒那么難熬。最難熬的是忙了一整周,最后卻發現,沒有一件事值得。
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
點「贊」的人都變好看了哦!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.