![]()
美國西部時(shí)間12月2日的2025 亞馬遜云科技re:Invent上,亞馬遜云科技首席執(zhí)行官M(fèi)att Garman在開場演講中拋出了一個(gè)觀點(diǎn):AI Agent時(shí)代已來,未來將出現(xiàn)數(shù)十億AI Agent,為企業(yè)提效10倍以上!
現(xiàn)場興奮和焦灼情緒交織,數(shù)萬名開發(fā)者和企業(yè)高管都在等一個(gè)答案。
因?yàn)樵诤芏嗳说挠∠罄铮珹I Agent的現(xiàn)實(shí)體感并不樂觀:開發(fā)門檻高、編排邏輯復(fù)雜、安全治理缺位、上下文記憶像金魚……導(dǎo)致了一個(gè)尷尬的行業(yè)現(xiàn)狀——90%的Agent項(xiàng)目停留在概念驗(yàn)證階段。
想要從概念驗(yàn)證走向生產(chǎn)可用,中間隔著的不僅僅是代碼行數(shù),而是一道道深不見底的“工程鴻溝”。
懸念并未持續(xù)太久。
亞馬遜云科技 Agentic AI副總裁Swami Sivasubramanian,在12月3日的主論壇上,用嚴(yán)謹(jǐn)且務(wù)實(shí)的演講給出了答案——怎么把AI Agent從概念驗(yàn)證推向生產(chǎn)環(huán)境。
01 對癥下藥,解決POC到生產(chǎn)環(huán)境的五大頑疾
為什么不少企業(yè)的Agent“看起來很美,用起來很廢”?
剝開光鮮的Demo外衣,在生產(chǎn)環(huán)境中面臨著五個(gè)棘手的痛點(diǎn):
1、部署難、擴(kuò)展難,一上生產(chǎn)就不穩(wěn)定;
2、記憶缺失,Agent 無法跨任務(wù)學(xué)習(xí),無法持續(xù)執(zhí)行大型流程;
3、身份、權(quán)限、憑證管理太難,易出安全事故;
4、工具、數(shù)據(jù)、系統(tǒng)碎片化,集成成本極高;
5、無法觀測、無法調(diào)試,Agent成為黑箱。
Swami在演講中一針見血地指出:“大多數(shù)實(shí)驗(yàn)和PoC并未按生產(chǎn)就緒的標(biāo)準(zhǔn)來設(shè)計(jì)。我們需要彌合這一差距,打破PoC的桎梏。”相對應(yīng)的,亞馬遜云科技對Agent在生產(chǎn)環(huán)境中遇到的頑疾,通過Amazon Bedrock AgentCore進(jìn)行了對癥下藥。
![]()
AgentCore Runtime提供了一個(gè)無服務(wù)器、強(qiáng)隔離、長時(shí)運(yùn)行的環(huán)境,徹底讓開發(fā)者告別用拼湊的Lambda函數(shù)和腳本手搓的運(yùn)行環(huán)境,實(shí)現(xiàn)了Serverless托管執(zhí)行、強(qiáng)會話隔離、長時(shí)會話等能力,解決了“狀態(tài)管理”的老大難問題,讓Agent能夠像人類員工一樣長期在線,隨時(shí)待命。
AgentCore Memory構(gòu)建了短期+長期+情景記憶的三層體系,讓Agent具備了“記住→學(xué)習(xí)→改進(jìn)→再執(zhí)行”的閉環(huán)能力。特別是“情景記憶”,可以讓Agent記住“發(fā)生過什么事”以及“為什么那次流程很混亂”,并自動(dòng)學(xué)習(xí)策略、優(yōu)化下一次行動(dòng)路徑,實(shí)現(xiàn)企業(yè)Agent所需的“連續(xù)性”與“可學(xué)習(xí)性”。
AgentCore Identity賦予了Agent“可控、可審計(jì)、可授權(quán)”的企業(yè)級身份體系,實(shí)現(xiàn)從“人類身份體系”向“Agent 身份體系”的擴(kuò)展。畢竟在真實(shí)的生產(chǎn)環(huán)境中,最可怕的不是Agent不工作,而是拿著CEO的權(quán)限去讀HR的數(shù)據(jù)庫,需要精準(zhǔn)控制Agent的權(quán)限,把潛在的安全隱患鎖死在籠子里。
AgentCore Gateway扮演了“協(xié)調(diào)樞紐”的角色,自動(dòng)掃描分散在數(shù)據(jù)庫、SaaS應(yīng)用、舊系統(tǒng)里的數(shù)據(jù),自動(dòng)生成Agent的“工具地圖”,讓Agent能安全、智能、自動(dòng)地“發(fā)現(xiàn)→連接→使用”所有工具與數(shù)據(jù)。
AgentCore Observability解決的是“黑盒”問題,讓企業(yè)能實(shí)時(shí)看到Agent的推理、工具調(diào)用、狀態(tài)流、錯(cuò)誤、上下文與決策路徑等工作流程,提前驗(yàn)證Agent會不會搞砸,避免出了問題卻找不到原因。
亞馬遜云科技開出的“藥方”是否奏效呢?
可以佐證的是汽車服務(wù)與技術(shù)提供商Cox Automotive的例子,使用AgentCore搭建了一個(gè)名為Fleet Mate的Agent,原本需要2天時(shí)間的車輛評估被壓縮到了30分鐘。
02 瞄準(zhǔn)靶心,讓模型定制成為產(chǎn)品化工程
解決Agent的工程落地只是第一步,大模型同樣是制約生產(chǎn)力的瓶頸,很多企業(yè)面臨的障礙不亞于生產(chǎn)環(huán)境。
譬如通用大模型不懂企業(yè)業(yè)務(wù),而且模型參數(shù)規(guī)模大、推理成本高、延遲難以滿足業(yè)務(wù)要求;業(yè)務(wù)規(guī)則經(jīng)常變、新場景不斷出現(xiàn),導(dǎo)致模型上線后效果會衰退;模型定制需要MLOps、SRE、算法、數(shù)據(jù)團(tuán)隊(duì)協(xié)作,需要專業(yè)的團(tuán)隊(duì)才能做……能力強(qiáng)、速度快、成本低幾乎成了不可能三角。
監(jiān)督微調(diào)、模型蒸餾、強(qiáng)化學(xué)習(xí)是業(yè)內(nèi)公認(rèn)的“三大法寶”,亞馬遜云科技的解題思路也不例外。
不同的是,亞馬遜云科技打出了一套組合拳,從“微調(diào)”到“預(yù)訓(xùn)練”,把模型定制從玄學(xué)變成了工程學(xué)。
![]()
一是Amazon Bedrock強(qiáng)化微調(diào)。
傳統(tǒng)的微調(diào)(SFT)只是教模型“怎么說話”,而強(qiáng)化學(xué)習(xí)(RL)是教模型“怎么做對”。但強(qiáng)化學(xué)習(xí)需要構(gòu)建復(fù)雜的獎(jiǎng)勵(lì)模型,難度太大了。
亞馬遜云科技的強(qiáng)化微調(diào)(RFT)功能,直接把強(qiáng)化學(xué)習(xí)的門檻踏平了,只需要提供數(shù)據(jù),就能自動(dòng)處理獎(jiǎng)勵(lì)建模和策略優(yōu)化,能夠?qū)⒛P偷臏?zhǔn)確性提升66%,讓一個(gè)小模型通過針對性的強(qiáng)化訓(xùn)練,在特定任務(wù)上吊打通用大模型。
二是Amazon SageMaker AI無服務(wù)器定制。
以前訓(xùn)練一個(gè)模型,需要配環(huán)境、調(diào)參、洗數(shù)據(jù),準(zhǔn)備工作就需要幾個(gè)月,Amazon SageMaker AI提出了新的思路——用AI來制造AI。
企業(yè)用自然語言描述需求,SageMaker內(nèi)置的Agent會自動(dòng)分析場景、推薦微調(diào)技術(shù)、甚至直接幫企業(yè)生成合成數(shù)據(jù),然后自動(dòng)跑完訓(xùn)練流程。把“需要大團(tuán)隊(duì)、長周期、重投入”的模型定制,變成了“幾天完成的自動(dòng)化任務(wù)”。
三是Amazon Nova Forge。
像醫(yī)藥、金融等行業(yè),不僅需要微調(diào)大模型,還要模型在底層就理解行業(yè)邏輯,但在傳統(tǒng)的流程里,企業(yè)數(shù)據(jù)無法進(jìn)入預(yù)訓(xùn)練階段。
Amazon Nova Forge全球首創(chuàng)了“開放訓(xùn)練模型”體系,允許企業(yè)在模型的“中途訓(xùn)練階段”介入,注入自己的專有數(shù)據(jù),不再是打補(bǔ)丁式的微調(diào),而是讓企業(yè)以極低的成本,擁有了一個(gè)“流淌著自己血液”的預(yù)訓(xùn)練模型。
四是Amazon SageMaker HyperPod無檢查點(diǎn)訓(xùn)練。
在大模型訓(xùn)練的過程中,斷點(diǎn)續(xù)訓(xùn)一直是噩夢,一次GPU故障可能導(dǎo)致數(shù)小時(shí)的進(jìn)度回滾,造成真金白銀的損失。
Swami在演講中提到了HyperPod無檢查點(diǎn)訓(xùn)練的“黑科技”,通過實(shí)時(shí)保存模型狀態(tài),在硬件故障時(shí),能在幾分鐘內(nèi)自動(dòng)恢復(fù),不需要回滾到幾個(gè)小時(shí)前的Checkpoints,大大降低了大規(guī)模訓(xùn)練的沉沒成本。
做一個(gè)總結(jié)的話,亞馬遜云科技開啟了一場從“把模型訓(xùn)練好”,到“把模型訓(xùn)練得起、用得好”的全鏈路效率革命,讓模型定制從技能工程,進(jìn)化為可復(fù)制的產(chǎn)品化工程。
03 落地為王,打通可信、可靠、可協(xié)作閉環(huán)
企業(yè)把Agent推向生產(chǎn)環(huán)境后,CEO們最擔(dān)心的問題,可能不是“它能不能做”,而是“我敢不敢讓它做”。
擺在案頭的是更深層次的挑戰(zhàn):Agent是否可信,在和客戶溝通時(shí)會不會亂講?Agent是否可靠,業(yè)務(wù)成功率能否達(dá)到企業(yè)要求?Agent能否與人類協(xié)同,融入已有客服/運(yùn)營/業(yè)務(wù)流程?
喊出“為企業(yè)提效10倍以上”的亞馬遜云科技,不只要幫企業(yè)打造生產(chǎn)環(huán)境、訓(xùn)練更聰明的大腦,還要打消“敢不敢用”的疑慮。亞馬遜云科技沒有回避,在主題演講中留出了相當(dāng)長的篇幅。
首先是可信。
亞馬遜云科技杰出科學(xué)家Byron Cook講了一個(gè)深刻的邏輯:大模型是基于統(tǒng)計(jì)學(xué)的,是概率性的,天生存在幻覺;而企業(yè)的規(guī)則(尤其是GDPR等合規(guī)要求的出海企業(yè))是邏輯性的、是確定的。
![]()
怎么解決這個(gè)矛盾呢?答案是神經(jīng)符號AI。
簡單來說就是把“左腦的邏輯”和“右腦的直覺”結(jié)合起來。亞馬遜云科技引入了“自動(dòng)推理”技術(shù),帶來了三大能力:
驗(yàn)證輸出:自動(dòng)推理工具驗(yàn)證 LLM 的答案是否滿足邏輯和規(guī)則。
訓(xùn)練結(jié)合:使用定理證明器訓(xùn)練,使模型天然具備邏輯正確性。
約束解碼:推理層嵌入驗(yàn)證器,使模型不能越界生成內(nèi)容。
目前神經(jīng)符號AI已經(jīng)應(yīng)用到Amazon Kiro、AgentCore Policy等產(chǎn)品中,讓 Agent既聰明又聽話。
然后是可靠。
Agent落地的最大障礙之一在于,“大腦”和“手腳”是分離訓(xùn)練的,導(dǎo)致模型懂流程,但操作起來“笨手笨腳”。
![]()
亞馬遜云科技正式發(fā)布了Amazon Nova Act,一個(gè)專門為“行動(dòng)”而生的模型,在訓(xùn)練中進(jìn)行了數(shù)百個(gè)環(huán)境+數(shù)千工作流程+數(shù)十萬交互的強(qiáng)化學(xué)習(xí),進(jìn)行了成千上萬次的試錯(cuò)。結(jié)果超出了不少人的預(yù)期:在企業(yè)自動(dòng)化工作流中,Amazon Nova Act實(shí)現(xiàn)了90%的成功率。
也就是說,企業(yè)可以放心地把點(diǎn)按鈕、填表單、跑流程這些活兒交給Agent,不必?fù)?dān)心它卡在某個(gè)彈窗時(shí)不知所措。
最終是可協(xié)作。
Agent的終局是什么?是替代人類嗎?亞馬遜云科技的回答是“Teammate”(隊(duì)友)。
![]()
折射到技術(shù)層面上,Amazon Connect新增了8項(xiàng)AI能力,包括讓AI像真人一樣說話的神經(jīng)聲音集成(Sonic)、基于對話自動(dòng)建議下一步的實(shí)時(shí)推薦Agent、結(jié)合點(diǎn)擊流數(shù)據(jù)個(gè)性化建議的AI驅(qū)動(dòng)預(yù)測洞察等。
正如2025 亞馬遜云科技re:Invent上所演示的:在一個(gè)信用卡盜刷的場景中,Agent不僅自動(dòng)驗(yàn)證了身份,還通過分析地理位置和交易模式,預(yù)判了欺詐風(fēng)險(xiǎn),并在后臺默默地為人類客服準(zhǔn)備好了所有資料。人類客服接起電話的那一刻,問題已經(jīng)解決了一半。
Agent不再只是工具,而是和人類一起協(xié)作的隊(duì)友。
04 寫在最后
2025年的亞馬遜云科技re:Invent,更像是一個(gè)時(shí)代的分水嶺。
過去兩年里,行業(yè)對Agent的熱情大多停在愿景層;現(xiàn)在,亞馬遜云科技給出了一套從基礎(chǔ)設(shè)施到模型、從安全到協(xié)作、從執(zhí)行到治理的落地體系。
第一層:AgentCore(讓Agent能跑起來),解決了部署、管理、記憶、安全、工具接入、可觀測性等基礎(chǔ)工程問題。
第二層:模型定制(讓Agent跑得好),通過RFT、無服務(wù)器定制、HyperPod等把模型從“通用”變成“企業(yè)專屬”。
第三層:可信+可靠+協(xié)作(讓企業(yè)敢用),讓Agent變得可控、可靠、可協(xié)作,成為一個(gè)可托付的數(shù)字員工。
如果說2023年是生成式AI的元年,2024年是Agent的試驗(yàn)期,2025年則正式宣告:AI Agent進(jìn)入企業(yè)級生產(chǎn)階段的時(shí)代,已經(jīng)到來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.