從“會聊天”到“干實(shí)事”，亞馬遜云科技讓Agent“長出了手腳”

2025-12-04 19:01:35　來源: Alter聊科技

浙江舉報

分享至

美國西部時間12月2日的2025 亞馬遜云科技re:Invent上，亞馬遜云科技首席執(zhí)行官M(fèi)att Garman在開場演講中拋出了一個觀點(diǎn)：AI Agent時代已來，未來將出現(xiàn)數(shù)十億AI Agent，為企業(yè)提效10倍以上！

現(xiàn)場興奮和焦灼情緒交織，數(shù)萬名開發(fā)者和企業(yè)高管都在等一個答案。

因?yàn)樵诤芏嗳说挠∠罄铮珹I Agent的現(xiàn)實(shí)體感并不樂觀：開發(fā)門檻高、編排邏輯復(fù)雜、安全治理缺位、上下文記憶像金魚……導(dǎo)致了一個尷尬的行業(yè)現(xiàn)狀——90%的Agent項(xiàng)目停留在概念驗(yàn)證階段。

想要從概念驗(yàn)證走向生產(chǎn)可用，中間隔著的不僅僅是代碼行數(shù)，而是一道道深不見底的“工程鴻溝”。

懸念并未持續(xù)太久。

亞馬遜云科技 Agentic AI副總裁Swami Sivasubramanian，在12月3日的主論壇上，用嚴(yán)謹(jǐn)且務(wù)實(shí)的演講給出了答案——怎么把AI Agent從概念驗(yàn)證推向生產(chǎn)環(huán)境。

01 對癥下藥，解決POC到生產(chǎn)環(huán)境的五大頑疾

為什么不少企業(yè)的Agent“看起來很美，用起來很廢”？

剝開光鮮的Demo外衣，在生產(chǎn)環(huán)境中面臨著五個棘手的痛點(diǎn)：

1、部署難、擴(kuò)展難，一上生產(chǎn)就不穩(wěn)定；

2、記憶缺失，Agent 無法跨任務(wù)學(xué)習(xí)，無法持續(xù)執(zhí)行大型流程；

3、身份、權(quán)限、憑證管理太難，易出安全事故；

4、工具、數(shù)據(jù)、系統(tǒng)碎片化，集成成本極高；

5、無法觀測、無法調(diào)試，Agent成為黑箱。

Swami在演講中一針見血地指出：“大多數(shù)實(shí)驗(yàn)和PoC并未按生產(chǎn)就緒的標(biāo)準(zhǔn)來設(shè)計。我們需要彌合這一差距，打破PoC的桎梏。”相對應(yīng)的，亞馬遜云科技對Agent在生產(chǎn)環(huán)境中遇到的頑疾，通過Amazon Bedrock AgentCore進(jìn)行了對癥下藥。

AgentCore Runtime提供了一個無服務(wù)器、強(qiáng)隔離、長時運(yùn)行的環(huán)境，徹底讓開發(fā)者告別用拼湊的Lambda函數(shù)和腳本手搓的運(yùn)行環(huán)境，實(shí)現(xiàn)了Serverless托管執(zhí)行、強(qiáng)會話隔離、長時會話等能力，解決了“狀態(tài)管理”的老大難問題，讓Agent能夠像人類員工一樣長期在線，隨時待命。

AgentCore Memory構(gòu)建了短期+長期+情景記憶的三層體系，讓Agent具備了“記住→學(xué)習(xí)→改進(jìn)→再執(zhí)行”的閉環(huán)能力。特別是“情景記憶”，可以讓Agent記住“發(fā)生過什么事”以及“為什么那次流程很混亂”，并自動學(xué)習(xí)策略、優(yōu)化下一次行動路徑，實(shí)現(xiàn)企業(yè)Agent所需的“連續(xù)性”與“可學(xué)習(xí)性”。

AgentCore Identity賦予了Agent“可控、可審計、可授權(quán)”的企業(yè)級身份體系，實(shí)現(xiàn)從“人類身份體系”向“Agent 身份體系”的擴(kuò)展。畢竟在真實(shí)的生產(chǎn)環(huán)境中，最可怕的不是Agent不工作，而是拿著CEO的權(quán)限去讀HR的數(shù)據(jù)庫，需要精準(zhǔn)控制Agent的權(quán)限，把潛在的安全隱患鎖死在籠子里。

AgentCore Gateway扮演了“協(xié)調(diào)樞紐”的角色，自動掃描分散在數(shù)據(jù)庫、SaaS應(yīng)用、舊系統(tǒng)里的數(shù)據(jù)，自動生成Agent的“工具地圖”，讓Agent能安全、智能、自動地“發(fā)現(xiàn)→連接→使用”所有工具與數(shù)據(jù)。

AgentCore Observability解決的是“黑盒”問題，讓企業(yè)能實(shí)時看到Agent的推理、工具調(diào)用、狀態(tài)流、錯誤、上下文與決策路徑等工作流程，提前驗(yàn)證Agent會不會搞砸，避免出了問題卻找不到原因。

亞馬遜云科技開出的“藥方”是否奏效呢？

可以佐證的是汽車服務(wù)與技術(shù)提供商Cox Automotive的例子，使用AgentCore搭建了一個名為Fleet Mate的Agent，原本需要2天時間的車輛評估被壓縮到了30分鐘。

02 瞄準(zhǔn)靶心，讓模型定制成為產(chǎn)品化工程

解決Agent的工程落地只是第一步，大模型同樣是制約生產(chǎn)力的瓶頸，很多企業(yè)面臨的障礙不亞于生產(chǎn)環(huán)境。

譬如通用大模型不懂企業(yè)業(yè)務(wù)，而且模型參數(shù)規(guī)模大、推理成本高、延遲難以滿足業(yè)務(wù)要求；業(yè)務(wù)規(guī)則經(jīng)常變、新場景不斷出現(xiàn)，導(dǎo)致模型上線后效果會衰退；模型定制需要MLOps、SRE、算法、數(shù)據(jù)團(tuán)隊(duì)協(xié)作，需要專業(yè)的團(tuán)隊(duì)才能做……能力強(qiáng)、速度快、成本低幾乎成了不可能三角。

監(jiān)督微調(diào)、模型蒸餾、強(qiáng)化學(xué)習(xí)是業(yè)內(nèi)公認(rèn)的“三大法寶”，亞馬遜云科技的解題思路也不例外。

不同的是，亞馬遜云科技打出了一套組合拳，從“微調(diào)”到“預(yù)訓(xùn)練”，把模型定制從玄學(xué)變成了工程學(xué)。

一是Amazon Bedrock強(qiáng)化微調(diào)。

傳統(tǒng)的微調(diào)（SFT）只是教模型“怎么說話”，而強(qiáng)化學(xué)習(xí)（RL）是教模型“怎么做對”。但強(qiáng)化學(xué)習(xí)需要構(gòu)建復(fù)雜的獎勵模型，難度太大了。

亞馬遜云科技的強(qiáng)化微調(diào)（RFT）功能，直接把強(qiáng)化學(xué)習(xí)的門檻踏平了，只需要提供數(shù)據(jù)，就能自動處理獎勵建模和策略優(yōu)化，能夠?qū)⒛Ｐ偷臏?zhǔn)確性提升66%，讓一個小模型通過針對性的強(qiáng)化訓(xùn)練，在特定任務(wù)上吊打通用大模型。

二是Amazon SageMaker AI無服務(wù)器定制。

以前訓(xùn)練一個模型，需要配環(huán)境、調(diào)參、洗數(shù)據(jù)，準(zhǔn)備工作就需要幾個月，Amazon SageMaker AI提出了新的思路——用AI來制造AI。

企業(yè)用自然語言描述需求，SageMaker內(nèi)置的Agent會自動分析場景、推薦微調(diào)技術(shù)、甚至直接幫企業(yè)生成合成數(shù)據(jù)，然后自動跑完訓(xùn)練流程。把“需要大團(tuán)隊(duì)、長周期、重投入”的模型定制，變成了“幾天完成的自動化任務(wù)”。

三是Amazon Nova Forge。

像醫(yī)藥、金融等行業(yè)，不僅需要微調(diào)大模型，還要模型在底層就理解行業(yè)邏輯，但在傳統(tǒng)的流程里，企業(yè)數(shù)據(jù)無法進(jìn)入預(yù)訓(xùn)練階段。

Amazon Nova Forge全球首創(chuàng)了“開放訓(xùn)練模型”體系，允許企業(yè)在模型的“中途訓(xùn)練階段”介入，注入自己的專有數(shù)據(jù)，不再是打補(bǔ)丁式的微調(diào)，而是讓企業(yè)以極低的成本，擁有了一個“流淌著自己血液”的預(yù)訓(xùn)練模型。

四是Amazon SageMaker HyperPod無檢查點(diǎn)訓(xùn)練。

在大模型訓(xùn)練的過程中，斷點(diǎn)續(xù)訓(xùn)一直是噩夢，一次GPU故障可能導(dǎo)致數(shù)小時的進(jìn)度回滾，造成真金白銀的損失。

Swami在演講中提到了HyperPod無檢查點(diǎn)訓(xùn)練的“黑科技”，通過實(shí)時保存模型狀態(tài)，在硬件故障時，能在幾分鐘內(nèi)自動恢復(fù)，不需要回滾到幾個小時前的Checkpoints，大大降低了大規(guī)模訓(xùn)練的沉沒成本。

做一個總結(jié)的話，亞馬遜云科技開啟了一場從“把模型訓(xùn)練好”，到“把模型訓(xùn)練得起、用得好”的全鏈路效率革命，讓模型定制從技能工程，進(jìn)化為可復(fù)制的產(chǎn)品化工程。

03 落地為王，打通可信、可靠、可協(xié)作閉環(huán)

企業(yè)把Agent推向生產(chǎn)環(huán)境后，CEO們最擔(dān)心的問題，可能不是“它能不能做”，而是“我敢不敢讓它做”。

擺在案頭的是更深層次的挑戰(zhàn)：Agent是否可信，在和客戶溝通時會不會亂講？Agent是否可靠，業(yè)務(wù)成功率能否達(dá)到企業(yè)要求？Agent能否與人類協(xié)同，融入已有客服/運(yùn)營/業(yè)務(wù)流程？

喊出“為企業(yè)提效10倍以上”的亞馬遜云科技，不只要幫企業(yè)打造生產(chǎn)環(huán)境、訓(xùn)練更聰明的大腦，還要打消“敢不敢用”的疑慮。亞馬遜云科技沒有回避，在主題演講中留出了相當(dāng)長的篇幅。

首先是可信。

亞馬遜云科技杰出科學(xué)家Byron Cook講了一個深刻的邏輯：大模型是基于統(tǒng)計學(xué)的，是概率性的，天生存在幻覺；而企業(yè)的規(guī)則（尤其是GDPR等合規(guī)要求的出海企業(yè)）是邏輯性的、是確定的。

怎么解決這個矛盾呢？答案是神經(jīng)符號AI。

簡單來說就是把“左腦的邏輯”和“右腦的直覺”結(jié)合起來。亞馬遜云科技引入了“自動推理”技術(shù)，帶來了三大能力：

驗(yàn)證輸出：自動推理工具驗(yàn)證 LLM 的答案是否滿足邏輯和規(guī)則。

訓(xùn)練結(jié)合：使用定理證明器訓(xùn)練，使模型天然具備邏輯正確性。

約束解碼：推理層嵌入驗(yàn)證器，使模型不能越界生成內(nèi)容。

目前神經(jīng)符號AI已經(jīng)應(yīng)用到Amazon Kiro、AgentCore Policy等產(chǎn)品中，讓 Agent既聰明又聽話。

然后是可靠。

Agent落地的最大障礙之一在于，“大腦”和“手腳”是分離訓(xùn)練的，導(dǎo)致模型懂流程，但操作起來“笨手笨腳”。

亞馬遜云科技正式發(fā)布了Amazon Nova Act，一個專門為“行動”而生的模型，在訓(xùn)練中進(jìn)行了數(shù)百個環(huán)境+數(shù)千工作流程+數(shù)十萬交互的強(qiáng)化學(xué)習(xí)，進(jìn)行了成千上萬次的試錯。結(jié)果超出了不少人的預(yù)期：在企業(yè)自動化工作流中，Amazon Nova Act實(shí)現(xiàn)了90%的成功率。

也就是說，企業(yè)可以放心地把點(diǎn)按鈕、填表單、跑流程這些活兒交給Agent，不必?fù)?dān)心它卡在某個彈窗時不知所措。

最終是可協(xié)作。

Agent的終局是什么？是替代人類嗎？亞馬遜云科技的回答是“Teammate”（隊(duì)友）。

折射到技術(shù)層面上，Amazon Connect新增了8項(xiàng)AI能力，包括讓AI像真人一樣說話的神經(jīng)聲音集成(Sonic)、基于對話自動建議下一步的實(shí)時推薦Agent、結(jié)合點(diǎn)擊流數(shù)據(jù)個性化建議的AI驅(qū)動預(yù)測洞察等。

正如2025 亞馬遜云科技re:Invent上所演示的：在一個信用卡盜刷的場景中，Agent不僅自動驗(yàn)證了身份，還通過分析地理位置和交易模式，預(yù)判了欺詐風(fēng)險，并在后臺默默地為人類客服準(zhǔn)備好了所有資料。人類客服接起電話的那一刻，問題已經(jīng)解決了一半。

Agent不再只是工具，而是和人類一起協(xié)作的隊(duì)友。

04 寫在最后

2025年的亞馬遜云科技re:Invent，更像是一個時代的分水嶺。

過去兩年里，行業(yè)對Agent的熱情大多停在愿景層；現(xiàn)在，亞馬遜云科技給出了一套從基礎(chǔ)設(shè)施到模型、從安全到協(xié)作、從執(zhí)行到治理的落地體系。

第一層：AgentCore（讓Agent能跑起來），解決了部署、管理、記憶、安全、工具接入、可觀測性等基礎(chǔ)工程問題。

第二層：模型定制（讓Agent跑得好），通過RFT、無服務(wù)器定制、HyperPod等把模型從“通用”變成“企業(yè)專屬”。

第三層：可信+可靠+協(xié)作（讓企業(yè)敢用），讓Agent變得可控、可靠、可協(xié)作，成為一個可托付的數(shù)字員工。

如果說2023年是生成式AI的元年，2024年是Agent的試驗(yàn)期，2025年則正式宣告：AI Agent進(jìn)入企業(yè)級生產(chǎn)階段的時代，已經(jīng)到來。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.