進(jìn)入2025年后,Agentic AI可以說(shuō)是討論度最高的科技詞匯。
從自主預(yù)定機(jī)票的“數(shù)字同事”,到主動(dòng)編寫(xiě)并調(diào)試代碼的編程助手,AI已經(jīng)從簡(jiǎn)單的問(wèn)答工具,向能夠執(zhí)行復(fù)雜任務(wù)的系統(tǒng)演進(jìn)。
只是大多數(shù)企業(yè)還處于初步測(cè)試和概念驗(yàn)證階段,尚未跨越橫亙?cè)凇把菔尽迸c“現(xiàn)實(shí)”之間的鴻溝:
比如怎么管理AI Agents的長(zhǎng)期記憶?如何確保AI Agents在訪問(wèn)敏感數(shù)據(jù)時(shí)的身份與權(quán)限可控?當(dāng)成千上萬(wàn)個(gè)AI Agents協(xié)作運(yùn)行時(shí),能否觀測(cè)、調(diào)試并保證其穩(wěn)定性?
這些棘手的工程問(wèn)題,已然成為AI落地必須邁過(guò)的一道坎,也是留給廠商們的必答題。
7月16日晚上舉辦的亞馬遜云科技紐約峰會(huì)上,針對(duì)Agentic AI的核心議題,亞馬遜云科技率先交出了答卷——發(fā)布了一系列全新的能力與工具,幫助客戶大規(guī)模、安全部署和運(yùn)行高性能AI Agents。
01 架構(gòu)創(chuàng)新,重塑Agent開(kāi)發(fā)的新范式
Agentic AI示范的的應(yīng)用圖景不可謂不誘人。
不同于被動(dòng)響應(yīng)的對(duì)話機(jī)器人、只能解決特定任務(wù)的AI Agent,Agentic AI可以看做是多個(gè)AI Agents組成的協(xié)作系統(tǒng),能夠在沒(méi)有人為干預(yù)的情況下,獨(dú)立地進(jìn)行決策、規(guī)劃、分配角色,并執(zhí)行復(fù)雜行動(dòng)。
但在落地部署的過(guò)程中,開(kāi)發(fā)者們不得不投入大量的時(shí)間和精力在基礎(chǔ)設(shè)施上,包括會(huì)話管理、身份權(quán)限控制、記憶系統(tǒng)、可觀測(cè)性機(jī)制等等,需要保障運(yùn)行的穩(wěn)定性、滿足企業(yè)級(jí)安全與合規(guī)要求,以至于Gartner在報(bào)告指出30%的AI項(xiàng)目在PoC階段后即宣告失敗。
在“紐約峰會(huì)”現(xiàn)場(chǎng),亞馬遜云科技給出了不同的解法——通過(guò)Amazon Bedrock AgentCore,幫助開(kāi)發(fā)者打通AI Agents從概念驗(yàn)證到生產(chǎn)部署的關(guān)鍵環(huán)節(jié),跨越從原型驗(yàn)證到生產(chǎn)落地的鴻溝。
不同于在虛擬機(jī)或容器中運(yùn)行的部署方式,Amazon Bedrock AgentCore提供了一種新的開(kāi)發(fā)架構(gòu),將Agent所需的一系列工程能力,抽象成了一套模塊化的云服務(wù):
AgentCore Runtime(運(yùn)行時(shí)環(huán)境):Agents需要一個(gè)既安全又具彈性、能夠應(yīng)對(duì)多變?nèi)蝿?wù)負(fù)載的運(yùn)行環(huán)境。AgentCore Runtime提供具有會(huì)話隔離的低延遲無(wú)服務(wù)器環(huán)境,支持任何代理框架,包括流行的開(kāi)源框架、工具和模型,并且可承載長(zhǎng)達(dá)8小時(shí)工作負(fù)載的運(yùn)行時(shí)環(huán)境。
AgentCore Memory(記憶系統(tǒng)):正如人類需要依賴短期與長(zhǎng)期記憶,Agents同樣依賴復(fù)雜的記憶結(jié)構(gòu)實(shí)現(xiàn)高效運(yùn)行。AgentCore Memory支持統(tǒng)一管理會(huì)話記憶與長(zhǎng)期記憶,為模型提供關(guān)聯(lián)上下文,同時(shí)支持Agent基于歷史交互的持續(xù)學(xué)習(xí)。
AgentCore Observability(可觀測(cè)性):在生產(chǎn)環(huán)境中,全面跟蹤和追蹤Agent的每個(gè)動(dòng)作對(duì)于性能表現(xiàn)至關(guān)重要。AgentCore Observability可提供Agent執(zhí)行過(guò)程可視化追溯,支持元數(shù)據(jù)標(biāo)記、自定義評(píng)分、軌跡檢查及故障診斷/調(diào)試過(guò)濾器。
AgentCore Identity(身份管理):Agents在執(zhí)行用戶請(qǐng)求時(shí),需基于正確的授權(quán)方式安全訪問(wèn)各類工具與資源。AgentCore Identity支持AI Agents安全訪問(wèn)亞馬遜云科技服務(wù)及GitHub、Salesforce、Slack等第三方工具,既可代表用戶操作,也可在獲得預(yù)先授權(quán)后自主執(zhí)行。
AgentCore Gateway(網(wǎng)關(guān)服務(wù)):AI Agents需要訪問(wèn)多種工具以執(zhí)行現(xiàn)實(shí)任務(wù)。AgentCore Gateway為Agent提供安全路徑以發(fā)現(xiàn)與調(diào)用各類工具,輕松將API、Lambda函數(shù)等轉(zhuǎn)換為Agent可兼容工具。
AgentCore Browser Tool(瀏覽器功能):一款不依賴具體模型的、快速且安全的云端瀏覽器工具,讓AI Agents大規(guī)模的與網(wǎng)站進(jìn)行交互,可用于填寫(xiě)表單、網(wǎng)頁(yè)導(dǎo)航等任務(wù)。
AgentCore Code Interpreter(代碼解釋器):AI Agents在執(zhí)行復(fù)雜計(jì)算、驗(yàn)證推理、處理數(shù)據(jù)或生成可視化內(nèi)容時(shí),需要在安全的沙箱環(huán)境中編寫(xiě)并執(zhí)行代碼。AgentCore Code Interpreter允許開(kāi)發(fā)者根據(jù)安全要求,自定義執(zhí)行環(huán)境的實(shí)例類型與會(huì)話參數(shù)。
不夸張的說(shuō),亞馬遜云科技正在定義一種新的開(kāi)發(fā)范式:企業(yè)可以使用任意框架、任意模型構(gòu)建Agent,按需靈活組合相應(yīng)的功能模塊,無(wú)須在安全、可靠等環(huán)節(jié)耗費(fèi)精力。
AI Agents的開(kāi)發(fā)不再是手工作坊式的探索,進(jìn)入到了標(biāo)準(zhǔn)化的“流水線時(shí)代”,極大地降低了企業(yè)的應(yīng)用門(mén)檻。
02 夯實(shí)地基,驅(qū)動(dòng)Agent從“可用”走向“好用”
創(chuàng)新開(kāi)發(fā)范式僅僅是AI走向生產(chǎn)的第一步。
大模型作為Agentic Al系統(tǒng)的“大腦”,承載著將非結(jié)構(gòu)化的自然語(yǔ)言轉(zhuǎn)化為系統(tǒng)可理解的意圖和目標(biāo)、推理與決策、理解上下文并進(jìn)行連貫的多輪對(duì)話等職責(zé),很大程度上左右著AI Agents的能力上限。
對(duì)應(yīng)的挑戰(zhàn)也很直接。
比如大模型的準(zhǔn)確性,目前主流的大模型均可通過(guò)提示詞工程和檢索增強(qiáng)技術(shù),實(shí)現(xiàn)80%以上的準(zhǔn)確性。但對(duì)一些關(guān)鍵應(yīng)用來(lái)說(shuō),80%的準(zhǔn)確性并不能滿足要求,必須要提升到90%乃至更高。
再比如多模型混合使用,單個(gè)模型的性能總有瓶頸,在實(shí)際的業(yè)務(wù)場(chǎng)景中,常常需要部署不同的大模型,根據(jù)具體的任務(wù)調(diào)用每個(gè)大模型最擅長(zhǎng)的能力,并在多個(gè)模型間靈活切換、高效協(xié)同。
亞馬遜云科技在“紐約峰會(huì)”上進(jìn)行了對(duì)癥下藥。
首先是Amazon Nova大模型的升級(jí),提供了監(jiān)督微調(diào)、對(duì)齊、持續(xù)預(yù)訓(xùn)練、知識(shí)蒸餾等自定義技術(shù),客戶可以在整個(gè)模型訓(xùn)練生命周期中自定義Nova Micro、Nova Lite和Nova Pro等模型,不斷提升準(zhǔn)確性。
其中麻省理工學(xué)院利用Nova模型的定制能力,將超材料研究的屬性預(yù)測(cè)錯(cuò)誤率降低了95%。
為了滿足AI Agents的應(yīng)用形態(tài),亞馬遜云科技還上線了用于構(gòu)建在瀏覽器上執(zhí)行操作的Agent的大模型Amazon Nova Act、構(gòu)建具有類似人類對(duì)話能力的語(yǔ)音Agent的Nova Sonic、最先進(jìn)的多模態(tài)模型Nova Premiere等等。其中Nova Act使用了數(shù)百萬(wàn)個(gè)用戶界面交互進(jìn)行專門(mén)訓(xùn)練,在早期的企業(yè)用例中實(shí)現(xiàn)了超過(guò)90%的端到端任務(wù)完成率。
其次是對(duì)第三方大模型的適配,目前Amazon Bedrock上的大模型提供商已經(jīng)從一年前的7家增長(zhǎng)到了12家,包括Meta、DeepSeek、Anthropic、Cohere等等,只需10天時(shí)間就能將最新的開(kāi)源大模型集成到平臺(tái)上。
亞馬遜云科技深知“沒(méi)有一個(gè)模型能適用于所有用例”,不能依賴某一個(gè)“萬(wàn)能模型”來(lái)解決所有問(wèn)題,將選擇權(quán)還給了客戶,根據(jù)自身業(yè)務(wù)需求、成本和性能考量,靈活地選擇最合適的大模型,并通過(guò)Amazon Bedrock的統(tǒng)一接口便捷訪問(wèn),避免被某一種技術(shù)路線“鎖死”。
這種開(kāi)放、靈活、可組合的模型服務(wù)能力,使大模型真正融入到了企業(yè)業(yè)務(wù)之中,不再是孤立的“AI孤島”。
另一個(gè)不應(yīng)該被忽略的服務(wù)是Amazon Marketplace,新增了AI Agents工具類別,可以理解為提供AI Agents和工具的一站式商店。
企業(yè)可在“商店”中發(fā)現(xiàn)、采購(gòu)、部署并管理來(lái)自領(lǐng)先提供商的AI Agents與相關(guān)工具,借助即插即用的解決方案,以及Agent構(gòu)建、運(yùn)維與擴(kuò)展經(jīng)驗(yàn)的專業(yè)服務(wù),更高效地構(gòu)建AI系統(tǒng)。
做一個(gè)總結(jié)的話,亞馬遜云科技正從底層的推理能力、模型定制,到上層的Agent編排、跨模型協(xié)作,再到生態(tài)層的標(biāo)準(zhǔn)協(xié)議與開(kāi)放,構(gòu)建了一條開(kāi)發(fā)、部署到運(yùn)營(yíng)的“Agent生產(chǎn)線”,驅(qū)動(dòng)AI系統(tǒng)從“可用”走向“好用”。
03 務(wù)實(shí)落地,搭建連接新舊系統(tǒng)的“橋梁”
企業(yè)怎么將Agentic AI落地部署到業(yè)務(wù)系統(tǒng)中呢?
看似是一個(gè)技術(shù)集成的問(wèn)題,實(shí)則是對(duì)組織認(rèn)知、數(shù)據(jù)基礎(chǔ)、架構(gòu)能力乃至管理方式的全面挑戰(zhàn)。畢竟不同行業(yè)的業(yè)務(wù)流程千差萬(wàn)別,企業(yè)的數(shù)字化程度、組織結(jié)構(gòu)、人才能力、數(shù)據(jù)基礎(chǔ)、成本預(yù)算等“稟賦”各不相同,很難像“套模板”一樣復(fù)制AI Agents。
亞馬遜云科技讓外界看到了深刻的務(wù)實(shí)主義,圍繞千行萬(wàn)業(yè)的高頻需求,提供了多元化的工具和服務(wù)。
針對(duì)開(kāi)發(fā)人員對(duì)效率和智能化的要求,亞馬遜云科技將Agent能力融入到了軟件開(kāi)發(fā)的全生命周期。
面向開(kāi)發(fā)人員的IDE智能體Kiro,引入了規(guī)范驅(qū)動(dòng)的開(kāi)發(fā),幫助開(kāi)發(fā)者通過(guò)自然語(yǔ)言規(guī)范和架構(gòu)圖清晰地表達(dá)他們對(duì)復(fù)雜功能的意圖;內(nèi)置的智能代理鉤子,可以自動(dòng)處理生成文檔、編寫(xiě)測(cè)試、優(yōu)化性能等任務(wù);同時(shí)提供了一個(gè)專門(mén)設(shè)計(jì)的界面,能夠適應(yīng)開(kāi)發(fā)者的工作方式,輕松掌控開(kāi)發(fā)過(guò)程。
如果開(kāi)發(fā)者比較喜歡現(xiàn)有的開(kāi)發(fā)環(huán)境,可以將Amazon Q Developer集成到當(dāng)前的IDE中,實(shí)現(xiàn)功能編寫(xiě)、代碼補(bǔ)全、安全掃描等功能。
針對(duì).NET框架、VMware等系統(tǒng)的遷移痛點(diǎn),AWS Transform提供了自動(dòng)化代碼重構(gòu)和遷移的選項(xiàng)。
以VMware Transform智能體為例,實(shí)現(xiàn)了簡(jiǎn)化并自動(dòng)化本地應(yīng)用發(fā)現(xiàn)、遷移波次規(guī)劃、端到端遷移過(guò)程的編排,并且解決了VMware網(wǎng)絡(luò)配置、防火墻規(guī)則轉(zhuǎn)換等難點(diǎn),遷移速度最高可提升80倍。
其中擁有160年歷史的湯森路透,面臨著改造數(shù)十年.NET遺留代碼的挑戰(zhàn)。通過(guò)Amazon Transform,湯森路透.NET應(yīng)用的現(xiàn)代化改造速度提升了4倍,每月處理150萬(wàn)行代碼,讓開(kāi)發(fā)者從維護(hù)“技術(shù)債”的泥潭中解放了出來(lái),將更多的精力專注于創(chuàng)新。
針對(duì)向量數(shù)據(jù)存儲(chǔ)的成本壓力,亞馬遜云科技推出的Amazon S3 Vectors,最高可節(jié)省90%的成本。
由于AI Agents需要海量的知識(shí)和記憶,而這些數(shù)據(jù)通常以向量形式存儲(chǔ),動(dòng)輒數(shù)十億的向量數(shù)據(jù)帶來(lái)的成本壓力不言而喻。
Amazon S3 Vectors堪稱一次“移花接木”式的創(chuàng)新,對(duì)于批處理和非實(shí)時(shí)的智能體任務(wù),可以將長(zhǎng)期向量數(shù)據(jù)集存儲(chǔ)在S3 Vectors中,適用亞秒級(jí)的OpenSearch服務(wù),處理需要高查詢吞吐量和低延遲的工作負(fù)載,進(jìn)而從根本上解決AI Agents長(zhǎng)期記憶和知識(shí)庫(kù)的成本瓶頸,讓大規(guī)模、長(zhǎng)周期的Agent應(yīng)用成為可能。
可以找到的創(chuàng)新還有很多,譬如輕松實(shí)現(xiàn)AI Agent間協(xié)同工作的Strands 1.0、同步處理視頻中的圖像、音頻與文本元素的TwelveLabs AI模型......隱藏在新工具和新服務(wù)背后的,恰恰是亞馬遜云科技幫助客戶解決“歷史包袱”和“成本高墻”的決心。
每一個(gè)創(chuàng)新都是不是“炫技”,瞄準(zhǔn)了企業(yè)落地過(guò)程中的真實(shí)痛點(diǎn),解決“怎么落地”、“怎么遷移”、“怎么控本”的核心問(wèn)題,為企業(yè)搭建起一座從傳統(tǒng)系統(tǒng)邁向未來(lái)架構(gòu)的“橋梁”,讓AI Agents不再停留在愿景。
04 寫(xiě)在最后
當(dāng)AI從工具演變?yōu)榛A(chǔ)設(shè)施,一場(chǎng)時(shí)代洪流正席卷而來(lái)。
著名咨詢公司Gartner在報(bào)告中預(yù)測(cè):到2028年,33%的企業(yè)軟件應(yīng)用程序?qū)珹gentic AI,相比2024年不到1%的占比顯著提升。
另一家咨詢機(jī)構(gòu)MarketsandMarkets也給出了樂(lè)觀判斷:AI智能體市場(chǎng)規(guī)模將從2024年的52.5億美元,增長(zhǎng)到2030年的526.2億美元。
至少亞馬遜云科技已經(jīng)開(kāi)始轉(zhuǎn)動(dòng)飛輪:不斷完善Amazon Bedrock AgentCore等基礎(chǔ)設(shè)施,吸引越來(lái)越多的開(kāi)發(fā)者和服務(wù)商入駐Amazon Marketplace;豐富的工具和智能體解決方案,賦能更多的企業(yè)向智能體時(shí)代轉(zhuǎn)型;而客戶需求和反饋,將反過(guò)來(lái)驅(qū)動(dòng)亞馬遜云科技進(jìn)行更深入的研發(fā)和投入。
一旦正向循環(huán)轉(zhuǎn)動(dòng)起來(lái),AI Agents將是一種新常態(tài)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.