網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

展望2026：智能體必須關(guān)進(jìn)“制度”的籠子里

2026-01-07 12:18:54　來源: 深度圍觀創(chuàng)作

北京舉報(bào)

分享至

編者按：

AI智能體正重塑產(chǎn)業(yè)格局，2028年33%企業(yè)軟件將內(nèi)嵌代理型AI。亞馬遜云科技通過Bedrock AgentCore的Policy與Evaluations構(gòu)建“制度籠子”：自然語言定義行為邊界，13項(xiàng)評(píng)估器全流程監(jiān)控，讓智能體在安全邊界內(nèi)釋放價(jià)值——技術(shù)狂奔時(shí)，合規(guī)才是終極加速器。

用自然語言設(shè)定行為邊界，以持續(xù)評(píng)估機(jī)制構(gòu)建安全防線，AI智能體的“制度籠子”正從技術(shù)理念變?yōu)槠髽I(yè)級(jí)標(biāo)準(zhǔn)。

當(dāng)AI智能體（Agent）從實(shí)驗(yàn)室的概念驗(yàn)證，一躍成為滲透金融審批、醫(yī)療輔助、跨境客服、代碼生成等核心場(chǎng)景的“數(shù)字同事”，一場(chǎng)效率革命正以前所未有的速度重塑產(chǎn)業(yè)格局。

Gartner預(yù)測(cè)，到2028年，33%的企業(yè)軟件應(yīng)用將內(nèi)嵌代理型AI，15%的日常工作決策將由智能體自主完成，而2024年這一比例幾乎為零。但狂奔的背后，風(fēng)險(xiǎn)隱患也在暗流涌動(dòng)。

2025年被業(yè)界公認(rèn)為“Agentic AI原點(diǎn)之年”，智能體已完成從“被動(dòng)應(yīng)答”到“主動(dòng)執(zhí)行”的范式躍遷。與傳統(tǒng)AI助手不同，現(xiàn)代智能體能夠拆解模糊任務(wù)、自主調(diào)度數(shù)據(jù)、協(xié)同外部系統(tǒng)，甚至在執(zhí)行中自我修正，成為“人的延伸”。未來會(huì)有數(shù)十億個(gè)Agent活躍在各類場(chǎng)景，它們不再是簡單工具，而是能獨(dú)立完成復(fù)雜任務(wù)的協(xié)作伙伴，但缺乏規(guī)則約束的技術(shù)創(chuàng)新如同無舵之舟，遲早會(huì)偏離價(jià)值軌道，只有把安全合規(guī)作為底層邏輯，智能體才能真正賦能產(chǎn)業(yè)。

智能體的規(guī)模化發(fā)展絕不能“裸奔”。如何在釋放技術(shù)紅利的同時(shí)筑牢安全防線？亞馬遜云科技在re:Invent 2025中國行活動(dòng)中給出了明確答案：通過Amazon Bedrock AgentCore平臺(tái)的Policy策略管制與Evaluations評(píng)估體系兩大核心工具，將抽象的制度規(guī)范轉(zhuǎn)化為可落地的技術(shù)約束，為智能體打造安全可控的“制度籠子”。

AgentCore Policy為智能體立“規(guī)矩”

筑牢事前合規(guī)防線

智能體“失控”的核心癥結(jié)，在于缺乏明確的行為邊界和權(quán)限規(guī)范。傳統(tǒng)智能體的權(quán)限管理依賴復(fù)雜代碼編程，技術(shù)門檻高且難以適配動(dòng)態(tài)變化的業(yè)務(wù)與監(jiān)管要求，而AgentCore Policy功能的推出，徹底改變了這一現(xiàn)狀，如同為智能體制定了一套可執(zhí)行的“行為準(zhǔn)則”，讓合規(guī)要求前置嵌入運(yùn)行邏輯。

作為Amazon Bedrock AgentCore的核心能力之一，Policy隸屬于Gateway模塊，支持通過Cedar策略語言，以自然語言形式直接定義智能體的操作邊界和權(quán)限范圍，即使是非技術(shù)背景的合規(guī)人員也能輕松配置。這些規(guī)則會(huì)集成到運(yùn)行環(huán)境中，對(duì)智能體的每一次數(shù)據(jù)訪問、系統(tǒng)調(diào)用和決策執(zhí)行進(jìn)行毫秒級(jí)實(shí)時(shí)校驗(yàn)，確保其始終在預(yù)設(shè)框架內(nèi)運(yùn)行。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建

通過Cedar，可以把策略在毫秒級(jí)之內(nèi)就可以部署到Amazon Bedrock AgentCore Gateway。由于這些操作、這些策略不是在智能體內(nèi)，它是在智能體和訪問的這些工具之間，所以它可以嚴(yán)格地保證智能體在執(zhí)行操作的時(shí)候能夠嚴(yán)格地按照要求來。執(zhí)行是通過Policy在智能體以外得到實(shí)施的，智能體的執(zhí)行的時(shí)候，它不會(huì)去做跟這些策略相違背的這些行為。

比如，某跨境電商平臺(tái)通過自然語言設(shè)定規(guī)則：“當(dāng)退款金額高于1000美元時(shí)，阻止智能體自主處理，觸發(fā)人工審核”，無需復(fù)雜代碼即可落地執(zhí)行；醫(yī)療行業(yè)開發(fā)者設(shè)定“禁止智能體提供具體用藥建議”“涉及手術(shù)方案必須引導(dǎo)用戶咨詢主治醫(yī)生”等規(guī)則，有效防范醫(yī)療風(fēng)險(xiǎn)；金融機(jī)構(gòu)則通過Policy限制智能體訪問核心資金賬戶，僅開放必要查詢權(quán)限，確保資金安全。更重要的是，Policy支持動(dòng)態(tài)調(diào)整，企業(yè)可根據(jù)業(yè)務(wù)變化和監(jiān)管更新實(shí)時(shí)優(yōu)化規(guī)則，讓“制度籠子”始終適配實(shí)際需求，真正實(shí)現(xiàn)“信任，但要驗(yàn)證”的治理原則。

AgentCore Evaluations做智能體的“督察員”

構(gòu)建全流程質(zhì)量管控

如果說Policy是“事前預(yù)防”的行為邊界，那么AgentCore Evaluations就是“事中監(jiān)控”與“事后優(yōu)化”的質(zhì)量標(biāo)尺，精準(zhǔn)解決了智能體行為質(zhì)量難以量化評(píng)估的行業(yè)痛點(diǎn)。傳統(tǒng)評(píng)估方式需要投入大量數(shù)據(jù)科學(xué)資源，搭建復(fù)雜評(píng)估體系，且難以應(yīng)對(duì)智能體快速迭代帶來的動(dòng)態(tài)變化，而Evaluations提供了開箱即用的全流程評(píng)估解決方案。

Evaluations內(nèi)置13個(gè)預(yù)構(gòu)建評(píng)估器，覆蓋正確性、安全性、實(shí)用性、工具選擇準(zhǔn)確性、目標(biāo)達(dá)成率等核心維度，無需企業(yè)額外搭建基礎(chǔ)設(shè)施。它如同智能體的“專職督察員”，通過持續(xù)采樣實(shí)時(shí)交互數(shù)據(jù)，對(duì)運(yùn)行狀態(tài)進(jìn)行全方位監(jiān)測(cè)和量化評(píng)估。

在客服場(chǎng)景中，它能自動(dòng)分析智能體回復(fù)的合規(guī)性和問題解決效率，比如當(dāng)用戶滿意度在8小時(shí)內(nèi)下降10%時(shí)，系統(tǒng)會(huì)立即觸發(fā)預(yù)警；在代碼生成場(chǎng)景，評(píng)估器會(huì)檢測(cè)輸出代碼的安全性和可擴(kuò)展性，避免漏洞代碼引發(fā)系統(tǒng)風(fēng)險(xiǎn)；對(duì)于金融、醫(yī)療等特殊行業(yè)，Evaluations還支持基于自定義LLM和提示詞構(gòu)建專屬評(píng)估器，滿足行業(yè)特定標(biāo)準(zhǔn)。

比如，通過自定義評(píng)估器，將“分析報(bào)告必須引用最新行業(yè)數(shù)據(jù)”“禁止提供確定性投資建議”等專業(yè)要求轉(zhuǎn)化為量化指標(biāo)，確保輸出內(nèi)容合規(guī)可靠。Evaluations讓智能體的行為可量化、可追溯、可優(yōu)化，為企業(yè)提供了科學(xué)的質(zhì)量管控工具。”

結(jié) 語

Policy與Evaluations的協(xié)同配合，構(gòu)建起“事前設(shè)限—事中監(jiān)控—事后優(yōu)化”的全流程治理體系，讓智能體規(guī)模化應(yīng)用有了安全保障。在這套體系支撐下，不同行業(yè)、不同規(guī)模的企業(yè)都實(shí)現(xiàn)了智能體安全落地。

值得注意的是，這套治理方案并非束縛智能體的創(chuàng)新活力，而是通過明確規(guī)則和科學(xué)評(píng)估，讓智能體在安全可控范圍內(nèi)發(fā)揮最大價(jià)值。AgentCore的全棧架構(gòu)支持Policy、Evaluations與Memory等功能深度協(xié)同，智能體在Policy劃定的邊界內(nèi)自主運(yùn)作，通過Evaluations發(fā)現(xiàn)的問題，可結(jié)合Memory功能優(yōu)化后續(xù)行為，形成“治理—運(yùn)行—優(yōu)化”的閉環(huán)。這種模式既解決了企業(yè)對(duì)智能體安全的顧慮，又通過低代碼特性降低開發(fā)門檻，讓中小企業(yè)也能享受到技術(shù)創(chuàng)新紅利。

隨著智能體從辦公協(xié)同等基礎(chǔ)場(chǎng)景，加速滲透到支付處理、貸款審批、安全審計(jì)等嚴(yán)肅業(yè)務(wù)領(lǐng)域，治理體系的重要性日益凸顯。亞馬遜云科技的實(shí)踐表明，技術(shù)創(chuàng)新與風(fēng)險(xiǎn)治理并非相互對(duì)立，而是相輔相成的共生關(guān)系。AgentCore Policy和Evaluations的雙輪驅(qū)動(dòng)，將抽象的制度規(guī)范轉(zhuǎn)化為可執(zhí)行、可監(jiān)測(cè)、可優(yōu)化的技術(shù)方案，讓“把智能體關(guān)進(jìn)制度籠子”從理念變?yōu)楝F(xiàn)實(shí)。

Policy劃定的行為邊界和Evaluations構(gòu)建的評(píng)估體系，共同構(gòu)成了智能體安全發(fā)展的“護(hù)欄”。這種治理模式不僅適用于當(dāng)前的智能體應(yīng)用，更為未來數(shù)十億智能體共存的數(shù)字生態(tài)奠定了信任基礎(chǔ)。

在AI技術(shù)飛速發(fā)展的今天，智能體的“瘋狂生長”是必然趨勢(shì)，但“裸奔式”發(fā)展絕不可取。畢竟再快的“裸奔”也無法抵擋風(fēng)中的沙子。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.