![]()
轉載于:國家金融與發展實驗室|作者:鄒傳偉,江蘇省金科數字與科技金融研究院院長、聶銘江,江蘇省金科數字與科技金融研究院高級研究員
本文長度8506字,建議閱讀時間60分鐘
本文為作者于2026年4月15日在國家金融與發展實驗室科研工作例會上的發言。本文分兩部分。第一部分以銀行業為例,討論人工智能在金融信息處理中的應用。人工智能是一個強大的信息處理工具,而金融資源配置、金融風險管理以及金融機構內部管理和客戶服務等的基礎都是金融信息處理。人工智能應用于金融業,是從金融信息處理開始的;人工智能在金融業的其他應用,基礎是金融信息處理。第二部分在第一部分的基礎上,討論人工智能應用于金融業的三個層次及其影響。
人工智能應用于金融業的內在邏輯
01
人工智能與銀行信息處理
(一)
來自現實的觀察和問題的提出
對人工智能在銀行信息處理中的應用,現實中有3點觀察。第一,生成式人工智能已從大語言模型拓展到能處理圖片、音頻和視頻等的多模態模型,目前主要用于文檔生成(比如會議紀要、客服話術、貸款客戶盡調報告、離任審計報告和合同解析等)、代碼生成、文檔核驗、知識庫和智能問答等。但由于存在幻覺,大語言模型難以直接參與面向客戶的決策和核心業務判斷。第二,解釋型人工智能+替代數據,能高效準確地評估借款人的還款意愿和能力,已在銀行信貸評估中得到廣泛應用。第三,在銀行資本監管的要求下,內部評級法(核心是評估借款人的違約概率PD)仍主要依賴線性回歸、邏輯回歸等傳統“小模型”。
國際清算銀行(BIS)2024年12月一份研究報告1對全球銀行業使用人工智能的情況進行了調研,結果見表1:
表1:全球銀行業使用人工智能的情況
![]()
表1中,除反洗錢(AML)/反恐融資(CFT)中“分析可疑活動”、“實時監測未經授權的信用卡使用”以及“評估是否放貸”等主要屬于解釋型人工智能,其他應用場景主要屬于生成式人工智能。
這就產生了3個需要討論的問題。第一,在銀行信息處理中,“小模型”、解釋型人工智能和生成式人工智能將各自扮演什么角色?第二,這對銀行的模型風險管理有什么影響?第三,這對銀行信貸評估和信貸審批流程有什么影響?
需要說明的是,盡管將解釋型人工智能和生成式人工智能并列討論,但它們之間不是對立關系。第一,解釋型人工智能和生成式人工智能的底層都是人工神經網絡,但在人工神經網絡的架構上有所不同。目前生成式人工智能主要使用基于注意力機制的Transformer架構,解釋型人工智能使用的人工神經網絡架構要更為多樣化。第二,盡管主要分析的數據類型有所不同(見下),但解釋型人工智能和生成式人工智能都在用人工神經網絡來估測數據的概率分布。解釋型人工智能主要應用于分類問題(比如將借款人分類為是否違約或者不同的信用評級),預測屬于某一個類別的概率。生成式人工智能的內核是在概率意義上預測下一個Token(詞元,也可以是一組像素、一段音頻或視頻等),在給出預測結果前會先給出下一個Token在詞表(Vocabulary)中的概率分布。換言之,生成式人工智能內嵌了關于下一個Token的分類問題(解釋型人工智能)。
(二)
銀行放貸技術和處理的信息
銀行與借款人之間存在信息不對稱,銀行信息處理的核心目標是評估借款人的還款意愿和還款能力。盡管銀行處理的信息在具體形態上可以千差萬別,但主要可分為兩種類型。第一,硬信息(Hard information),一般以數字形式存在,定量,結構化,不含主觀判斷、意見或觀察。第二,軟信息(Soft information),一般以文本形式存在,定性,非結構化,主觀判斷、意見和觀察是不可剝離的組成部分,需要結合所處語境來理解。與這兩類信息對應,銀行主要有兩類放貸技術。第一,交易型放貸,使用企業財務報表和信用評分等硬信息。第二,關系型放貸,使用銀行在與企業的長期、多渠道接觸中積累的軟信息,這些信息無法從企業財務報表或公開渠道獲得。從本文分析的角度,以下兩個關系是近似成立的:
硬信息≈ 結構化數據 →交易型放貸
軟信息≈ 非結構化數據 →關系型放貸
對結構化數據,有非常成熟的分析方法,一般分為4個步驟。第一,假設結構化數據背后有一個待估計的數據生成過程。數據生成過程既可以基于理論研究給出的因果關系(對應著結構化模型),也可以基于變量間的統計相關性(對應著簡約化模型)。數據生成過程中包含著一系列有待估計的未知參數,以及誤差項或隨機干擾項,以考慮觀測誤差和缺失變量等的影響。第二,通過樣本數據對參數進行估計。經濟學實證研究一般基于參數估計做假設檢驗,但實際應用中預測更為重要。第三,利用估計得到的模型在樣本外進行預測。第四,評估預測效果。如果預測效果不理想,可以調整模型設置或參數設定(即模型選擇或模型調優)。
在銀行業中,結構化數據分析的代表性應用場景包括:第一,身份識別,根據人臉、指紋、虹膜和聲音等生物特征識別用戶身份;第二,信用評估,評估借款人的信用(是否會違約,以及違約概率高低);第三,異常交易檢測,識別異常交易和欺詐行為。
長期以來,以文本、圖片、音頻和視頻等為代表的非結構化數據被認為只能由人腦生成,不能通過算法生成。大模型的發展已證明,非結構化數據的內在規律比之前認為的要多。首先,非結構化數據通過嵌入(Embedding)或“詞元化”(Tokenization)轉化為詞向量(本質上是低維度空間中的點),從而能被人工神經網絡所處理。這方面的代表性方法包括Word2Vec、GloVe、FastText 等。其次,以ChatGPT為代表的大模型使用基于注意力機制的Transformer架構,通過統計學習,能有效識別非結構化數據中隱含的模式和結構。接著,大模型在概率意義上預測非結構化數據的合理延續(即“下一個Token”),體現為針對提示詞(Prompt)的回復(Response)。
(三)
模型的可解釋性、預測誤差和模型風險管理
不管對結構化數據,還是對非結構化數據,銀行的處理方法本質上都是對數據建模。銀行在何種場景下使用何種模型,都可以納入模型風險管理框架,而這取決于模型的兩個關鍵特征——可解釋性和預測誤差。
模型的可解釋性分為兩個維度。第一,對內的可解釋性,目標是解釋模型內部是如何運作的,回答關于“How”的問題。第二,對外的可解釋性,目標是解釋為什么模型會得到某個結果,回答關于“Why”的問題。一般而言,數據生成過程越復雜,未知參數越多(“模型越大”),模型可解釋性越低。因此,基于人工神經網絡的解釋型人工智能和生成式人工智能在可解釋性上天然不如線性回歸和邏輯回歸等“小模型”,具有“黑盒”特征。
針對結構化數據的模型的預測誤差容易測度。如果被預測的變量屬于連續變量(比如經濟增長率和企業利潤等),預測誤差可以用均方誤差(MSE)來衡量。如果被預測的變量屬于離散變量(比如是否違約、屬于哪個信用評級等),預測誤差可以用兩類錯誤(“棄真”、“存偽”)和ROC曲線下面積(即AUC)等來衡量。
對處理非結構化數據的大模型,“幻覺”實際上對應著預測誤差。大模型既然是在概率意義上預測下一個Token,生成的Token偏離真實情況就屬于題中應有之義。這不是一個通過改進人工神經網絡架構,或者使用更多訓練語料、算力,就能夠修復的“Bug”,而是大模型的內在特征。使用大模型,就意味著需要接受幻覺風險。在現實中,一般通過結合“檢索增強生成”(RAG)技術和知識圖譜等方法來緩解大模型帶來的幻覺風險。這本質上是在對幻覺風險容忍程度低的場景使用其他信息處理方法,而非修復大模型的幻覺問題。另外還需指出的是,對包括本文在內的非結構化數據的理解帶有主觀因素,評估文本生成效果比評估結構化數據的預測效果更困難。有監督的微調(SFT)和基于人類反饋的強化學習(RLHF)等大模型對齊技術針對的就是這個問題。
從模型風險管理的角度,存在可解釋性問題或預測誤差并不意味著模型不可用,而是需要結合應用場景和風險容忍度進行管理。不同銀行和不同應用場景下,對模型風險的容忍度可能有所差異。比如,一般情況下,內部信用評估模型的AUC到0.65就可以被接受。模型風險管理也可以像信用風險、市場風險和流動性風險等那樣適用“三道防線”的管理框架。
解釋型人工智能和生成式人工智能都可以納入風險管理的主流分析框架。從微觀審慎監管的角度,人工智能產生的風險主要體現以下方面。第一,信用風險:低估違約概率或違約后損失。第二,網絡安全風險:與外部服務供應商的聯系增多;多個系統之間的IT聯系增多;人工智能在模型訓練中遭遇“數據下毒”。最近廣受關注的事件是,Anthropic的Claude Mythos被用于發現代碼漏洞。第三,聲譽風險:運營失敗影響公眾信任;不公平對待客戶造成負面輿情。第四,戰略風險:與其他機構的合作使銀行失去對核心功能的掌控。第五,法律風險:人工智能模型訓練語料可能侵權;面向客戶的人工智能工具可能提供不準確或不恰當的回復。第六,數據隱私風險:人工智能模型在訓練和使用中可能泄露個人或敏感信息。
從宏觀審慎監管的角度,人工智能產生的風險主要體現為:第一,“羊群”行為,來自不同銀行使用相同基礎模型和訓練語料;第二,第三方人工智能供應商造成市場集中和相互關聯。到目前為止,全球很少有大銀行通過預訓練研發出性能好的基礎模型,主要使用頭部大模型公司和互聯網公司研發的基礎模型,基礎模型及相關供應商的集中化趨勢已不容忽視。
總的來說,不同模型應根據應用場景發揮各自優勢,實現協同增效。“小模型”、解釋型人工智能和生成式人工智能之間不存在相互替代關系,而是互補關系。大模型因為“幻覺”不能直接面向銀行客戶,但可以作為銀行員工的“副駕駛”(Copilot),輔助信息處理和報告生成。大模型的輸出還作為“小模型”的輸入。大模型將顯著提高銀行處理非結構化數據的效率和效果。
(四)
人工智能在銀行業的滲透順序
生成式人工智能目前主要用在銀行內部輔助場景。盡管解釋型人工智能在銀行信貸評估中應用情況良好,監管機構還是偏好可解釋性強的“小模型”。比如,在巴塞爾資本協議中,風險資本計量的核心工具是風險價值(VaR);貸款組合的信用風險計量的基礎是漸進單因子風險模型;內部評級法在測量違約概率(PD)的主流工具是線性回歸和邏輯回歸。因此,人工智能在銀行業呈現出圖1所示的滲透順序。
![]()
圖1 人工智能在銀行業的滲透順序
從圖1可以看出:第一,模型的可解釋性與預測效力之間存在反向關系,其中生成式人工智能的預測效力最強,但可解釋性最低;第二,人工智能在銀行業的滲透順序是從內部輔助場景逐漸深入到以資本監管為代表的核心場景。
圖2顯示了人工智能對銀行放貸技術的影響。隨著信息和通訊技術(ICT)的發展,越來越多信息以數字化方式被收集和記錄下來(硬信息占比越來越高),成為可以被模型分析的對象。大模型顯著提高了銀行分析非結構化數據的能力。因此,一部分關系型放貸將變為交易型放貸,銀行信貸審批權可以適當上收。在現實中已經出現這個趨勢。
![]()
圖2 人工智能對銀行放貸技術的影響
02
人工智能應用于金融業的三個層次及其影響
以金融信息處理為基礎,人工智能在金融業有深廣的應用前景。一方面,金融業自身特性適配人工智能;另一方面,人工智能從“工具→助手→智能體”的演進,將深化人工智能在金融業的應用。在這兩方面合力下,人工智能應用于金融業從淺到深將體現為三個層次,并將對金融業產生深遠影響。
(一)
金融業與人工智能的適配性
金融業與人工智能的適配性主要體現在兩個方面。第一,行業特征匹配。首先,金融業信息密集,大量工作涉及處理研報、公告、合同、監管文件等非結構化文本,與大語言模型的核心能力契合。大模型將使非結構化數據更有效地進入金融系統,提高金融活動的效率。其次,金融業流程密集,業務環節步驟清晰,輸入輸出明確,便于人工智能從輔助單個步驟到參與完整流程,并且流程中大量手工操作可以被自動化工具替代。最后,金融業規則密集,為人工智能制定了明確的操作邊界。“流程密集+規則密集”使得人工智能深度嵌入金融業務流程,從處理信息到處理資金。第二,來自成本效率、客戶競爭、合規壓力、人才培養四方面的壓力推動金融機構部署人工智能。特別在我國,銀行業在凈息差下降背景下有很強動力去部署人工智能。
最強的人工智能基礎模型一般由頭部人工智能公司和互聯網公司開發,但金融業對數據安全性要求較高,不能直接使用公共API。經過過去幾年的探索,金融業逐漸收斂到3種數據安全解決方案。第一,“防火墻網關”模式:金融機構自建綜合人工智能平臺接入外部模型,員工的請求通過內部網關路由,數據在防火墻內經過加密、脫敏和權限檢查后發送至外部模型。第二,混合云架構:按數據敏感度分層處理,最敏感的數據留在私有云或本地環境,中等敏感的任務通過企業級公有云配合加密和隔離處理,非敏感性負載考慮更開放的云環境。第三,完全本地化部署:使用開源模型在企業自有基礎設施上運行,所有數據處理在內部完成,不依賴于外部API。
(二)
人工智能從“工具→助手→智能體”的演進
人工智能從“工具→助手→智能體”演進的核心不是技術代際的更替(目前主流大模型都是Transformer架構,尚未出現有競爭力的替代性架構),而是人機關系的變化,體現在4個邊界上的拓展。第一,能力邊界:人工智能在每個階段能做什么、不能做什么?第二,權限邊界:人工智能被允許訪問和操作哪些系統和數據?第三,流程邊界:人工智能嵌入業務流程的深度和廣度。第四,責任邊界:人工智能參與的決策和行動中,責任如何歸屬?
1.工具或“副駕駛”
這一階段的核心特征是“人發起、人主導、人審核”;人工智能提供建議、補充信息和加速產出,但不主動行動,不連接其他系統,不執行操作;每一次人機交互都是獨立的。代表性應用是聊天機器人,大模型主要發揮“在概率意義上生成下一個Token”這一基礎功能。
2.助手
這一階段的核心特征是“人分配任務、人工智能持續協作、人保留關鍵判斷權”;人工智能“知道”用戶是誰、在做什么、之前討論過什么,能持續跟進、“記住”前情和“理解”偏好等,開始被嵌入特定崗位的工作流中,但不自主行動、不直接操作用戶的電腦系統。
這一階段得益于“檢索增強生成”(RAG)技術。大模型的輸出能與搜索引擎的結果、知識圖譜和專家知識等結合在一起,緩解大模型的幻覺問題,提高輸出結果的準確性和時效性。
人工智能“記住”前情、與用戶持續互動的基礎是,人工智能與用戶的過往交互記錄被包含在提示詞中。但這種交互不改變大模型的權重設置,大模型沒有發生真正意義上的“學習”。如果將大模型視作一個函數,將大模型的權重視作函數的參數,那么將過往交互記錄包含在提示詞中,是通過改變函數的輸入來改變函數的輸出;但函數的參數不受影響,大模型本身不變。換言之,關于用戶的“記憶”體現在提示詞中,大模型對用戶是沒有記憶的。
3.智能體
這一階段的核心特征是,人工智能可以規劃步驟、調用工具、連接電腦系統并根據反饋調整執行;不等于完全無人化,更現實的形式是有邊界的半自動執行,人工智能在明確的規劃、權限和審批節點下自主運行,關鍵決策仍需人工審批。
目前媒體上對智能體有不少夸大和不實的說法。智能體沒有改變大模型“在概率意義上生成下一個Token”這一基礎功能;智能體能反復調用大模型,但不改變大模型的權重設置。智能體改變的是大模型的調用方式以及大模型與電腦系統之間的互動,相關創新被概括為“上下文工程”(Context engineering)。首先,大模型的輸出中包含對電腦系統的調用指令。接著,如果用戶給予授權或批準,這些指令將在用戶的電腦系統上被執行并產生真實影響,這樣大模型看起來就不是“只說不做”。然后,這些真實影響又被納入提示詞中,作為新一輪輸入來調用大模型。如此往返,使得大模型能在人類的指令、授權和審批下,分步驟地執行復雜任務。
這一階段還得益于“模型上下文協議”MCP、“智能體間協議”A2A等標準化連接協議,使得多智能體相互調用、相互協作成為可能。
智能體落地離不開一系列前提條件。第一,工具接口:智能體需要通過標準化接口連接用戶電腦系統。第二,權限分層:智能體能訪問和操作的范圍必須有嚴格限定。第三,審批節點:涉及資金移動、客戶信息修改或對外通信等關鍵步驟必須有人工審批。第四,日志追蹤:智能體的每一步決策和操作必須有完整記錄,支持事后審計。第五,評估機制:需要對智能體輸出質量和行為合規性進行持續監測。第六,人工兜底:智能體遇到無法處理的情況必須有明確的升級和回退路徑。
(三)
人工智能在金融業應用的三個層次
1.作為工具增強個人
首先,法務、合規、客服、代碼開發和文檔處理等中后臺崗位因為任務高頻、標準化程度較高,人工智能落地速度較快。其次,對知識密集型的前臺崗位(比如投研),人工智能將替代部分重復性勞動,改變工作流程中獲取信息和整理材料的速度,但不改變決策環節的責任歸屬。在這一層次,所有業務風險、合規要求和最終決策責任仍完全由人類員工承擔。
2.作為助手“理解”角色、上下文和客戶
首先是面向員工的助手。助手可以圍繞員工的崗位持續工作,跟進員工正在處理的客戶關系,記住員工上周討論過的交易條款、在員工準備下一次客戶會面之前整理相關材料。其次是面向客戶的助手。從答疑延伸到協助處理具體事務,人工智能開始參與查賬單、轉賬確認和輕量服務流程。在這一層次,雖然核心判斷權仍保留在人類員工手中,但當人工智能憑借對多維數據的追蹤給出個性化建議,責任邊界開始模糊。
3.智能體開始參與完整業務流程
人工智能在明確邊界內接手多步驟任務,以釋放人力聚焦于意外事件處理和關鍵判斷。目前看,智能體主要適用兩類場景。首先是規則驅動型流程場景。比如,反洗錢、制裁合規、KYC審查和合規報送等,具有規則清晰、步驟標準和數據來源明確等特點。其次是“知識+流程”混合型場景。比如,投研部門資料收集與初步分析、財報比較、市場監測與預警、客戶經營任務編排等。
(四)
人工智能對金融業的影響
第一,對業務模式的影響。首先,客戶服務從被動響應轉向主動管理。比如,財富管理模式從標準化的資產配置工具向基于客戶目標的動態管理模式演變。其次,服務入口拓展。金融服務入口不再局限于銀行網點或手機App,開始延伸到對話式人工智能平臺。比如,萬事達和OpenAI合作,客戶在與人工智能的對話中即可完成支付,無需跳轉到銀行界面。最后,智能體之間的支付是近期廣受關注的方向。
第二,對組織分工和人才結構的影響。首先是崗位影響。后臺運營、初級研究、合規處理等規則清晰、步驟可拆分、輸入輸出可標準化的任務更易被自動化。客戶關系、復雜判斷、倫理決策和創造性策略等不易替代。總的趨勢是“重塑崗位”而非簡單“替代崗位”,通過自然減員和內部調崗實現轉型。其次是職責轉變。員工職責從親手操作每一步,轉向任務設計、結果審核和突發情況處理。員工不再只需要掌握業務本身,更需判斷哪些任務可以交給人工智能,哪些節點必須重新回到人工處理。
第三,對技術架構的影響。金融機構正在大規模將人工智能朝著基礎設施的方向進行部署。人工智能基礎設施工程的復雜度高,同時涉及算力層(算力調度和優化)、數據層(統一知識底座和數據權限體系)、模型層(多模型的選用、更新和退役治理)和工具層(為智能體提供標準化的系統連接接口)等,是一個系統工程。人工智能從“工具→助手→智能體”的演進路徑,也是金融機構從局部部署走向平臺化建設的路徑。工具階段可以容忍局部試點,助手階段要求角色和上下文接通,智能體階段則要求系統之間能可靠協同。因此,人工智能不再是IT部門的一個項目,而是需要獨立的組織架構、專門的預算和高管層面的治理監督。
(五)
未來展望
受益于智能體能力的提升,人工智能有望從單一模型進化為調度中樞。這種升級體現在數據檢索與模型計算兩個維度的重構。在數據處理維度,具備自主規劃能力的數據智能體可以逐步替代傳統架構。幻覺并非通過改進架構或增加訓練語料就能修復的缺陷,而是大語言模型在概率意義上預測下一個詞元的內在特征。為了控制這一風險,數據智能體將大模型的輸出從最終結論降級為可被驗證的中間件。在應對業務場景時,智能體可以將用戶意圖轉化為結構化查詢語句或可執行代碼。代碼能否運行、底層數據庫返回是否合理,均可接受確定性檢驗。幻覺即使在生成查詢環節出現,也會在執行失敗時被系統攔截,從而避免了錯誤信息直接進入核心流程。
在模型計算維度,大型通用模型與傳統專用小模型的協同調用將成為滿足嚴苛監管要求的關鍵路徑。針對大語言模型可解釋性較低的黑盒特征,這一架構可以將不確定性后撤到工具調用層。在需要高度可解釋性的場景中,核心風險計量的計算邏輯仍由傳統專用小模型完成。大模型不參與最終數值的估測,僅負責處理前置的非結構化數據并生成調用指令。這一設計充分發揮了不同模型的互補優勢,并將審計追蹤的對象從人工神經網絡內部復雜的參數權重,轉變為從自然語言指令到代碼執行再到傳統專用小模型輸出的完整可追溯鏈路。無論是數據智能體對底層信息的精準抓取,還是大模型對小模型的計算分發,這種依靠架構設計而非單一模型來約束不確定性的路徑,可以有效契合金融業模型風險管理的要求。未來需要進一步探討的核心議題是,當系統的風險節點從文本生成層面全面向代碼生成與工具調用層面遷移時,與之相應的日志追蹤、評估機制和人工兜底審批節點等應如何進行匹配。
【1】Sector: Recent Developments and Main Challenges", FSI Insights on policy implementation No. 63.
THE END
轉載聲明:本微信公眾號刊登的文章僅代表作者本人觀點,不代表中國普惠金融研究院及本微信公眾號觀點
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.