認知靈活性作為貝葉斯狀態(tài)估計的潛在結(jié)構(gòu)算子
Cognitive Flexibility as a Latent Structural Operator for Bayesian State Estimation
https://arxiv.org/pdf/2604.08130
![]()
摘要:
深度隨機狀態(tài)空間模型使得在非線性、部分可觀測系統(tǒng)中進行貝葉斯濾波成為可能,但通常假設(shè)潛在結(jié)構(gòu)是固定的。當該假設(shè)被違背時,僅進行參數(shù)自適應(yīng)可能導致持續(xù)的信念不一致。我們引入認知靈活性(CF)作為一種表征級算子,它通過基于信息的預(yù)測得分在線選擇潛在結(jié)構(gòu),同時保持貝葉斯濾波遞歸。結(jié)構(gòu)失配被形式化為固定結(jié)構(gòu)下不可消除的預(yù)測不一致性。結(jié)果表明,由此產(chǎn)生的信念-結(jié)構(gòu)遞歸是適定的,展現(xiàn)出結(jié)構(gòu)下降性質(zhì),并允許有限次切換,且在模型設(shè)定正確時可歸約為標準貝葉斯濾波。在潛在動態(tài)失配、觀測結(jié)構(gòu)偏移及設(shè)定正確的情境下進行的實驗證實,CF在存在失配時能提升預(yù)測精度,同時在模型設(shè)定正確時保持非侵入性。
關(guān)鍵詞:隨機狀態(tài)空間模型;信念推斷;潛在結(jié)構(gòu);結(jié)構(gòu)自適應(yīng);不確定性感知估計。
1 引言
現(xiàn)代具備學習能力的控制系統(tǒng)[1,2]越來越多地在系統(tǒng)狀態(tài)、觀測與輸入之間的關(guān)系并非固定不變,而是隨時間演變的環(huán)境中運行。這種演變出現(xiàn)在許多物理系統(tǒng)[3]中,源于傳感模態(tài)、運行工況[4]、任務(wù)語義或交互條件的變化,在具有柔順動力學特性[5]或強環(huán)境耦合[6,7]的系統(tǒng)中尤為顯著。當這些變化發(fā)生時,局部準確的模型可能會在整體上與真實的數(shù)據(jù)生成過程失配,導致持續(xù)的預(yù)測誤差和閉環(huán)性能下降——即使采用了經(jīng)典的參數(shù)自適應(yīng)或魯棒化技術(shù)[8,9]。因此,理解如何對這種結(jié)構(gòu)非平穩(wěn)性進行推理并作出響應(yīng),對于不確定性下的可靠控制與決策至關(guān)重要。
通常,控制與決策中的不確定性通過假設(shè)模型結(jié)構(gòu)固定,并通過參數(shù)自適應(yīng)、魯棒控制器設(shè)計或隨機噪聲建模來補償失配加以處理[10–12]。在此范式下,控制與預(yù)測是針對狀態(tài)信念(即給定可用觀測值所推斷出的潛在狀態(tài)分布)進行的,而非針對真實但未觀測到的系統(tǒng)狀態(tài)[13]。隨后,貝葉斯狀態(tài)估計[14]為該信念的時間演化提供了一致性的機制,并構(gòu)成了具備學習能力的控制系統(tǒng)的核心基礎(chǔ)。
然而,當所假設(shè)的潛在結(jié)構(gòu)本身不正確時,這些機制從根本上受到限制:所產(chǎn)生的信念可能在數(shù)值上依然定義良好,但卻與真實的系統(tǒng)行為產(chǎn)生系統(tǒng)性不一致。這種現(xiàn)象——此處稱為結(jié)構(gòu)失配——無法僅通過參數(shù)更新消除,并構(gòu)成了固定表示模型的一種內(nèi)在故障模式。盡管其在機器人技術(shù)、自主系統(tǒng)與基于學習的控制中具有廣泛的實際意義,但結(jié)構(gòu)失配在貝葉斯信念演化本身層面(即[15–17])所受到的形式化處理仍然有限。
近年來,數(shù)據(jù)驅(qū)動建模顯著擴展了經(jīng)典的狀態(tài)空間模型(SSM)框架[18]。特別是,深度隨機狀態(tài)空間模型(DeepSSSMs)[19,20]將貝葉斯濾波與從數(shù)據(jù)中學習到的具有強表達力的非線性表示相結(jié)合,使得在復(fù)雜高維系統(tǒng)中進行狀態(tài)估計與預(yù)測成為可能,包括用于規(guī)劃與控制的基于視覺的模型和潛在動力學模型[21–25]。除了起源于序列建模之外,深度狀態(tài)空間表述已被越來越多地應(yīng)用于系統(tǒng)辨識與面向控制的建模中,包括神經(jīng)狀態(tài)空間架構(gòu)、基于編碼器的辨識流程以及用于基于學習的控制的隨機潛在模型[19,26,27,16,28,29]。盡管取得了這些進展,大多數(shù)DeepSSSM表述仍保留了從經(jīng)典模型繼承的一個關(guān)鍵假設(shè):狀態(tài)空間模型的潛在結(jié)構(gòu)在整個運行過程中是固定的。
這種固定結(jié)構(gòu)假設(shè)恰恰在學習型模型最具吸引力的場景中變得具有限制性:在傳感與交互條件變化下的部署,以及超出訓練分布的運行[30]。在實踐中,潛在狀態(tài)與觀測之間的關(guān)系可能因傳感器退化、環(huán)境變化、未建模的運行工況或任務(wù)語義的轉(zhuǎn)變而發(fā)生變化(即[31])。當此類變化發(fā)生時,固定潛在表示內(nèi)的參數(shù)自適應(yīng)往往是不充分的:貝葉斯信念可能在數(shù)值上依然定義良好,但卻與真實的數(shù)據(jù)生成過程產(chǎn)生系統(tǒng)性錯位,從而產(chǎn)生持續(xù)的預(yù)測誤差并導致閉環(huán)性能下降[8,32,33]。在不確定性量化、風險敏感性與可靠性對安全決策至關(guān)重要的場景中,該問題尤為尖銳[34–37]。
在控制與估計領(lǐng)域,解決模型失配與非平穩(wěn)性的需求早已被認識到[38–40]。經(jīng)典方法包括自適應(yīng)觀測器[41]、增益調(diào)度[42]以及多模型估計[43,44]。交互多模型(IMM)濾波器與混合觀測器[45,46]允許在一組有限的預(yù)定義結(jié)構(gòu)之間進行切換,并且當相關(guān)運行工況能夠被先驗識別時,它們具備強有力的理論保證[47,43,48,49]。這些方法闡明了一個重要觀點:結(jié)構(gòu)變化是可以處理的,但通常僅在能夠提前枚舉出“正確”模式并維護與模式一致的濾波模型時才可行。
然而,在許多當代數(shù)據(jù)驅(qū)動的場景中,支撐經(jīng)典混合與多模型方法的枚舉假設(shè)難以成立。結(jié)構(gòu)失配可能無法通過少量固定的候選模型庫很好地捕獲,且學習到的潛在表示可能以一種難以通過標準殘差分析或噪聲膨脹輕易診斷的方式失效。因此,近期的工作探索了學習增強的濾波流程[50]、元學習策略[51,52]以及跨任務(wù)泛化[29]。盡管這些方法大幅擴展了表示能力,但它們留下了一個對可靠性至關(guān)重要的系統(tǒng)理論問題:當潛在表示本身變得受限時,貝葉斯信念演化應(yīng)如何響應(yīng)?
我們引入認知靈活性(CF)[53,54]作為DeepSSSMs中用于結(jié)構(gòu)重組的信念級機制。CF被形式化為一種算子,用于在給定時刻選擇由哪個潛在表示主導信念演化。對于任何固定結(jié)構(gòu),底層的貝葉斯濾波遞歸保持不變;CF僅通過以下方式起作用:當持續(xù)的信念不一致表明當前結(jié)構(gòu)已變得受限時,啟用表示之間的受控切換。因此,表示自適應(yīng)變得顯式且可分析,同時保留了信念演化的概率適定性。
據(jù)此,CF并非一種估計啟發(fā)式方法,而是在結(jié)構(gòu)非平穩(wěn)性下支配信念演化的表示級控制變量;它在一組預(yù)定義的潛在結(jié)構(gòu)族上運行,而非在線合成新的表示。
從系統(tǒng)理論的角度來看,這一表述提出了現(xiàn)有DeepSSSM或混合估計框架尚未明確解決的三個問題:(i)如何將結(jié)構(gòu)失配刻畫為固定潛在表示的內(nèi)在局限性;(ii)如何將表示重組建模為一種與貝葉斯濾波相互作用而非取代它的算子;以及(iii)在何種條件下,在線結(jié)構(gòu)自適應(yīng)能夠提升預(yù)測一致性,同時保持受控與穩(wěn)定。
貢獻。本文推進了關(guān)于表示自適應(yīng)及其系統(tǒng)理論影響的信念級視角。主要貢獻如下。 (i)結(jié)構(gòu)失配作為一種根本性的估計故障模式。我們將結(jié)構(gòu)失配形式化為真實條件狀態(tài)分布與由任何固定潛在結(jié)構(gòu)誘導的后驗信念之間不可消除的散度。該刻畫識別出一類無法僅通過參數(shù)自適應(yīng)、魯棒化或噪聲建模消除的估計誤差[8,44,33]。 (ii)認知靈活性作為一種信念級結(jié)構(gòu)算子。我們引入認知靈活性(CF)作為一種直接與貝葉斯濾波遞歸耦合的潛在結(jié)構(gòu)算子。與假設(shè)固定潛在表示且僅通過參數(shù)更新進行自適應(yīng)的經(jīng)典及基于學習的狀態(tài)空間模型[10,11,22–24,19]不同,CF實現(xiàn)了跨越潛在結(jié)構(gòu)的受控切換。
(iii)自適應(yīng)信念演化的系統(tǒng)理論性質(zhì)。我們確立了所得信念-結(jié)構(gòu)動力學的基本性質(zhì),包括信念空間不變性、基于信息的結(jié)構(gòu)單調(diào)改進、在得分持續(xù)分離條件下的有限次切換,以及在結(jié)構(gòu)設(shè)定正確時向標準貝葉斯濾波的歸約。這些結(jié)果通過提供表示重組的信念級刻畫,并闡明結(jié)構(gòu)自適應(yīng)在何時能帶來改善以及何時保持非侵入性,從而對經(jīng)典的多模型與混合估計框架[47,43]形成了補充。 數(shù)值實驗證明了系統(tǒng)從潛在動力學失配中的恢復(fù)能力、在觀測結(jié)構(gòu)偏移下的自適應(yīng)能力,以及在設(shè)定正確工況下的非侵入性。
與控制的相關(guān)性。由CF增強濾波器產(chǎn)生的信念直接作為信念空間控制律[10,55]的信息狀態(tài),包括在預(yù)測分布上進行規(guī)劃的MPC方案[15]。結(jié)構(gòu)失配(即定理10中形式化的故障模式)會直接傳播至控制性能:設(shè)定錯誤的信念會膨脹不確定性估計,引發(fā)過度保守的約束收緊,并降低閉環(huán)跟蹤性能。CF在信念層面處理這一故障,使其在到達控制層之前得到解決。一篇配套論文[56]針對含噪新息得分發(fā)展了相應(yīng)的魯棒CF理論,將當前的估計框架與實際的控制實現(xiàn)相連接。
本文其余部分組織如下。第2.2節(jié)介紹了問題表述與信念表示。第3節(jié)將CF框架闡述為信念空間上的結(jié)構(gòu)算子。第3.1–3.3節(jié)分析了適定性、結(jié)構(gòu)下降性質(zhì)、有限次切換與長期行為。第4節(jié)報告了數(shù)值研究結(jié)果,第5節(jié)總結(jié)其意義并展望未來方向。
1.1 記號
![]()
2 預(yù)備知識與問題表述
我們考慮部分觀測下的離散時間狀態(tài)估計,其中狀態(tài)演化和觀測過程均受到隨機擾動的影響,且可能隨時間變化。核心挑戰(zhàn)在于,沒有任何單一固定模型能夠在所有運行條件下一致地描述系統(tǒng)行為——這一局限性促使了下面開發(fā)的 CF 框架。
2.1 預(yù)備知識
物理過程被抽象地描述為
![]()
![]()
![]()
![]()
2.2 問題表述
與其在 (1)–(2) 中采用一個可能設(shè)定錯誤的結(jié)構(gòu)模型,不如直接在條件概率律的層面構(gòu)建推斷 [10,59]。隨后的推導必然是詳盡的,因為潛在結(jié)構(gòu) s s 在三個不同的層面介入——模型類、濾波算子和信念軌跡——為了精確陳述第 3 節(jié)的主要結(jié)果,必須對這三者加以區(qū)分。核心對象是后驗信念
![]()
在 DeepSSSM 框架 [57] 中,(1)–(2) 中的抽象映射 ( f , h ) 并非被直接辨識。盡管記號遵循該框架,但第 3 節(jié)的結(jié)果適用于任何形式為 (8) 的參數(shù)化貝葉斯濾波器,而不依賴于用于表示 p θ 的具體架構(gòu)。相反,如注記 1 所述,它們對信念演化的影響是通過一族參數(shù)化的條件分布來捕獲的:
![]()
![]()
![]()
2.3 問題陳述
![]()
![]()
![]()
3 認知靈活性作為潛在結(jié)構(gòu)算子
![]()
![]()
![]()
![]()
![]()
為了將 CF 緩解持續(xù)性結(jié)構(gòu)不一致性(例如由定義 5 所量化的那樣)這一要求形式化,我們引入以下設(shè)計假設(shè)。
![]()
![]()
![]()
![]()
3.1 適定性(基礎(chǔ)性,必要性)
![]()
![]()
接下來的結(jié)果量化了在自適應(yīng)辨識理論 [8,44] 中,相較于固定結(jié)構(gòu)濾波,結(jié)構(gòu)自適應(yīng)的表征收益。
![]()
注記 13(表征級可達性) 不同于由參數(shù)不確定性或概率混合動力學 [34,60] 引起的經(jīng)典可達集擴大,CF 通過潛在結(jié)構(gòu) s s 的變化而非固定結(jié)構(gòu)內(nèi)的參數(shù)變化來擴大容許的信念演化。
![]()
![]()
![]()
![]()
![]()
3.3 行為后果(核心推論)
![]()
![]()
![]()
4 數(shù)值實驗
四項實驗在互補的失配場景下評估了 CF 的性能:潛在動力學中的結(jié)構(gòu)失配(實驗 4.1)、觀測模型的突然偏移(實驗 4.2)、無偏移的陰性對照實驗(實驗 4.3),以及二維潛在狀態(tài)(實驗 4.4)。這些實驗共同檢驗了第 3 節(jié)所確立的三個性質(zhì):失配下的準確性、結(jié)構(gòu)自適應(yīng)的正確性,以及在設(shè)定正確時的非侵入性。
全文報告了三項指標。狀態(tài)估計精度通過以下方式衡量:
![]()
4.1 實驗 4.1:潛在動力學中的結(jié)構(gòu)失配
![]()
![]()
![]()
![]()
![]()
![]()
4.2 實驗 4.2:觀測模型的突變偏移
本實驗旨在測試 CF 是否能在未知時刻 τ τ 檢測并適應(yīng)觀測結(jié)構(gòu)的突變,同時潛在動力學 (28) 全程保持固定。
![]()
![]()
![]()
![]()
![]()
![]()
值得注意的是,無論是 CF 還是 Fixed-SAT 在偏移后都無法完全恢復(fù)真實狀態(tài)的大幅變化。這不是 CF 本身的局限性,而是飽和映射 (31) 為多對一映射的固有結(jié)果:在 t = τ之后,潛在狀態(tài)無法從觀測中全局辨識。CF 收斂至可用的最佳預(yù)測一致模型,正如定理 20 所保證的那樣。定量結(jié)果報告于表 1 中。
![]()
4.3 實驗 4.3:無觀測偏移(陰性對照)
本實驗旨在探究當不存在結(jié)構(gòu)變化時——即活躍結(jié)構(gòu)在整個時間范圍內(nèi)已具備預(yù)測一致性——CF 是否能保持非侵入性。該實驗使用了與實驗 4.2 相同的潛在動力學 (28) 和候選觀測結(jié)構(gòu),但真實觀測過程在所有時刻 t t 均與二次模型 (30) 一致:任何時刻均未發(fā)生偏移。
實現(xiàn)。 CF 機制使用了與實驗 4.1 和 4.2 相同的 W = 10 步窗口化得分和遲滯裕度 δ = 1.0 ,未添加額外的懲罰項或持續(xù)性計數(shù)器。這確保了相對于實驗 4.2 的任何行為差異僅可歸因于偏移的缺失,而非超參數(shù)的改變。
![]()
4.4 實驗 4.4:多維潛在狀態(tài) ![]()
第 3 節(jié)的理論結(jié)果是針對一般波蘭空間 Z Z 陳述的,并不依賴于潛在狀態(tài)為標量這一假設(shè)。本實驗證實,CF 機制及其保證自然地擴展到了二維設(shè)置中,而在該設(shè)置中,較高的分數(shù)方差使得結(jié)構(gòu)選擇更具挑戰(zhàn)性。
![]()
![]()
![]()
![]()
![]()
![]()
5 結(jié)論
我們引入了認知靈活性(CF),這是一種信念級機制,用于在結(jié)構(gòu)不匹配的情況下進行貝葉斯濾波中的在線潛在結(jié)構(gòu)選擇。通過在每一步選擇最小化基于新息(innovation)的預(yù)測分數(shù)的結(jié)構(gòu)——而不修改底層的貝葉斯遞歸——CF 是適定的,表現(xiàn)出結(jié)構(gòu)下降性質(zhì),并且當存在預(yù)測一致的結(jié)構(gòu)時,會退化為標準濾波。跨越不匹配、偏移和模型設(shè)定正確狀態(tài)的實驗證實,CF 僅在必要時進行適應(yīng),切換次數(shù)有限,并且在設(shè)定正確時不引入額外開銷。不可約性結(jié)果(定理 10)具有直接的控制理論推論:結(jié)構(gòu)不匹配會產(chǎn)生持續(xù)的性能退化,僅靠參數(shù)適應(yīng)無法糾正。CF 在信念層面解決了這一問題,補充了那些假設(shè)固定內(nèi)部表示的魯棒和自適應(yīng) MPC 框架 [15,34]。將 CF 擴展到信念直接反饋給控制策略的閉環(huán)設(shè)置中,是自然的下一步工作。
原文鏈接:https://arxiv.org/pdf/2604.08130
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.