Bayesian Distance-to-Set Models:from Latent Variable to Latent Projection
貝葉斯距集模型:從隱變量到隱投影
https://arxiv.org/pdf/2604.10178
![]()
![]()
摘要
統計模型通常假設數據是在一個結構化、平滑或低維集合附近生成的。一種常見方法是采用貝葉斯隱變量模型,其中每個觀測值都與集合上的一個隱坐標相關聯,而觀測數據則被建模為對這些坐標的噪聲擾動。這種擾動通常由位置-尺度分布(如高斯分布)來刻畫。盡管隱變量模型具有直觀吸引力且廣受歡迎,但在后驗計算中常常面臨實際挑戰。特別是,當樣本量較大且隱坐標無法通過閉式積分消去時,馬爾可夫鏈蒙特卡洛(MCMC)采樣器可能出現混合緩慢的問題。在本文中,我們提出了一種替代方法,用"到集合的距離"(distance-to-set)取代"相對于坐標的偏差"。具體而言,"到集合的距離"定義為數據點與其在該集合上投影之間的距離,其中投影可通過優化快速計算,并在似然函數中替代隱坐標。這一改變顯著降低了參數×隱變量空間的維度,從而實現了高效的后驗計算。我們為距離到集合模型建立了若干重要的統計性質,例如:法錐噪聲與固定效應參數之間的獨立性、后驗一致性,以及一種能夠自動懲罰過擬合的奧卡姆剃刀效應。我們通過模擬研究、在多環境研究中的應用以及貝葉斯遷移學習,驗證了所提方法的有效性。本文模型的實現源代碼可在 https://github.com/leoduan/distance-to-set-models 獲取。
關鍵詞:條件依賴隱變量、基于優化的似然、投影對偶性、遷移學習中的不確定性。
1 引言
![]()
![]()
![]()
![]()
![]()
![]()
![]()
2 方法
2.1 到集合距離模型
![]()
![]()
![]()
![]()
![]()
![]()
![]()
2.2 隱投影及其偏差的生成視角
我們現在通過引入隱投影及其偏差的生成視角來完善貝葉斯觀點。構建這一視角的目的是為了闡明投影的概率含義以及由“到集合距離”公式所誘導的受約束殘差結構。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
2.3 集合位移參數與偏差之間的獨立性
![]()
![]()
2.4 歸一化常數與隱式集合大小正則化
。。。。。。。。
原文鏈接:https://arxiv.org/pdf/2604.10178
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.