主動推理基礎：自由能原理的原理、算法和應用（面向工程師）

2026-04-10 20:58:00　來源: CreateAMind

上海舉報

分享至

主動推理基礎：自由能原理的原理、算法和應用（面向工程師）

Fundamentals of Active Inference: Principles, Algorithms, and Applications of the Free Energy Principle for Engineers

https://www.amazon.com/Fundamentals-Active-Inference-Principles-Applications/dp/0262050951?asin=0262050951&revisionId=&format=4&depth=1

引言

主動推斷（AIF）框架是一種原則性方法，用于建模大腦，或者更一般地說，用于建模具有大腦（或類腦器官）的生物體與其環(huán)境之間的相互作用。該框架由著名神經(jīng)科學家卡爾·弗里斯頓及其眾多合作者于2000年代中期至今開發(fā)，已成為計算神經(jīng)科學領域極具影響力和重要貢獻的理論。它還催生了一個更廣泛、更具雄心的領域，稱為貝葉斯力學，該領域超越了大腦及人類/動物行為的建模，旨在提供一種基于物理學的自組織系統(tǒng)描述。本書僅簡要提及貝葉斯力學，其完整內(nèi)容與闡述將留待我后續(xù)關于該主題的專著中呈現(xiàn)。無論是AIF還是貝葉斯力學的核心機制，都是本書中將遇到的一個統(tǒng)一原理——自由能原理——的具體應用。

在過去十年中，我們見證了人工智能（AI）系統(tǒng)領域興趣與投資的爆炸式增長。這些系統(tǒng)如今已滲透到我們?nèi)粘Ｉ畹脑S多方面，成為我們?nèi)粘＝换ゼ夹g的核心組成部分，并從根本上改變了許多行業(yè)的面貌。這些進步主要歸功于基于深度學習的AI系統(tǒng)日益普及和高效。最近，大型語言模型的出現(xiàn)進一步激發(fā)了對AI系統(tǒng)前景與潛力的更大興趣。

本書將探討AIF——一種與基于深度學習的AI系統(tǒng)正交的方法——如何用于建模、描述和設計能夠與其環(huán)境交互并適應的硅基或現(xiàn)實生活中的機器人實體。AIF扎根于計算神經(jīng)科學，利用機器學習與貝葉斯統(tǒng)計的語言，提供了一種受生物學啟發(fā)的生命系統(tǒng)描述。

什么是主動推斷？

從歷史上看，AIF起源于弗里斯頓及其合作者在1990年代早期開發(fā)的一套神經(jīng)影像工具和軟件的核心統(tǒng)計方法，即統(tǒng)計參數(shù)映射（SPM）。1 到2003年，該軟件套件還包含了動態(tài)因果建模（DCM），這是一種為理解實驗環(huán)境中的神經(jīng)元動態(tài)而開發(fā)的方法。該方法使用非線性狀態(tài)空間模型，包括一個關于神經(jīng)活動如何隨時間變化的狀態(tài)轉移模型，以及一個描述不同神經(jīng)狀態(tài)變化如何導致數(shù)據(jù)生成的觀測模型，這里的數(shù)據(jù)是指通過功能性磁共振成像（fMRI）腦成像設備測量的血氧水平。DCM提出了一種方法，用于理解在實驗任務響應中，大腦不同區(qū)域的神經(jīng)活動與血氧水平之間如何相互關聯(lián)。DCM的核心方法后來影響了連續(xù)狀態(tài)空間中早期AIF的表述，該表述建立在預測編碼等早期神經(jīng)科學領域的基礎上，并整合了著名的貝葉斯大腦假說。

主動推斷涉及對一個具有適應能力的人工有機體（即智能體）及其所耦合的環(huán)境進行建模。在此語境下，智能體一詞通常指任何能夠被動確定其環(huán)境狀態(tài)（感知）并隨著環(huán)境隨時間演變而主動參與并改變環(huán)境（行動）的系統(tǒng)（無論是模擬系統(tǒng)還是生命系統(tǒng)）。這樣一來，智能體既指自然的生物智能體，也指模擬的智能體。在本書中，出于實用目的，我們常使用模擬智能體作為生物體大腦和身體的隱喻，同時也作為一種建立直觀理解的方式。環(huán)境一詞含義廣泛，且會根據(jù)所建模的系統(tǒng)類型而變化。在某些情況下，環(huán)境可能是受限的，只有少數(shù)可訪問的狀態(tài)（例如一個只能處于開或關狀態(tài)的電燈開關）；而在另一些情況下，環(huán)境可能非常龐大，例如我們?nèi)粘；拥奈锢硎澜纭４笾聛碚f，環(huán)境可以被視為智能體之外的一切事物，包括其他智能體——這些智能體也是該智能體可以感知和作用的對象。

主動推斷為有機體如何在環(huán)境中進行感知和行動提供了獨特的視角。人們可能會持傳統(tǒng)觀點，認為生物智能體通過其感官自下而上地重建周圍環(huán)境的所有細節(jié)來進行感知。雖然這種觀點很有吸引力，但神經(jīng)科學和心理學中越來越多的證據(jù)表明，這并非事情的全貌。從零開始重建環(huán)境以確定其如何隨時間變化，代價是高昂的，尤其是在高度動態(tài)的環(huán)境中，快速決策可能是為了生存而優(yōu)先考慮的事項。相反，主動推斷提出，智能體始終處于一個持續(xù)的預測過程中，有時稱為統(tǒng)計推斷，在此過程中，智能體對環(huán)境的真實狀態(tài)形成假設或預期。這一過程是貝葉斯大腦假說（我們將在第1章探討）以及許多基于無監(jiān)督學習的機器學習方法的關鍵。

這種性質(zhì)的預測是高效的。雖然環(huán)境可能隨時間頻繁變化，但環(huán)境中存在許多相對固定的規(guī)律性和特征。其中一些規(guī)律性是基本概念，例如空間和時間以及適用于它們的物理定律。舉例來說，未來總是跟隨現(xiàn)在/過去之后，兩個固體物體不能同時占據(jù)同一空間。這些規(guī)律性很可能深深嵌入在生物智能體的知識中，也許編碼在其DNA中。其他規(guī)律性包括對我們自身行為（習慣、欲望、需求）、他人行為（社會期望與習俗、文化）以及我們所居住、穿行或互動的空間（交通信號燈/人行橫道、家庭、法律、金錢）的預期。用貝葉斯推斷的術語來說，我們將這種關于環(huán)境或智能體自身性質(zhì)的、預先存在或假定的信息稱為先驗。這些先驗編碼了關于環(huán)境將如何隨時間變化的模型，為智能體如何感知環(huán)境的信念提供了基礎。換句話說，先驗信息會告知智能體對環(huán)境性質(zhì)的預期或預測，只有當智能體在下一時刻通過感官感知到環(huán)境的實際狀態(tài)時，這些預期才會得到確認。這種方法之所以高效，是因為花費時間去重建環(huán)境中那些有規(guī)律且可預測的元素是浪費的，而且這些先驗信息可以在感知過程中被快速利用。

這一思想的關鍵在于，智能體只能接觸到自身與環(huán)境之間界面上的信息——即感覺上皮——并且必須僅利用這些感覺信息來確定環(huán)境的狀態(tài)。重要的是，從人工或自然智能體的感覺系統(tǒng)源源不斷傳入的數(shù)據(jù)，使其能夠計算出一個誤差信號，即 預測誤差 ——當預期與現(xiàn)實不符時就會出現(xiàn)這種誤差——這使智能體能夠調(diào)整自身信念以與現(xiàn)實相匹配。當智能體改變某個信念或預期時，我們常說它“更新了其所處環(huán)境的統(tǒng)計模型”，或者更非正式地說，它“改變了它的信念”。通過這種方式，智能體的體驗是對現(xiàn)實樣貌的一種內(nèi)部模擬的預期，而這種預期會受到來自物理世界的感覺信號的修正。然而，在某些情況下，這種預期可能會主導智能體對現(xiàn)實的看法，甚至覆蓋感覺信號。例如，多項研究中，葡萄酒專家被要求對用食用色素染成紅色的白葡萄酒進行風味分類（Shankar et al., 2010; Morrot et al., 2001; Parr et al., 2003）。品酒師們常常用紅葡萄酒特有的風味來描述這類葡萄酒，而非白葡萄酒的風味。這表明，在某些情境下，他們基于先驗信念（紅色的酒意味著它是紅葡萄酒）所形成的預期，影響甚至覆蓋了他們對環(huán)境的感覺體驗（舌頭品嘗到的白葡萄酒風味）。類似效應在行為心理學中已有充分研究和文獻記錄。這些研究以及來自神經(jīng)科學的其他證據(jù)強烈表明，我們在世界中的體驗在很大程度上是由我們對感覺信號的預期（先驗信念）所驅動或生成的，而不是由感覺信號本身所構成的體驗。

然而，一個真正的主動推斷智能體并非僅僅以這種方式被動感知。相反，這類智能體還具備改變環(huán)境以使其符合自身預期或預測的能力。當環(huán)境與我們的預期不符時，采取行動并改變環(huán)境狀態(tài)的能力意味著我們也可以使環(huán)境符合我們對它的預期，從而減少我們的感覺預測誤差。有趣的是，這表明，從隱喻的角度來說，“欲望”或驅動力等概念與預測或預期有著根本性的聯(lián)系。一個智能體“想要”或“相信”什么，直接關聯(lián)到它對世界應該是什么樣的預期。智能體可以通過采取行動來改變環(huán)境，或者通過改變自身的欲望或信念以匹配環(huán)境，來實現(xiàn)這些欲望；無論哪種方式，都會減少感覺預測誤差。從這個意義上說，可以將智能體在環(huán)境中的存在解讀為一種自我實現(xiàn)的預言。更正式地講，這個過程可以視為一種穩(wěn)態(tài)或反饋控制。

這些關于行動與感知本質(zhì)的看似簡單（卻驚人深刻）的思想——與預期和預測誤差的概念相聯(lián)系——將構成本書探討的方法的基礎。需要注意的是，前述關于主動推斷的視角依賴于對環(huán)境和智能體本質(zhì)的統(tǒng)計解釋，即它們在一個界面上相互作用，這個界面正式稱為馬爾可夫毯。正如我們將看到的，這意味著主動推斷可以用精確的統(tǒng)計（數(shù)學）語言來描述，從而使我們能夠開發(fā)、設計并測試主動推斷智能體在其環(huán)境中交互、適應和生存的能力。這是主動推斷方法的一個主要優(yōu)勢。盡管關于主動推斷的本質(zhì)及其能力/應用存在許多哲學解釋，但其核心理論植根于統(tǒng)計語言，特別是機器學習（貝葉斯推斷），這使得我們能夠通過仿真或現(xiàn)實世界中的機器人技術來檢驗主動推斷的預測和主張。

主動推理，自由能原理， 和貝葉斯力學

雖然本書的主要關注點是AIF，但我們很快就會看到弗里斯頓提出的一個基本思想——即自由能原理（FEP；FEP將在本書中反復出現(xiàn)，但其最詳細的定義見第4章和第14章）所發(fā)揮的重要作用。此外，貝葉斯力學——一個在過去十年中從AIF研究中涌現(xiàn)出來的相關領域——正在逐漸成熟并形成自身的體系。盡管經(jīng)常被混為一談，但AIF、FEP和貝葉斯力學代表了不同且獨立（但高度相關）的思想。我們在此花點時間澄清這些不同術語，并提供描述性的工作定義，隨著本書的推進，這些定義將被細化和形式化（見圖0.1）。

概括而言，這三個術語都關注智能體（無論是生物的還是人工的）與其環(huán)境之間的關系。如前所述，這樣的智能體是預測性的和主動性的。它們被對自身所耦合的環(huán)境的期望所驅動，當期望未被滿足時，它們會調(diào)整并改變信念或環(huán)境。弗里斯頓提出了兩條理解生命系統(tǒng)預測性質(zhì)的不同路徑，即低路與高路的劃分。低路是AIF的視角，它試圖“追求由康德和亥姆霍茲確立的議程——以一種自下而上的方式——推廣推理和預測的能力，以看看它能將我們理解與環(huán)境的具身體驗交換帶到多遠”（Friston, 2019a, p. 75）。

相比之下，高路是貝葉斯力學的視角，它“代表了一種自上而下的方法，從詢問關于事物如果存在就必須具備的必要屬性的基本問題開始。利用數(shù)學（變分）原理，人們可以進而表明，存在是一個生物與其環(huán)境之間的具身體驗交換——這必然包含預測性處理，作為自我證明力學的一個方面”（Friston, 2019a, p. 75）。

低路與高路之間的二分法是一個隱喻性框架，它將本書（關于AIF）與我即將出版的關于貝葉斯力學的著作區(qū)分開來。具體而言，貝葉斯力學（Ramstead et al., 2023）始于物理學家埃爾溫·薛定諤在其1944年出版的《生命是什么？》（Schr?dinger, 1944）一書中提出的一個問題：“在生命有機體的空間邊界內(nèi)發(fā)生的時空事件，如何能夠用物理學和化學來解釋？”

未完。。。。。。。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.