如果你留心自己的一天,會發現一個有趣的事實:真正“發生”的事情,往往比你以為少得多。
走進一間熟悉的房間,你不會一邊走一邊認真“看清楚所有細節”,而是大腦自動“補全”了大部分畫面;聽別人說話時,對方話說到一半,你已經在心里“猜完了后半句”;刷手機看新聞標題,你甚至沒讀完,就已經在腦中形成了大致評判。
我們習慣以為,大腦是在被動接收信息——世界是什么樣,信號進來,我們就知道了。但過去二三十年的神經科學研究,尤其是所謂“自由能原理(Free Energy Principle)”和“預測加工(Predictive Processing)”框架,正在告訴我們:事實恰恰相反。
大腦更像一臺“預測機器”:它不斷根據自己已有的模型,去“猜”外界會發生什么,再用真實的感官輸入來糾正猜測的誤差;它努力做的不是“完美還原現實”,而是“盡量減少驚訝”。
自由能原理,就是試圖用一個統一的數理框架,把這種“減少驚訝”的機制說清楚。
![]()
一
從“被動接收”
到“主動預測”
傳統直覺認為:感知路徑是“外界 → 感官 → 大腦”,好像外界給什么,我們就接收什么。
但很多現象和實驗結果,都和這個“被動接收模型”對不上:
為什么我們會出現錯覺?在光線很差、信息很少的時候,我們竟然還能迅速識別出大概是什么東西?為什么我們會“看錯”“聽錯”,并堅定地以為自己看到 / 聽到的是另外一回事?
如果大腦只是老老實實接收信號,這些“錯”似乎不太好理解。
預測加工的視角則認為:大腦本身就帶著一套又一套關于世界的假設(模型),它不斷從高層往低層發出“預測信號”,告訴視覺、聽覺等各級處理站:“按照以往的經驗,這里大概率會出現什么。”
真正來自外界的感官輸入,只是在對這些預測進行校正——預測和現實之間的差異,就是“預測誤差”。
簡單說:看到的不是“真實世界本身”,而是“預測模型 + 誤差信號”綜合后的結果。
![]()
二
自由能原理
用一個公式說清“減少驚訝”
自由能原理由神經科學家 Karl Friston 提出,原本來源于統計物理中的“自由能”概念,后來被他發展成一個跨層次的統一框架,用來解釋大腦、知覺、行為甚至生命系統的運作方式。
通俗一點講,它有兩個核心思想:
第一,生物系統必須避免“被徹底驚嚇死”。
一個有機體如果經常遇到完全出乎意料的狀況,比如溫度、電解質濃度、能量供應都劇烈波動,它很快就會死掉。所以,從演化的角度看,任何能維持自身穩定存在的系統,必然在某種意義上“避免持續的大驚訝”。
第二,“驚訝”在數學上可以用一個量來近似,那就是“自由能”。
在 Friston 的框架中,自由能是一種上界(upper bound):它是一個系統對“驚訝”(即當前感官輸入與內部模型不匹配程度)的可計算近似。系統無法直接計算“真正的驚訝”,但可以通過最小化“自由能”,間接實現“盡量減少驚訝”的目標。
于是就有了很有名的一句話:任何自我維持的生物系統,都在以某種方式“最小化自由能”。
而大腦,只是一個特別復雜、特別精細的“自由能最小化機器”。
三
大腦如何“最小化自由能”?
兩條路:改模型,改世界
聽起來很玄,但如果翻譯成人話,其實很簡單:
當大腦的預測和現實不一致,也就是“預測誤差”很大時,它有兩條路可以讓誤差變小:
第一條,更新自己的內部模型。也就是:“原來我以為世界是 A,但現在看來更像是 B,那就把模型調整一下吧。”這就是所謂的“知覺學習”“概念修正”。比如,你以前以為狗都很兇,后來反復接觸到溫順的小狗,你的大腦就會悄悄調整“狗=危險”的信念。
第二條,改變現實讓它匹配模型。也就是用行動去“實現”自己預測的狀態。比如,你覺得“待在溫暖的房間里很安全”,那當你走到寒風中時,身體會自動讓你縮回屋內,或者讓你加衣服、關窗戶。通過行動,你讓外界回到了和內部模型更一致的狀態。
這兩種方式,分別對應了自由能原理里兩個重要過程:
? 知覺(perception):通過更新內在模型來減少自由能;? 行為 / 行動(action):通過改變感官輸入來減少自由能。
也就是說,大腦在不斷回答兩個問題:
“是不是我理解錯了?”(那就更新模型)“還是我應該做點什么?”(那就改變現實)
聽起來很像我們日常的心理掙扎,對吧?
四
“預測機器”的層級結構:
自上而下 vs 自下而上
在具體的神經實現上,預測加工框架認為:大腦是一個多層級的貝葉斯推理系統。
簡單拆解一下:
自上而下(top-down):高層給低層下“預測指令”。
比如,最高層可能有一個抽象的“場景假設”:這里是一間辦公室。稍微低一點的層級可能預測:會有桌子、椅子、電腦等。再低一層則預測:某些具體形狀、邊緣、顏色分布。這些預測不斷向下傳遞,到達感官處理的各個站點。
自下而上(bottom-up):低層把“預測誤差”往上送。
現實感官輸入抵達每個層級,與相應的預測進行對比。差別越大,誤差信號越強,就越有可能往上傳遞,促進高層模型更新;如果誤差不大,說明預測基本靠譜,就沒必要大動干戈。
從這個角度看:
感官輸入主要不是在告訴大腦“世界是什么”,而是在告訴大腦“世界哪里和你想的不一樣”。
五
為什么自由能原理
會被說成“萬金油”?
自由能原理野心特別大:它不僅試圖解釋感知,還想解釋行動、學習、注意、情緒、甚至社會互動、精神疾病、意識本身。在 Friston 的寫法中,幾乎所有這些過程都可以被描述為“系統在不同層面上最小化自由能的方式”。
正因如此,這個理論也被部分學者帶著調侃地稱為“萬金油”:好像什么都能往里面塞。
批評者的幾點擔憂包括:
太抽象,難以證偽。如果一個框架總能事后解釋一切,那它在科學意義上的“可檢驗性”就成問題。
數學形式復雜,和具體實驗的連接有時并不直接。在很多應用中,自由能只是以“類比”形式出現,而非嚴格推導。
和現有理論存在大量重疊。比如,它和傳統的貝葉斯大腦、預測編碼理論有高度重合;有人認為,完全可以在不提“自由能”的情況下講清大部分內容。
但支持者會反駁:自由能原理的價值不在于“提出一個全新的概念”,而在于提供一套統一的數學語言,讓我們可以把不同層次的過程(從神經到行為再到社會)放在同一框架下描述。
這一爭論至今仍在繼續。
六
從錯覺到精神疾病:
自由能原理的應用想象
無論是否接受它作為“總綱”,自由能 / 預測加工視角已經在很多具體領域產生啟發。
知覺與錯覺
比如,經典的視覺錯覺可以被解釋為:當大腦有一個特別強的先驗模型(prior),以為世界“通常是那樣”的時候,即使感官輸入給出的線索有點不一樣,它也會把更多權重壓在預測上,寧愿“看錯”。
錯覺因此不是“感官壞了”,而是“強有力的預測戰勝了輸入”。
精神疾病
一些理論嘗試用“預測誤差權重”來理解精神病理:
? 在幻覺中,大腦對內部信號(比如自發的活動)賦予了過高的重要性,把它當作外界輸入;? 在偏執中,大腦對某類預測誤差極端敏感,把所有隨機波動都解釋為“敵意”或“針對”;? 在抑郁中,系統的整體預測模型可能極其悲觀,以至于各種新的正向體驗都被當作“噪音”而忽略。
這些都還在理論與探索階段,但提供了一種有趣的統一視角:精神癥狀可能是“預測系統失衡”的不同表現。
行為與主動推理(Active Inference)
自由能原理還有一個延伸概念叫“主動推理”:大腦不只是被動更新信念,而是通過行動去讓世界變得“更符合自己可以預測的樣子”。
比如:你覺得“輕微晃動就是地鐵里”,于是身體會自動做出一些姿態來“適應地鐵車廂”,反過來這些姿態又提供了“確實像在地鐵”的感覺。
這意味著:我們并不是在“發現世界是什么樣”,而是在不斷“參與構造一個可預期的世界”。
![]()
七
文明層面的隱喻:
一個“巨大預測系統”的時代
如果稍微拉遠視角,會發現“自由能 / 預測加工”的隱喻已經影響到了技術和社會層面:
? 在 AI 領域,生成模型本質上也是“預測未來像素/詞語”的機器;? 在資本市場,風險控制就是試圖把劇烈的“驚訝”降到可承受水平;? 在個人生活中,我們構建各種“安全感系統”,也是在減少那些“完全不知道會發生什么”的狀態。
自由能原理提供的,不僅是一套神經層面的解釋,也給了我們一個“時代自我隱喻”:我們正在用“預測機器”的視角看待自己、看待技術、看待社會。
這既有力量,也有危險——一方面,它提醒我們:不確定性是生命的本質之一,我們永遠在“不完全知道”的狀態下前行,只能盡量讓自己的模型更好一點;另一方面,如果把一切都簡化成“最小化驚訝”,我們也容易忽略那些需要主動“走出舒適區”的部分——很多成長、創造和真正的轉折,恰恰來自“允許一定程度的驚訝發生”。
![]()
八
我們不是公式,
但可以從公式里學點東西
回到題目:“為什么大腦被比喻成一臺預測機器?”
因為在自由能原理和預測加工的視角里,大腦最核心的任務不是被動記錄現實,而是在有限的時間和資源內,構建一個“足夠好”的世界模型,使得我們不至于被不確定性和驚訝吞沒。
它通過不停預測、不斷修正,在噪音中維持一條可走的路。
當然,人不只是“最小化自由能的系統”,我們還有愛、創造、價值、責任、信念……這些東西遠遠超出任何一個公式。
但理解這套“預測機器”的底層工作方式,至少可以讓我們在面對自己的焦慮、固執和恐懼時,多一點寬容:
原來,大腦一直在努力幫我們避免崩潰,只是有時,它用的方式有點過時,需要我們用更高一層的覺察,溫柔地更新它的模型。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.