網易首頁 > 網易號 > 正文申請入駐

認知雙模型架構

2026-04-07 20:47:31　來源: CreateAMind

上海舉報

分享至

A Dual-Model Architecture for Cognition

認知雙模型架構

https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

摘要
本文提出了 Ze，一個基于兩種不同的環境生成模型并行運作的新型認知架構理論框架：因果（前向）模型 M_A 和反事實（逆向）模型 M_B。Ze 的核心動力學源于兩個獨立的變分自由能 F_A 和 F_B 的最小化，以及兩者之間沖突的管理，即 ΔF = |F_A - F_B|。這一沖突調節著兩種相之間的轉換：干涉態（在此狀態下模型輸出被建設性地融合）和局域態（通過離散投影解決沖突）。我們在形式上建立了 Ze 與量子測量（特別是雙縫實驗）之間的深層結構同構性，而無需在底層引入量子物理。Ze 被構建為一個完整的、可證偽的理論，它將認知中的“坍縮”重新解釋為由優化驅動的相變，生成新的可實驗驗證的預測，并將感知、行動與表征學習整合到一個統一的架構中。本預印本提供了該框架的完整數學闡述。

關鍵詞：認知架構；變分推斷；模型沖突；主動推斷；量子認知；相變

1. 引言

尋求一種形式化的、基于計算理論的認知與意識理論，仍然是神經科學與人工智能領域的核心挑戰。主流范式，如預測處理與自由能原理，認為大腦的功能是一個分層的生成模型，以最小化驚訝或變分自由能（Friston, 2010）。盡管這些框架功能強大，但它們通常描述的是單一的、統一的感知模型。Ze形式體系提出了一個根本性的擴展：智能系統需要維護同一個環境的兩個不同的、非對稱的生成模型。

這種二元性的動機，源于不僅需要解釋被動感知，還需要解釋反事實推理、敘事理解以及信念的突然重組。我們引入一個因果（前向）模型 M_A，它基于時間動態預測感官數據；以及一個反事實（逆向）模型 M_B，它推斷解釋、目標和潛在原因。它們的獨立運作以及隨后的相互作用構成了Ze架構的核心。

該理論嚴格建立在已確立的變分力學基礎上，不對大腦的量子過程做任何假設。然而，它揭示了一個與量子測量之間的深刻形式類比。這一類比不僅僅是隱喻性的，而且表明，支配不確定性解決方式的數學原理可能在不同的物理和計算基底中是普遍的。Ze為經典的認知現象——知覺雙穩態、頓悟問題解決以及睡眠-覺醒周期——提供了新的視角，并產生了具體的、可檢驗的預測，從而將其與標準模型區分開來。

2. 數學形式體系

2.1. 核心變量與基本結構

考慮一個接收觀察流 o_{1:T} 的智能體。Ze假設存在兩個獨立的生成模型：

2.2. 兩個變分自由能

每個模型最小化其自身的變分自由能泛函，這是驚訝的上界（Friston, 2010）：

2.3. 模型沖突：核心量

Ze 中的核心動態變量是模型沖突或解釋分歧：

2.4. 干涉作為后驗兼容性

干涉被形式化為模型后驗的建設性融合。我們使用 Jensen-Shannon 散度（JSD）來衡量它們的兼容性，這是一種對稱且有界的度量：

3. 與量子力學的形式對應

Ze的數學結構展現出與量子雙縫實驗嚴格同構的關系。

這種對應關系表明，疊加、干涉、測量和擦除等原理并非量子物理學所獨有，而是描述了那些在競爭性內部模型之間管理不確定性的系統的一般動力學（Busemeyer & Bruza, 2012）。在Ze中，“坍縮”不是一個假設，而是一種涌現的、由優化驅動的相變。

4. 實驗預測與可證偽性

Ze是一個嚴格的理論，而非隱喻，因為它建立在標準變分演算之上，不提出任何量子物理層面的主張，提出了一個新的架構性假設，并產生了可證偽的預測。

4.1. 關鍵可檢驗預測

5. 討論與結論

Ze 形式體系將感知、行動和學習整合到一個統一的、數學精確的架構中。其核心創新在于生成模型的強制性二元性，這些模型之間的沖突與和解動力學支配著認知。

5.1. 對認知科學的啟示

Ze 為知覺雙穩態（自發的局域化）、頓悟（突然的沖突解決）以及睡眠的功能（周期性的擦除與整合）等現象提供了有原則的解釋。它將認知構建為因果性的“是什么”模型與反事實性的“可能是什么”模型之間的持續協商。

5.2. 根本性轉變

該理論重新解釋了認知“坍縮”的難題——明確的感知如何從模糊的數據中涌現——將其視為一種基于優化的軟性相變。這為這一過程去神秘化，并使其與更廣泛的自組織物理原則對齊（Tschacher & Haken，2007）。

5.3. 未來方向

未來的工作必須聚焦于 Ze 智能體的形式化計算實現，以及設計第 2 表中概述的關鍵實驗。此外，與量子力學的同構性 invites 跨學科對話，表明量子信息理論可能為建模高層認知過程提供強大的工具，而無需假設一個量子大腦。

結論

總之，Ze 被提出作為一個完整的、可證偽的框架，通過在雙模型動力學的治理下統一變分推斷、主動學習和結構性模型修正，推進了我們對智能系統的形式化理解。

圖 1. Ze 架構示意圖。一個框圖，展示了兩個生成模型 M_A 和 M_B，它們接收觀察 o_t 并維護后驗分布 q_A 和 q_B。該圖說明了 F_A、F_B、ΔF 的計算，以及沖突信號的反饋如何調節干涉/局域化開關和策略選擇（π_A, π_B）。擦除算子 ? 和路徑固定參數 λ 也被顯示為調節性輸入。

圖 2. 動力學狀態與相變。一個分岔圖，繪制了系統穩定性度量隨模型沖突 ΔF 的變化。圖中顯示，當 ΔF < θ 時存在一個穩定的“干涉”吸引子，該吸引子在閾值 θ 處失去穩定性。當 ΔF > θ 時，出現兩個穩定的“局域化”吸引子，對應于偏向 M_A 或 M_B 的兩種解決方式。箭頭指示了在局域化事件期間系統的軌跡。

原文鏈接：https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.