![]()
認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享
![]()
基本信息
Title:Three-dimensional scene boundary representations for wall orientation and distance are represented distinctly in the human visual cortex
發(fā)表時間:2026-3-25
發(fā)表期刊:PLOS Biology
影響因子:7.2
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
研究背景
當(dāng)我們走進(jìn)一個陌生的房間時,大腦能夠毫不費力地感知到墻壁在哪里、房間有多深。這種對環(huán)境3D空間布局的視覺表征,是我們能夠在物理世界中自如導(dǎo)航的基礎(chǔ)。在嚙齒類動物中,研究者已經(jīng)發(fā)現(xiàn)大腦利用“向量編碼”(vector coding)原則來構(gòu)建空間地圖,即通過計算自我與邊界之間的距離和方向來定位。在人類大腦中,枕葉位置區(qū)(OPA)、海馬旁位置區(qū)(PPA)等場景選擇區(qū)域也被證實參與了空間布局的編碼。
![]()
然而,過去關(guān)于人類空間認(rèn)知的大多數(shù)神經(jīng)成像研究,往往依賴于高度簡化的幾何圖形或人造3D房間作為視覺刺激。這類刺激雖然便于控制變量,卻丟失了真實世界中復(fù)雜的語義上下文、光影變化和物體遮擋。反過來,現(xiàn)有的自然場景圖像數(shù)據(jù)集雖然真實,卻缺乏精確的3D布局標(biāo)注,導(dǎo)致我們很難直接研究大腦是如何從復(fù)雜的自然圖像中提取出“距離”和“方向”這兩個核心邊界向量的。
為了跨越這道方法學(xué)鴻溝,近期,北京大學(xué)的研究團(tuán)隊開發(fā)了一種基于計算機(jī)視覺的3D布局重建方法,能夠從2D自然室內(nèi)圖像中定量估算出墻壁的相對距離、方向以及觀察者的自我姿態(tài)。借助這一工具,研究者結(jié)合大尺度7T fMRI數(shù)據(jù)集(NSD)以及全新的fMRI與MEG實驗,以前所未有的精度拆解了人類大腦在自然場景下表征3D邊界的時空機(jī)制。
![]()
Fig 1. 展示了研究者如何通過標(biāo)注自然室內(nèi)圖像中的關(guān)鍵平行與垂直邊緣,結(jié)合透視原理,重建出包含墻壁方向與相對距離的3D空間布局模型。
![]()
研究核心總結(jié)
這項研究并沒有停留在“哪些腦區(qū)對場景有反應(yīng)”的粗粒度層面,而是將3D布局拆解為“邊界相對距離”和“邊界方向”兩個核心特征,并揭示了它們在視覺皮層中截然不同的處理邏輯。
一、空間解離:早期視覺皮層算距離,高級腦區(qū)算方向
研究者首先利用大規(guī)模自然場景數(shù)據(jù)集(NSD)的fMRI數(shù)據(jù)進(jìn)行了表征相似性分析(RSA)。為了確保結(jié)果的純粹性,他們嚴(yán)格控制了圖像的低級空間頻率、中級紋理特征以及高級語義特征。
結(jié)果顯示,沿著視覺處理層級,邊界特征的表征出現(xiàn)了清晰的解離:初級和早期視覺皮層(V1-V3)主要負(fù)責(zé)編碼側(cè)墻的“相對距離”(即墻壁在視野中占據(jù)的相對面積比例,用于推斷遠(yuǎn)近),而更高級的場景選擇區(qū)域(如OPA和PPA)則專門負(fù)責(zé)編碼墻壁的“方向”。這種從后部枕葉到前部枕顳葉的表征梯度表明,大腦在提取空間布局時采取了分步策略:先在早期皮層完成基于圖像幾何的自我中心距離估算,再在高級腦區(qū)整合出更抽象的3D結(jié)構(gòu)方向。
![]()
Fig 2. NSD數(shù)據(jù)集的fMRI分析表明,在嚴(yán)格控制了2D視覺與語義特征后,早期視覺皮層顯著表征邊界相對距離,而場景選擇區(qū)域顯著表征邊界方向。
![]()
Fig 3. Searchlight 分析直觀呈現(xiàn)了單個被試大腦中從后部枕葉(紅色,距離表征)到前部枕顳葉(綠色,方向表征)的層級遞進(jìn)梯度。二、自我姿態(tài)的顯式編碼:視覺皮層能“看”出你的俯仰角
除了環(huán)境本身的布局,成功的導(dǎo)航還需要大腦知道觀察者自身的姿態(tài)(Self-pose)。研究者利用重建出的相機(jī)參數(shù),測試了視覺皮層是否編碼了觀察者的俯仰角(Pitch,低頭/抬頭)和翻滾角(Roll,左右傾斜頭)。
解碼分析發(fā)現(xiàn),整個視覺皮層(包括早期視覺區(qū)和場景選擇區(qū))都能可靠地預(yù)測出圖像的俯仰角,但無法預(yù)測翻滾角。這一發(fā)現(xiàn)為人類視覺系統(tǒng)顯式編碼導(dǎo)航相關(guān)的自我姿態(tài)信息提供了直接證據(jù)。從生態(tài)學(xué)角度來看,俯仰角在垂直導(dǎo)航(如上下樓梯)中極為關(guān)鍵,且在日常視覺體驗中變化頻繁,大腦對此保持高度敏感具有重要的適應(yīng)性意義。
![]()
Fig 4. 視覺皮層能夠可靠解碼出觀察者的俯仰角(Pitch),但無法解碼翻滾角(Roll),證實了關(guān)鍵自我姿態(tài)參數(shù)在視覺系統(tǒng)中的顯式表征。三、任務(wù)調(diào)節(jié):導(dǎo)航需求會動態(tài)增強(qiáng)早期視覺皮層的布局表征
NSD數(shù)據(jù)集中的被試進(jìn)行的是簡單的圖像記憶任務(wù),空間布局對他們而言是“任務(wù)無關(guān)”的。那么,當(dāng)人們真正需要關(guān)注空間結(jié)構(gòu)時,大腦的表征會發(fā)生什么變化?
研究者使用帶有真實3D標(biāo)注的Matterport3D數(shù)據(jù)集開展了新的fMRI實驗,讓被試分別執(zhí)行“布局辨別任務(wù)”(導(dǎo)航相關(guān))和“紋理辨別任務(wù)”(非導(dǎo)航控制)。結(jié)果發(fā)現(xiàn),當(dāng)空間布局成為任務(wù)核心時,初級視覺皮層(V1)對邊界距離和方向的表征強(qiáng)度都得到了顯著增強(qiáng)。這提示早期視覺皮層并非只是被動接收信息的“中轉(zhuǎn)站”,而是會根據(jù)當(dāng)前的導(dǎo)航需求,動態(tài)調(diào)整其對關(guān)鍵3D幾何特征的處理精度。
![]()
Fig 5. 采用Matterport3D數(shù)據(jù)集的實驗范式,對比了要求被試主動關(guān)注空間結(jié)構(gòu)的布局任務(wù)與僅關(guān)注表面顏色的紋理任務(wù)。
![]()
Fig 6. fMRI結(jié)果顯示,當(dāng)空間布局與當(dāng)前任務(wù)相關(guān)時,初級視覺皮層(V1)對邊界距離和方向的表征均得到了顯著增強(qiáng)。四、時空動態(tài):距離計算是自動的,方向計算依賴晚期反饋
為了捕捉這種任務(wù)調(diào)節(jié)背后的時間動態(tài),研究者使用相同的范式進(jìn)行了MEG實驗。時間分辨率極高的MEG數(shù)據(jù)揭示了一幅生動的動態(tài)圖景:
對“相對距離”的表征出現(xiàn)得非常早(刺激呈現(xiàn)后約160-240毫秒),并且無論被試在做什么任務(wù),這種早期表征都會自動涌現(xiàn)。相反,對“邊界方向”的表征出現(xiàn)得要晚得多(約410-560毫秒及670-720毫秒),并且僅僅在被試執(zhí)行布局辨別任務(wù)時才會出現(xiàn)。進(jìn)一步將fMRI與MEG數(shù)據(jù)進(jìn)行跨模態(tài)融合分析后,研究者發(fā)現(xiàn),V1在晚期時間窗口的表征增強(qiáng)與方向特征的出現(xiàn)時間高度吻合。這強(qiáng)烈暗示,高級腦區(qū)在處理完方向信息后,通過自上而下的反饋機(jī)制(或工作記憶維持),重新塑造了早期視覺皮層的活動模式。
![]()
Fig 7. MEG結(jié)果揭示了時空分離:距離表征在早期自動出現(xiàn),而方向表征在晚期且僅在導(dǎo)航任務(wù)中涌現(xiàn)。
![]()
Fig 8. fMRI與MEG的跨模態(tài)表征相似性分析提示,V1在晚期(650-750ms)的表征增強(qiáng)可能源于高級腦區(qū)對初級視覺皮層的自上而下反饋。
![]()
研究意義
這項工作在理論與方法學(xué)上都極具啟發(fā)性。
在理論層面,它為人類空間布局感知提出了一套清晰的時空層級框架:大腦首先在早期視覺皮層快速、自動地基于2D圖像特征(如墻壁占據(jù)的面積比例)估算自我中心的相對距離;隨后,高級場景選擇區(qū)域在更晚的時間窗口整合出邊界的3D方向;最后,如果當(dāng)前任務(wù)需要導(dǎo)航,高級腦區(qū)會將這些結(jié)構(gòu)信息反饋給早期視覺皮層,以維持或增強(qiáng)高分辨率的空間表征。有趣的是,研究發(fā)現(xiàn)大腦似乎并不傾向于計算絕對的物理度量距離,而是依賴于相對的視覺幾何啟發(fā)式線索,這反映了生物視覺系統(tǒng)在計算效率與導(dǎo)航需求之間的巧妙平衡。
在方法學(xué)層面,本研究開發(fā)的自然圖像3D布局重建技術(shù),成功在高度控制的人造刺激與缺乏真實標(biāo)注的自然場景之間架起了一座橋梁。它證明了只要輔以巧妙的計算機(jī)視覺提取手段,像NSD這樣的大尺度自然圖像公開數(shù)據(jù)集,完全可以被轉(zhuǎn)化為研究高級空間認(rèn)知機(jī)制的強(qiáng)大寶庫。
分享人:飯鴿兒
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進(jìn)群,歡迎你的到來
一鍵關(guān)注,點亮星標(biāo) ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.