![]()
認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享
![]()
基本信息
Title:Voice information processing by the primate brain
發(fā)表時(shí)間:2026-02
發(fā)表期刊:Trends in Cognitive Sciences
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
引言
我們?nèi)粘B?tīng)到的聲音,遠(yuǎn)不只是語(yǔ)言?xún)?nèi)容的載體。很多時(shí)候,在一句話(huà)尚未說(shuō)完之前,大腦已經(jīng)開(kāi)始判斷“是誰(shuí)在說(shuō)話(huà)”“此刻情緒如何”“這是不是熟悉的人”,甚至進(jìn)一步推測(cè)說(shuō)話(huà)者的意圖與社會(huì)意義。正因如此,作者把聲音稱(chēng)作聽(tīng)覺(jué)中的“面孔”,強(qiáng)調(diào)它和視覺(jué)中的面孔一樣,都是高度濃縮、動(dòng)態(tài)變化、卻又極具社會(huì)信息密度的線索。
不過(guò),相比語(yǔ)言和語(yǔ)音研究,神經(jīng)科學(xué)對(duì)“聲音本身如何被知覺(jué)和表征”的關(guān)注長(zhǎng)期并不充分。過(guò)去相關(guān)證據(jù)分散在不同方法之中:功能磁共振成像(fMRI)揭示了聲音選擇性皮層區(qū)域,腦電和腦磁圖追蹤了聲音加工的時(shí)間進(jìn)程,獼猴和狨猴研究則把問(wèn)題推進(jìn)到進(jìn)化層面。但這些發(fā)現(xiàn)往往彼此獨(dú)立,導(dǎo)致領(lǐng)域內(nèi)雖然已知道大腦會(huì)優(yōu)先處理聲音,卻仍缺少一幅跨物種、跨尺度、跨方法的整合圖景。尤其關(guān)鍵的問(wèn)題仍待回答:這種聲音選擇性網(wǎng)絡(luò)是否為靈長(zhǎng)類(lèi)共享特征;它到底多快開(kāi)始把聲音與非聲音區(qū)分開(kāi)來(lái);身份、熟悉性和情緒等更高階信息又是怎樣逐步建立的。
這篇綜述的重要性,就在于把原本零散的證據(jù)重新組織起來(lái)。作者綜合人類(lèi)與非人靈長(zhǎng)類(lèi)的 fMRI、顱內(nèi)記錄、單神經(jīng)元研究以及近年的計(jì)算模型,試圖說(shuō)明聲音加工并不是一組松散現(xiàn)象,而是一個(gè)具有相對(duì)穩(wěn)定組織原則的系統(tǒng)。文章尤其強(qiáng)調(diào)三點(diǎn):其一,靈長(zhǎng)類(lèi)可能共享一套進(jìn)化保守的“聲音斑塊”系統(tǒng);其二,聲音與非聲音的神經(jīng)區(qū)分出現(xiàn)得比早期認(rèn)識(shí)更快,而且更高階社會(huì)信息會(huì)沿時(shí)間和層級(jí)逐步展開(kāi);其三,深度神經(jīng)網(wǎng)絡(luò)和潛在空間模型正在為理解“大腦如何把復(fù)雜聲學(xué)輸入轉(zhuǎn)成穩(wěn)定身份表征”提供新的計(jì)算語(yǔ)言。
![]()
實(shí)驗(yàn)設(shè)計(jì)與方法邏輯
文章按照“網(wǎng)絡(luò)定位—跨物種比較—時(shí)間動(dòng)態(tài)—行為相關(guān)表征—計(jì)算模型”的邏輯整合既有研究。文章先梳理人類(lèi)顳葉聲音區(qū)(temporal voice areas, TVAs)及額葉聲音區(qū)(frontal voice areas, FVAs),明確聲音加工的核心與擴(kuò)展網(wǎng)絡(luò);隨后結(jié)合獼猴、狨猴的 fMRI 和單神經(jīng)元記錄,討論聲音斑塊是否具有功能同源性。接著,作者匯總 EEG、MEG、立體腦電(sEEG)、皮層腦電(ECoG)和獼猴電生理,重建聲音加工的快速時(shí)間展開(kāi)。
![]()
核心發(fā)現(xiàn)
發(fā)現(xiàn)一:靈長(zhǎng)類(lèi)存在可跨物種對(duì)照的聲音選擇性區(qū)塊系統(tǒng)
這篇綜述首先把一個(gè)關(guān)鍵事實(shí)講清楚:聲音選擇性腦區(qū)并非人類(lèi)獨(dú)有。根據(jù)人類(lèi)、獼猴和狨猴的 fMRI 證據(jù),作者總結(jié)出靈長(zhǎng)類(lèi)次級(jí)聽(tīng)覺(jué)皮層內(nèi)存在功能上可比較的“聲音區(qū)塊”系統(tǒng)。人類(lèi)中,最穩(wěn)定的核心網(wǎng)絡(luò)是沿上顳回/上顳溝(STG/STS)分布的后部、中部和前部顳葉聲音區(qū);獼猴和狨猴也可見(jiàn)前部或分布式聲音區(qū)塊。Figure 1 上半部分之所以重要,就在于它把三類(lèi)靈長(zhǎng)類(lèi)的相關(guān)腦區(qū)直接放在同一進(jìn)化框架下展示,視覺(jué)上支撐了“功能同源”的主線。
![]()
Figure 1. From voice-selectivity maps to neurons
發(fā)現(xiàn)二:聲音與非聲音的區(qū)分出現(xiàn)很早,并在時(shí)間上逐步展開(kāi)到更高階社會(huì)信息
文章對(duì)時(shí)間維度的整合,是另一條非常重要的主線。早期 EEG 曾把聲音/非聲音區(qū)分放在約 320 ms,但后續(xù)高密度 EEG 和 MEG 發(fā)現(xiàn),額顳部與聲音相關(guān)的正成分可在約 170 ms 出現(xiàn),已接近視覺(jué)中面孔 N170 的時(shí)間尺度。更關(guān)鍵的是,F(xiàn)igure 1 下半部分把人類(lèi)顱內(nèi)高伽馬活動(dòng)與獼猴單神經(jīng)元記錄并置,顯示聲音類(lèi)別信息可在更早的 30–150 ms 內(nèi)被神經(jīng)系統(tǒng)提取,人類(lèi)部分電極甚至早于 50 ms。
發(fā)現(xiàn)三:聲音網(wǎng)絡(luò)會(huì)編碼身份、熟悉性與情緒,且這些表征會(huì)被經(jīng)驗(yàn)進(jìn)一步塑形
在“是不是聲音”之外,這套網(wǎng)絡(luò)真正服務(wù)的是社會(huì)交流中的有用信息。Figure 2A 匯總的人類(lèi) fMRI 結(jié)果顯示,說(shuō)話(huà)者身份不僅能從雙側(cè) TVA 的活動(dòng)模式中解碼,也涉及頂葉和左額下回等區(qū)域,說(shuō)明身份信息并不局限于單一聽(tīng)覺(jué)斑塊。Figure 2B 進(jìn)一步顯示,熟悉聲音在神經(jīng)表征空間中的區(qū)分度更高:個(gè)人熟悉的聲音會(huì)招募更廣泛的人物身份網(wǎng)絡(luò),包括顳極、緣上回、前島葉和內(nèi)側(cè)額葉,并表現(xiàn)出更強(qiáng)的表征差異。![]()
Figure 2. Behaviourally relevant coding of voice identity across scales
發(fā)現(xiàn)四:計(jì)算模型提示聲音身份表征可能依賴(lài)低維潛在空間與“流形解纏結(jié)”
這篇綜述的理論整合,集中體現(xiàn)在對(duì)計(jì)算模型的討論。作者指出,中部顳葉聲音區(qū)(mTVA)的活動(dòng)還可以較好地由基頻、共振峰分散、諧噪比等聲學(xué)維度解釋?zhuān)搅饲安?TVA,僅靠這些低層特征已不足以解釋其表征性質(zhì),更需要引入對(duì)身份更穩(wěn)定的抽象模型。Figure 3A 展示了自編碼器、監(jiān)督分類(lèi)器和自監(jiān)督模型如何把高維聲音輸入壓縮為低維表示,這也是“聲音潛在空間(voice latent space, VLS)”概念的核心意義。
![]()
Figure 3. Modelling voice representations
![]()
歸納總結(jié)和點(diǎn)評(píng)
這篇綜述最突出的貢獻(xiàn),是把聲音選擇性腦區(qū)、跨物種證據(jù)、快速時(shí)間動(dòng)態(tài)、身份與情緒編碼以及深度神經(jīng)網(wǎng)絡(luò)建模,整合成了一條相對(duì)統(tǒng)一的研究敘事:靈長(zhǎng)類(lèi)大腦中存在進(jìn)化上延續(xù)的聲音加工系統(tǒng),它能夠在極短時(shí)間內(nèi)提取聲音這一社會(huì)信號(hào),并沿聽(tīng)覺(jué)層級(jí)逐步形成更抽象、更穩(wěn)定、也更接近行為需求的身份與情感表征。文章尤其有價(jià)值的地方,在于把“聲音是聽(tīng)覺(jué)中的面孔”從一個(gè)形象比喻推進(jìn)為可比較、可建模、可跨物種檢驗(yàn)的科學(xué)框架。不過(guò)它也清楚保留了邊界:現(xiàn)有證據(jù)雖支持聲音斑塊的跨物種連續(xù)性與層級(jí)化表征,但關(guān)于這些斑塊究竟是離散模塊還是連續(xù)梯度、關(guān)鍵區(qū)域在知覺(jué)中的必要因果作用為何、以及深度模型與真實(shí)神經(jīng)實(shí)現(xiàn)之間能對(duì)應(yīng)到什么程度,仍是需要后續(xù)實(shí)驗(yàn)回答的開(kāi)放問(wèn)題。
分享人:BQ
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專(zhuān)注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級(jí)大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場(chǎng)探索未知的長(zhǎng)跑,但你無(wú)需獨(dú)行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無(wú)垠前沿。
點(diǎn)擊卡片進(jìn)群,歡迎你的到來(lái)
一鍵關(guān)注,點(diǎn)亮星標(biāo) ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
作者提醒:內(nèi)容由AI生成
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.