人類語言千差萬別,目前全世界共有超過7000種語言。不同語言的使用者是否只是用不同的詞匯形式表達相同的概念?如果是這樣,翻譯中又會丟失什么?這個問題觸及語言普遍性與相對性的經典爭論。盡管人類語言存在顯著的多樣性,但學界發現,語義系統背后可能共享某種普遍的結構。然而,這種共性與差異背后的原則尚未明確——部分原因在于現有語義理論往往缺少與神經認知機制的連接。
近日,《自然·通訊》雜志發表了北京師范大學畢彥超教授、王曉莎助理研究員團隊合作完成的一項研究“Semantic similarity across languages reflects neurocognitive dimensions shaped by climate”。該研究團隊整合計算語言學、行為實驗與腦成像數據,揭示語義系統沿著神經認知維度組織的普遍性,并發現氣候這一環境因素能獨立于文化、地理、語言歷史等因素,顯著預測語義差異。
![]()
研究首先基于53種語言的預訓練詞向量數據,構建了13個神經認知維度(包括顏色、形狀、味覺、嗅覺、聲音、觸覺、軀體運動,以及時間、空間、數字、心理認知、情緒和社會)的語義表征。結果顯示,基于神經認知維度的語義模型在跨語言相似性上顯著優于分布語義模型、心理語言學特征模型以及隨機控制模型。其跨語言平均相關系數達到0.63,而其他模型均低于0.42。進一步,該模型能推廣至2681種語言的共詞化網絡數據,無論是在全部語言樣本還是非歐亞語言子樣本中,其預測性能均處于隨機模型分布的上界,證明神經認知維度結構具備跨語言普遍性。
在揭示普遍性之后,研究進一步檢驗了跨語言語義變異與環境因素的關系。作者采用表征相似性分析方法,將語義距離矩陣與地理、氣候、語言歷史、文化等環境距離矩陣進行回歸。結果發現,在詞嵌入數據中,氣候對語義變異的獨特貢獻最強(β=0.28),語言歷史也有顯著貢獻(β=0.22),而文化與地理貢獻不顯著。這一氣候效應在12個語義維度上均顯著,僅在“形狀”維度上未達校正閾值。類似模式在8種語言、253名母語者的行為評分數據中得到了復現:氣候的獨特貢獻達到β=0.53,而文化、地理、語言歷史的效應均不顯著。
![]()
為探索氣候效應在神經層面的反映,研究分析了包含45種語言母語者、86名參與者的功能磁共振成像數據。結果顯示,在12個語言加工腦區中,只有右側前顳葉的神經活動模式與神經認知維度語義空間顯著相關(β=0.44)。進一步分析發現,氣候距離能夠顯著預測該區域的神經活動差異(β=0.12),即使在控制激活位置差異后仍保持顯著。共通性分析表明,氣候與語義因素共同解釋了右側前顳葉神經活動的38.20%方差,提示氣候可能通過塑造語義表征間接影響腦活動。
最后,研究通過主成分分析將19個氣候變量降維為兩個主成分:冷/溫帶與熱帶氣候、海洋性與大陸性氣候。語義空間投射分析顯示,冷/溫帶氣候區的語言在情緒和感覺運動維度上更強,而熱帶氣候區的語言則在社會認知與嗅覺維度上更強。海洋性氣候區的語言在嗅覺、認知和時間維度上更強,大陸性氣候區的語言則在社交和聲音維度上更強。這些維度差異在不同語義域的概念中呈現出高度一致性。
READING
BioPeers
歡迎關注本公眾號,所有內容歡迎點贊,推薦??,評論,轉發~
如有錯誤、遺漏、侵權或商務合作請私信小編~~
歡迎大家投稿課題組 研究進展 、招聘及招生宣傳~
所有文章只為科普、科研服務,無商業目的~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.