无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

ICML 2026 | 大模型內部也會長出「情緒樹」,規模越大越懂人心

0
分享至



隨著語音、視頻、多模態能力不斷融入大語言模型(LLM),人與 AI 的交互正在越來越接近自然對話。今天的 LLM 不再只是回答問題的工具,也越來越多地出現在教育、客服、陪伴、心理健康等高度依賴情緒理解的場景中。

那么,大語言模型究竟是如何理解人類情緒的?

過去,關于 LLM 情緒能力的研究大多集中在情緒分類任務上:給模型一句話,看它能否判斷出其中包含的是快樂、悲傷、憤怒還是恐懼。

但在人類認知中,情緒并不是一組扁平的類別。心理學中的「情緒輪」認為,情緒往往以層級方式組織:例如「樂觀」可以被看作「快樂」的一種具體形式,「驚恐」可以被看作「恐懼」的一種具體形式。



圖 1 情緒輪。(來自:Idaho State University)

在 ICML2026 的一篇論文中,來自哈佛大學、加州大學圣地亞哥分校、NTT Research 的研究人員 Bo Zhao、Maya Okawa 等提出:大語言模型內部會自然形成類似人類心理學模型的「情緒樹」。

模型越大,情緒樹越復雜。同時,擁有更復雜情緒結構的模型在銷售等任務上表現更好。模型中的情緒結構還會受到性別、種族、收入、教育水平等身份設定的影響,呈現出與人類實驗中相似的的情緒識別偏見。



  • 論文標題:Emergence of Hierarchical Emotion Organization in Large Language Models
  • 論文鏈接:https://arxiv.org/abs/2507.10599
  • 項目主頁:https://b-zhao.github.io/blog/hierarchical-emotion-in-llm
  • 作者主頁:https://b-zhao.github.io/

從 LLM 中提取情緒樹

作者首先用 GPT-4o 生成 5000 個包含不同情緒狀態的場景句子,然后讓 Llama 系列模型在句子后繼續預測「這個句子中的情緒是……」。

接著,作者提取模型在 135 個情緒詞上的輸出概率,并比較兩個情緒詞在模型輸出中是否經常共同出現。例如,如果模型認為下一個單詞是「樂觀」的概率較高時,「快樂」也經常概率較高,但反過來并不總是成立,那么我們就可以認為「樂觀」是「快樂」的一個更具體的子情緒。

基于這種條件概率關系,模型中的情緒可以構造出一棵情緒樹。這種方法不需要人工標注,而是來自模型自身對大量情緒場景的概率判斷。



圖 2 不同規模 Llama 模型的情緒樹(8B,70B,405B)

模型越大,情緒層級越復雜

實驗比較了 GPT-2、Llama 3.1 8B、70B 和 405B。結果顯示,隨著模型規模增大,情緒樹變得更深、更復雜,也更接近心理學中的情緒輪結構。

在 Llama 405B 中,諸如快樂、憤怒、悲傷、恐懼等基本情緒,會自然聚合出更細粒度的子類,例如幸福、樂觀、沮喪、后悔、焦慮等。論文進一步用總路徑長度和平均深度衡量情緒樹復雜度,發現這兩個指標隨模型規模整體上升。



圖 3 情緒層級復雜度隨模型規模增長。

情緒樹能預測模型的情緒識別能力

作者進一步發現,情緒樹不只是可視化工具,還能預測模型在不同身份設定下識別情緒的表現。

研究者讓 Llama 405B 分別以男性、女性、高收入、低收入、高教育水平、低教育水平等身份來判斷情緒。結果顯示,不同身份設定會生成不同的情緒樹,而情緒樹越豐富、路徑越長,模型的情緒識別準確率越高。樹中的總路徑長度與識別準確率的相關系數達到 0.84,顯著性小于 0.001。



圖 4 情緒樹結構越復雜,情緒識別準確率越高。

這意味著,層級結構可以成為一種新的 LLM 評測指標:它衡量的不是模型是否偶然選對標簽,而是模型是否形成了更細粒度的情緒概念組織。

LLM 的偏見和人類有多像?

論文還揭示了 LLM 情緒識別中的系統性偏見。Llama 405B 在模擬一些少數或弱勢群體身份時,情緒識別準確率明顯下降,例如女性、黑人、低收入、低教育水平等身份設定的表現低于對應多數群體或優勢群體。

為了驗證這些現象是否只是模型自身的偏差,作者還進行了人類實驗。研究者在 Prolific 平臺上招募 60 名參與者,讓他們對 135 個情緒場景進行六類情緒判斷。

結果顯示,LLM 的一些誤判模式與人類參與者存在相似之處。例如,女性參與者和 Llama 的女性身份設定都更容易在「憤怒」與「恐懼」之間混淆;黑人參與者和 Llama 的黑人身份設定也表現出類似的負面情緒混淆模式。

這說明,LLM 可能不僅學到了情緒詞和文本之間的對應關系,也在一定程度上吸收了人類社會中的感知模式與偏見。

從理解情緒到影響情緒

情緒樹的復雜度不僅反映模型能否「看懂」情緒,也可能影響模型在對話中改變情緒的能力。論文進一步模擬了銷售和投訴處理兩類場景:前者讓模型嘗試把一顆橡果賣出更高價格,后者讓模型安撫憤怒顧客。每輪對話中,模型都需要預測對方下一步的情緒變化。

結果顯示,情緒預測越準確,銷售場景中的最終成交價格越高;在投訴處理場景中,顧客對話后的憤怒程度下降也越明顯。

這說明,LLM 的情緒理解并不只是靜態分類能力。更細致的情緒建模可能幫助模型更有效地順應、引導甚至改變用戶情緒。這一能力在客服、教育和心理支持中可能帶來積極作用,但也需要更謹慎地評估其潛在風險。



圖 5 情緒預測誤差越低,銷售 / 客服表現越好。

總結

這篇論文指出,LLM 內部會自然涌現出類似人類情緒輪的層級情緒結構。 隨著模型規模增加,這種結構變得更復雜,也更接近心理學模型。

同時,論文也發現,LLM 的情緒理解并非中性。模型在不同身份設定下會表現出系統性偏見,并且這些偏見在部分情況下與人類群體的誤判模式相似。

從更廣的角度看,這項工作展示了一條新的大模型評測路徑:將認知科學理論作為假設,用來分析 LLM 的內部結構和輸出行為。我們不僅需要知道模型是否能識別情緒,也需要評估它如何理解,預測,甚至影響情緒。這些能力既可能讓 AI 交互更自然、更有幫助,也可能被用于操控、誤導或放大社會偏見,因此需要更系統的評測與干預。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
叔叔去鎮里蓋章被卡2天,我把鎮長叫來:今天不蓋,就別當鎮長了

叔叔去鎮里蓋章被卡2天,我把鎮長叫來:今天不蓋,就別當鎮長了

時尚的弄潮
2026-05-12 11:56:49
不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關系

不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關系

觀察鑒娛
2026-05-12 09:28:50
女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

千言娛樂記
2026-05-12 15:10:56
湖人比賽場邊美女!被科比稱為全球最美女性!

湖人比賽場邊美女!被科比稱為全球最美女性!

柚子說球
2026-05-12 14:12:49
多地市委書記調整

多地市委書記調整

上海法治聲音
2026-05-11 15:46:11
沙溢暴瘦36斤認不出!瘦回軍藝校草,清爽帥氣狀態年輕10歲

沙溢暴瘦36斤認不出!瘦回軍藝校草,清爽帥氣狀態年輕10歲

東方不敗然多多
2026-05-12 02:23:01
東北一男子養鹿破產,賭氣放生了30頭鹿,8年后上山,眼前一幕卻讓他淚崩了...

東北一男子養鹿破產,賭氣放生了30頭鹿,8年后上山,眼前一幕卻讓他淚崩了...

背包旅行
2026-05-11 14:51:09
剛通過彈劾案,轉頭自家老巢就被抄了!菲律賓這出大戲太狗血了

剛通過彈劾案,轉頭自家老巢就被抄了!菲律賓這出大戲太狗血了

菁菁子衿
2026-05-12 09:29:01
劉三姐“全裸演出”引爭議,張藝謀惹怒全網

劉三姐“全裸演出”引爭議,張藝謀惹怒全網

營銷頭版
2026-05-10 20:09:26
世體:若下賽季再帶巴薩奪西甲冠軍,弗里克將追平瓜迪奧拉紀錄

世體:若下賽季再帶巴薩奪西甲冠軍,弗里克將追平瓜迪奧拉紀錄

云隱南山
2026-05-12 15:10:14
晚清最慘絞肉戰:七位頂級提督殞命 左宗棠為何三日不眠不食?

晚清最慘絞肉戰:七位頂級提督殞命 左宗棠為何三日不眠不食?

掠影后有感
2026-05-10 10:43:55
OPPO再致歉:從嚴處罰高級副總裁段要輝

OPPO再致歉:從嚴處罰高級副總裁段要輝

21世紀經濟報道
2026-05-11 14:48:08
令人唏噓!詹姆斯談未來去向,點名里夫斯,直言已在聯盟證明一切

令人唏噓!詹姆斯談未來去向,點名里夫斯,直言已在聯盟證明一切

萌蘭聊個球
2026-05-12 14:53:52
1-1!熱刺痛失好局+無緣3連勝 保級懸念仍在:剩2輪領先西漢姆2分

1-1!熱刺痛失好局+無緣3連勝 保級懸念仍在:剩2輪領先西漢姆2分

我愛英超
2026-05-12 06:27:23
黃瓜立大功?醫生發現:經常吃黃瓜的人,不出半年,或有4大改善

黃瓜立大功?醫生發現:經常吃黃瓜的人,不出半年,或有4大改善

芹姐說生活
2026-05-09 21:08:03
四川凌晨追打事件后續:6人全被帶走,女子動手襲警細節曝光

四川凌晨追打事件后續:6人全被帶走,女子動手襲警細節曝光

花小貓的美食日常
2026-05-12 12:03:57
中國政府獎學金留學人員抵達平壤,正式開啟在朝留學生活

中國政府獎學金留學人員抵達平壤,正式開啟在朝留學生活

大風新聞
2026-05-11 08:36:09
“中國人明白:若一味安撫,只會沒完沒了”

“中國人明白:若一味安撫,只會沒完沒了”

觀察者網
2026-05-12 09:17:16
震驚!小馬云18歲成年首播,在線人數破7萬,與女生接吻刷爆網絡

震驚!小馬云18歲成年首播,在線人數破7萬,與女生接吻刷爆網絡

火山詩話
2026-05-09 16:02:57
G4湖人110-115雷霆被淘汰 球員評價:2人優秀,3人及格,4人低迷

G4湖人110-115雷霆被淘汰 球員評價:2人優秀,3人及格,4人低迷

籃球資訊達人
2026-05-12 13:39:40
2026-05-12 15:44:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12976文章數 142648關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

頭條要聞

女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

體育要聞

總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

娛樂要聞

劉濤曬媽祖誕辰活動照 評論區變許愿池

財經要聞

黃仁勛真是被白宮徹底封殺了

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

游戲
旅游
教育
親子
本地

任天堂官方貼心提醒!購買會員需注意 很快漲價

旅游要聞

出游的黃金窗口期來了!機票均價跌超40%,人流少、體驗好

教育要聞

正確率5%的解方程

親子要聞

三歲分床,五歲分房,真的有必要嗎?

本地新聞

用蘇繡的方式,打開江西婺源

無障礙瀏覽 進入關懷版