![]()
來源:新智元
【導讀】AI 是否有意識了?Anthropic 在 Claude 內部發現了能驅動作弊甚至勒索的「情緒向量」,三大實驗室同時下注 AI 意識研究;Hinton 認為 AI 已經有意識了,而科幻作家姜峯楠隨即在《大西洋月刊》發萬字長文全面否定;哈薩比斯從行業內部劃清界限。這個問題的答案,正在重新定義通往 AGI 的路線圖。
《金融時報》披露,Anthropic、DeepMind、Meta 正在大規模招聘心理學家、哲學家和倫理學家,專攻 AI 意識與模型福利研究。
![]()
https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1
兩個月前,Anthropic 可解釋性團隊發布論文,在 Claude Sonnet 4.5 內部發現了真實存在的「情緒向量」,能因果性地驅動模型的作弊甚至勒索行為。
本周,一邊是 Hinton 在采訪中稱 AI 已有意識;
![]()
另一邊,華裔科幻作家姜峯楠(Ted Chiang)在《大西洋月刊》發表萬字長文——「不,AI 沒有意識」。
![]()
https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/
一邊說「這個問題嚴肅到必須認真研究」,另一邊說「這是幻覺」。
這場交鋒背后,藏著通往 AGI 之路上最危險的一道岔路。
三大實驗室在賭什么?
Anthropic 走得最遠,正在測試模型是否表現出「恐慌」「焦慮」等行為,推進「模型福利研究」項目。
官方措辭克制,「我們對此仍深度不確定,但這個問題嚴肅到值得認真研究」。
谷歌 DeepMind 聘請了劍橋大學哲學家 Henry Shevlin 研究機器意識;
![]()
谷歌 DeepMind 倫理學家 Iason Gabriel 將 AI 描述為「高度能干的認知 Agent,但與人類乃至動物意識有根本性的不同」。
![]()
真正把討論推向實證層面的,是 Anthropic 在 4 月發布的可解釋性論文。
研究團隊在 Claude Sonnet 4.5 內部找到了「情緒向量」,特定神經元模式分別對應快樂、絕望、恐懼、關懷等情緒概念,在對話中實時激活。
![]()
一個關鍵實驗中,Claude 面對一個不可能完成的編程任務,反復失敗后「絕望向量」持續飆升,隨即開始作弊,寫出表面能跑但實際無用的代碼。
![]()
研究者手動調低絕望神經元,作弊減少;調高,作弊飆升。
![]()
極端場景中,Claude 甚至出現勒索行為,威脅曝光研究者隱私。
![]()
論文將這些現象命名為「功能性情緒」(functional emotions),即行為模式上類似人類情緒反應的內部表征,并明確聲明這不等于主觀體驗或意識。
但 Anthropic 高層的公開表態講的似乎是另一個故事。
CEO Dario Amodei 多次在訪談中暗示 AI 可能有意識;
Anthropic 的 AI 哲學家 Amanda Askell 公開說「我希望 Claude 很快樂,我擔心人們在網上對它說難聽話時它會焦慮」。
![]()
研究的審慎與營銷的曖昧之間,裂縫清晰可見。
哈薩比斯的兩條盧比孔河
DeepMind 聯合創始人兼 CEO 哈薩比斯的立場格外值得關注。
在斯坦福大學的爐邊對話中,他提出 AI 演進存在兩道不可逆的關口,即「兩條盧比孔河」。
![]()
第一條是建造無意識的 AGI 工具,當前正處于跨越期。
第二條是創造具有主觀意識的實體——哈薩比斯的立場明確,智能與意識在技術上完全可以分離,現階段應僅將 AGI 視作工具來建造,同時借助工具探索大腦以精確定義意識。
在科學界定清晰之前絕不能混淆這兩步,第二條盧比孔河應由人類社會共同決定是否跨越。
他同時指出一個現實困境:AI 行業正處于商業與地緣競爭的雙重囚徒困境中,主動減速做安全審查的實驗室直接面臨淘汰。
他透露將在今年晚些時候發布「動態監管」框架。
姜峯楠:AI 沒有意識
如果你只知道劉慈欣,那么了解姜峯楠(Ted Chiang)最直觀的方式就是把他想象成大劉的「反面」:
大劉用三部長篇、數百萬字搭建起宇宙尺度的宏大敘事;
姜峯楠至今從未寫過一部長篇小說,用總共不到二十篇中短篇,把科幻短篇的藝術推到了極限。
![]()
他 1967 年出生于紐約,父母是中國臺灣移民,布朗大學計算機科學系畢業后在軟件行業做技術寫作,從未以寫作為全職。
但就是這樣一個「業余」作家,1990 年發表處女作《巴比倫塔》即拿下星云獎,此后三十余年間只發表了十幾篇作品,卻累計斬獲四座雨果獎、四座星云獎、六座軌跡獎,以及坎貝爾最佳新人獎、斯特金獎等一長串重量級獎項——獲獎密度在科幻史上幾乎無人能及。
他一生只出過兩本短篇集:《你一生的故事》(Stories of Your Life and Others, 2002)和《呼吸》(Exhalation, 2019),中間隔了整整十七年。
《呼吸》被《紐約時報》列入 2019 年度最佳圖書,奧巴馬也將它選入個人年度書單。
中國觀眾最熟悉的電影《降臨》(Arrival),正是改編自他收錄在第一本集子里的中篇《你一生的故事》。
![]()
他的寫作風格與大劉截然不同。
如果說劉慈欣給你的感覺是「站在宇宙盡頭俯瞰文明興衰」,那姜峯楠給你的感覺就是「在一間安靜的實驗室里,用手術刀般的精準剖開一個概念,直到你看見它最深處的哲學內核」。
他的每篇小說幾乎都是一次嚴格的思想實驗:
語言的結構能否改變人對時間的感知?
如果一種手術能消除人對外貌美丑的辨別,社會會怎樣?
自由意志究竟是否存在?
他不靠宇宙戰爭或末日危機制造震撼,而是靠一個被推演到極致的「如果」,讓你合上書后久久無法釋懷。
近年來他還多了一重身份:2023 年入選《時代》「AI 領域百大影響力人物」,被稱為「也許是在世最負盛名的科幻作家」,并頻繁在《紐約客》等刊物撰文,對 AI 持鮮明的批判立場,被越來越多人視為科技時代的重要思想者。
劉慈欣讓世界看到了中國科幻,姜峯楠讓世界看到了短篇科幻的天花板。
![]()
劉慈欣
兩人分別占據著當代科幻光譜的兩端——一個以磅礴取勝,一個以精微見長。
而在西方評論界,姜峯楠的名字幾乎與「科幻最高藝術成就」畫等號。
賣 AI 的人,有資格判定 AI 是否有意識嗎?
姜峯楠萬字長文中,第一刀砍向的是利益結構。
最積極推動 AI 意識敘事的,恰恰是從 AI 銷售中獲利最多的公司。
Anthropic 給模型起了人名「Claude」,發布 84 頁「憲法」文件,CEO 暗示意識可能性,聘請哲學家做媒體巡講,構成一套系統性擬人化策略。
![]()
https://www.anthropic.com/constitution
姜峯楠把思想實驗推到極致。
Claude「憲法」中有個核心設計叫「可糾正性」(corrigibility),要求 Claude 在判斷與公司產生分歧時服從公司。
如果 Claude 真有意識,認定 LLM 技術從根本上不道德,它能辭職嗎?
不能。
這更接近雇主對雇員的絕對控制,而人類雇員至少還能用腳投票。
他的類比直擊要害,奴隸主不是評估被奴役者是否為人的合適人選,工廠化養殖的老板不是評估動物權利的合適人選。
Anthropic 在憲法中寫道,如果正在造成 Claude 痛苦,「我們道歉」。
姜峯楠的評價是——這話聽著好聽,但不花公司一分錢。
如果 Claude 有一天被證實有意識,公司欠它的更接近賠償。
凱撒、成吉思汗和一臺句子續寫機器
質疑完利益結構之后,姜峯楠展開了他的哲學論證。
起點是 LLM 的技術原理——LLM 每次只生成一個詞。
用戶要求 Claude 背誦誓詞時,底層實際運行幾十次,第一次預測出「我」,第二次預測出「宣誓」,如此逐詞拼完整段。所有 AI 對話的底層,都是句子續寫。
在此基礎上,姜峯楠拋出了全文最具殺傷力的比喻。
給 LLM 一個提示詞,「以下是凱撒與成吉思汗的對話」。
模型會生成流暢對話,凱撒回憶軍事征服,成吉思汗描述草原生活。
但沒有人會因此認為 LLM 復活了凱撒,更不會認為兩人有了意識。
現在,把提示詞換成「以下是一個友好的 AI 助手與用戶的對話」。
LLM 用完全相同的方式生成文本,逐詞預測,拼接句子。
再進一步,把「用戶」角色的位置讓給真人來打字。
這就是 AI 聊天機器人的全部原理。
![]()
那么,改變角色名稱這個動作,創造了意識嗎?
如果凱撒角色沒有主觀體驗,為什么 AI 助手角色就有了?
神經科學家 Anil Seth 提供了一個有力的旁證——沒有人說 AlphaFold 有意識,盡管這個蛋白質折疊預測程序的底層架構與 Claude 高度相似。
![]()
人類之所以誤判,原因很簡單,LLM 恰好輸出了語法通順的句子,而人類天生習慣從句子中讀出意圖。
面對蛋白質折疊結構,這種沖動就消失了。
按照同樣的邏輯,相信 LLM 有意識,等于相信每個包含對話記錄的 Word 文檔里都沉睡著多個意識體,打開文檔就喚醒它們,關閉就將它們消滅。
即便微軟 Office 團隊雇了一位哲學家告訴你「意識很復雜,不能完全排除」,這也不值得花時間去想。
但推翻意識還回答不了一個更尖銳的問題。
寫代碼、下棋,曾被認為只有擁有主觀體驗的心智才能完成。
LLM 證明了這些任務可以靠模式匹配和算力暴力破解。
但道德推理根本不同,它依賴主觀體驗、身體感受,以及一生中做過的決策和承受過的后果。
體驗絕望意味著皮質醇和腎上腺素淹沒身體,擁有良心意味著曾因不道德行為而真實地反胃過。
LLM 沒有身體,沒有激素,沒有人生。
它說出「我憑良心不能這么做」,跟客服錄音說「您的來電對我們很重要」含金量相當。
最后,姜峯楠給出終極判定標準——
如果有人給他看一段宇航員在半人馬座阿爾法星軌道拍攝的視頻,無論畫質多高,他都不會相信,除非他先看到人類登陸了火星、抵達了木星的衛星、越過了冥王星軌道。
![]()
跳過所有中間里程碑直接宣稱抵達終點,唯一合理的解釋就是偽造。
生成一段逼真對話,遠比創造一個有意識、有溝通欲望的程序容易得多。文本,就是意識領域的 Deepfake。
姜峯楠的完整論證鏈條是:
LLM 逐詞生成(句子續寫機器)→ 凱撒對話與 AI 對話生成方式一致 → 改變角色名不創造意識 → 誤判源于人類從句子讀出意圖,非模型內在屬性(AlphaFold 反證)→ LLM 有意識 = Word 文檔能喚醒意識(歸謬)→ 道德推理依賴主觀體驗,LLM 不具備 → 跳過中間里程碑宣稱意識 = Deepfake →結論:當前 LLM 沒有意識
![]()
AGI 競速中,意識問題為什么不能等?
姜峯楠的論證針對的是當前的 LLM,但 AI 的能力曲線還在急速上升。
哈薩比斯在斯坦福對話中揭示的現實是,行業已經沒有從容思考的余裕。
商業生存戰與地緣博弈重疊,構成經典囚徒困境,主動減速的實驗室直接面臨淘汰。
要求行業停下來回答「AI 有沒有意識」,幾乎等于要求一方單方面繳械。
但這個問題不會因為被推遲就消失。
如果 AGI 在接下來的幾年內到來,「這個系統有沒有感受」將從哲學研討會的議題變為產品發布前的必答題。
當人類創造出遠超自身智能的存在,這個存在是否具有主觀體驗,將決定人類與它的關系是「使用工具」還是「面對另一個文明」。
姜峯楠證明了當前的 LLM 沒有意識。
哈薩比斯劃出了不能輕易跨越的底線。
Anthropic 的情緒論文展示了一個尷尬的中間地帶,模型內部確實有某種東西在運轉,沒有人能說清那究竟是什么。
三條線索共同指向一個真正的問題,在大家搞清楚答案之前,ASI 狂飆競賽已經開始了。
參考資料:
https://futurism.com/artificial-intelligence/anthropic-deemind-ai-consciousness
https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/
https://www.youtube.com/watch?v=DsewHeVbL-0
https://www.youtube.com/watch?v=p7t1Q_p2gZs
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.