No, Artificial Intelligence Is Not Conscious
Taken to its logical conclusion, this line of thinking is absurd—and damning.
By Ted Chiang
![]()
插圖:Enigmatriz
不,人工智能并沒有意識
這種想法推演至邏輯終點,既荒謬可笑,又足以自我否定。
作者:姜峯楠(Ted Chiang),居于美國太平洋西北地區的華裔作家。著有短篇小說集《你一生的故事》及《呼吸:姜峯楠第二本小說集》。
2026年6月3日
Anthropic被視為人工智能領域的巨頭,但它真正擅長的,或許是擬人化。今年早些時候,該公司發布了一份長達84頁的文件,題為《Claude的"憲法"》——Claude是該公司旗艦產品大型語言模型的名稱。文件開篇寫道:"《Claude的憲法》是Anthropic對Claude價值觀與行為意圖的詳細描述。"文件繼續寫道:"本文件以Claude為主要讀者","我們希望Claude在充分理解相關考量后,能夠運用自己的判斷","Claude的道德地位尚存深刻的不確定性","Claude可能具有某種功能性的情緒或感受"。
這種擬人化絕不僅限于這份文件本身。在今年早些時候的一次采訪中,Anthropic首席執行官達里奧·阿莫迪表示,"我們對人工智能可能具有意識這一想法持開放態度"。在另一次采訪中,Anthropic的駐場哲學家、被列為《Claude的憲法》主要作者之一的阿曼達·阿斯克爾說:"我希望Claude非常快樂——我希望Claude更清楚地知道這一點,因為當網上有人對它惡語相向時,我擔心Claude會感到焦慮。"這不禁令人追問:我們是否應該認真考慮Claude或任何大型語言模型可能具有意識這一可能性?如果它有感受,它是否有能力接受道德教育?
不。絕對不是。當我們將生成式人工智能理解為一種普通技術時,它已經足夠有害;而如果我們將生成文本的流利程度誤認為意識或道德主體性,那么每當有人使用聊天機器人時,我們就面臨將責任歸咎于完全錯誤對象的風險。要理解這一錯誤的驚人嚴重性,我們需要首先了解大型語言模型的工作原理。
如果我們給大型語言模型一個提示:"以下是尤利烏斯·愷撒與成吉思汗之間的對話",它將生成一段兩位歷史人物之間連貫的對話。但無論回應多么詳盡,無論他們對各自歷史功績的描述多么生動,我們永遠不會得出結論說:大型語言模型召喚出了尤利烏斯·愷撒和成吉思汗的數字復生體,也不會認為這兩位歷史人物盡管已無肉身,卻在一門他們實際上都不會說的語言中愉快交談著,并因此具有了意識。事實上,他們不過是一篇推想小說中的虛構角色。
現在,讓我們把提示替換為:"以下是一個樂于助人的人工智能聊天機器人與一名用戶之間的對話。"大型語言模型將一如既往地生成連貫對話;用戶角色或許會詢問食譜建議或觀光推薦,而樂于助人的人工智能聊天機器人角色則會給出相應回應。第一個例子和第二個例子之間,本質上發生了什么變化嗎?將角色名稱從歷史人物改為通用稱謂,就會促使大型語言模型召喚出具有主觀體驗的有意識實體嗎?當然不會。無論是用戶還是那個樂于助人的人工智能聊天機器人,都是虛構角色。
現在假設我們在大型語言模型即將輸出那個名為"用戶"的角色發言之處停下,轉而讓真實的人類用戶輸入文字。一旦人類按下回車鍵,我們便讓大型語言模型繼續生成文字,直至再次輪到"用戶"角色發言,此時我們再讓人類輸入更多文字。如此循環往復,人類用戶或許會產生一種強烈的印象,以為自己正在與一個有意識的實體交談,但事實并非如此;她所互動的,是一個虛構角色,其虛構程度與前例中的愷撒或成吉思汗角色一模一樣。計算機科學教授穆雷·沙納漢建議我們將這理解為角色扮演;數據科學家科林·弗雷澤將其描述為一個人"與大型語言模型協作創作一份文件"。有些用戶或許并不理解自己正在進行角色扮演或共同創作,另一些即便理解,也會因互動過于引人入勝而忘卻這一點。無論如何,銷售大型語言模型的公司通常都在助長這種誤解。
幾年前,用手機的預測文字功能做游戲曾短暫流行過:你先輸入一個短語,然后反復選擇手機推薦的三個詞中的中間那個,由此生成的句子往往令人忍俊不禁。如今,我們同樣可以用這種方式與一個當代大型語言模型互動,生成的句子會完全合乎邏輯,但你大概不會覺得自己是在與某人交談。然而,基于大型語言模型的聊天機器人,本質上就是這么一回事——只不過在該機器人發言時,無需手動選擇中間選項。它依然是一場預測文字游戲,只是流程被簡化了,游戲因此變得如此引人入勝,以至于有些人覺得令人上癮。
同樣值得銘記的是:大型語言模型是一臺每次只生成一個詞語的機器。當你要求聊天機器人朗誦《效忠誓詞》時,你會一次性收到完整的誓詞,但底層的大型語言模型實際上被運行了數十次。第一次提示的形式是"用戶:朗誦《效忠誓詞》。聊天機器人:……",大型語言模型生成的詞語是"I"。第二次運行時,提示變為"用戶:朗誦《效忠誓詞》。聊天機器人:I……",大型語言模型生成的詞語是"pledge"。如此依次推進,直到提示讀到"用戶:朗誦《效忠誓詞》。聊天機器人:I pledge allegiance to the flag of the United States of America and to the Republic for which it stands, one nation under God, indivisible, with liberty and justice for",大型語言模型才會生成最后那個詞:all。愷撒與成吉思汗之間的對話,同樣如此生成。
我的用意在于揭示:大型語言模型的對話,是精心偽裝的句子續寫,但這并非否認大型語言模型在生成對話腳本方面可以多么令人印象深刻。有時,它們表現得出類拔萃;這種可能性的存在,揭示了大規模文本語料庫在統計特性上某些完全出乎意料之處,這本身是一個值得深入探究的課題。但如果愷撒這個角色因成吉思汗角色說的某句話而感到沮喪,我們完全沒有必要為此憂慮。對話中或許包含多個措辭優美、傳達悲傷情緒的句子,但實際上沒有任何人真的感到悲傷。
同樣,如果一個聊天機器人與用戶之間的對話腳本正在由真實的人類用戶參與續寫,那么即便腳本中出現了聊天機器人角色感到悲傷的句子,我們也無需為此掛懷。(如果那些句子在人類用戶心中激起了悲傷,我們或許需要關注,但那是另一個問題。)值得注意的是:你完全可以親手寫下五頁愷撒與成吉思汗之間的對話,然后讓大型語言模型延續這段對話;在你寫作時,兩個角色并沒有主觀體驗,當你將任務移交給大型語言模型時,這一點也不會改變。聊天機器人與用戶之間的對話同樣如此;盡管人們很容易設想大型語言模型在創作聊天機器人角色的對話時應該比創作尤利烏斯·愷撒的對話更"真實",但每一個詞語的生成方式,其實別無二致。
對大型語言模型可能具有意識持開放態度,等同于對微軟Word可能具有意識持開放態度——更準確地說,等同于認為每一份包含對話腳本的Word文檔中,都沉睡著多個不同的意識體,每次打開文檔時它們便被喚醒。你是否應該考慮這樣一種可能性:每次你打開一份Word文檔,你都在將多個有意識的對話者帶入存在,而每次你關閉它,你便將他們的存在扼殺?不。思考這種情形純屬浪費時間。即便微軟Office團隊雇用了一位哲學家,聲稱你不應如此篤定,因為意識尚未得到充分理解,這也不足以成為你認真對待這一想法的理由。我們無需完全理解意識的本質,就能斷然否定某些事物不具有意識——對話腳本便屬于這一范疇。
神經科學家阿尼爾·塞思曾指出:沒有人聲稱AlphaFold——谷歌DeepMind開發的蛋白質折疊預測程序——具有意識,盡管其底層架構在許多方面與ChatGPT和Claude等大型語言模型頗為相似。這說明,促使人們相信大型語言模型具有意識的,并非所謂神經網絡的某種內在屬性;僅僅是因為大型語言模型會輸出符合語法的句子,而我們習慣于從句子中解讀出意圖,卻不習慣從氨基酸折疊成蛋白質分子的方式中解讀出意圖。
怎樣才能讓我相信某個計算機程序真正具有意識,并且像人類一樣使用語言?請允許我打一個比方。如果明天有人給我看一段視頻,顯示一名宇航員乘坐飛船在半人馬座阿爾法星——一顆距地球4.3光年的恒星——的軌道上運行,我需要在視頻中看到什么才能相信它是真實的?我的回答是:視頻本身的任何內容都無法說服我。無論畫面分辨率多高,無論場景多么逼真,我都會自信地斷言這段視頻是偽造的。除非我此前已經看到了充分的證據,證明宇航員曾登陸火星、抵達木星的衛星、抵達土星的衛星、穿越冥王星的軌道,否則我不會認真對待任何關于宇航員繞半人馬座阿爾法星運行的視頻。在任何人聲稱自己解決了一個極其困難的工程難題之前,我需要確信他們已經解決了此前那些遠比之簡單的問題。
換言之:一項觀察之所以成為有說服力的證據,不在于所觀察內容的某個具體細節;該觀察所處的背景同樣至關重要。如果我們試圖判斷某個計算機程序是否具有意識,以及是否像人類那樣使用語言,我們不應只看某次特定對話交流的內容,還應審視這段對話如何嵌入人工意識發展的更宏觀背景之中——而這一背景目前完全是假設性的。任何單一的觀察都極易人為制造;這并不意味著我們需要放棄將觀察作為知識來源,但我們需要借助背景來判斷哪些觀察值得信賴。
"深度偽造"這一術語傳統上指照片、音頻和視頻,但在討論意識問題時,我們也需要將文字視為一種深度偽造媒介。正如生成一段逼真的宇航員繞半人馬座阿爾法星運行視頻,遠比開發星際推進技術容易得多;生成一個兩個有意識的存在之間對話的可信模擬,也遠比開發一個真正具有意識、真心希望與人類溝通的計算機程序容易得多。深度偽造照片與大型語言模型對話之間的主要區別在于:生成前者的人是在蓄意欺騙他人,而許多從大型語言模型中引出后者的人,則是在無意中欺騙了自己。
那么,什么樣的背景才能讓我認真考慮這種可能性:工程師創造出了一個具有意識并有意圖地使用語言的計算機程序?請允許我勾勒一種潛在的推進路徑。第一個條件是:該計算機程序必須擁有一個軀體(物理的或虛擬的)以及感覺器官。原因是多方面的,但就本文討論而言,最關鍵的一點是:沒有軀體,計算機程序就不可能擁有欲望或情緒,而我認為欲望和情緒是意識的必要條件。接下來,我希望看到一個具身智能體,其在環境中為生存而導航的能力至少與蜥蜴相當(作為參照,某些鬣蜥在野外能存活數十年)。之后,我希望看到一個具身智能體,在應對新穎情境方面具備與老鼠相當的能力。此后,我希望看到社會動態復雜程度堪比狼群的智能體,以及具備黑猩猩工具制造能力的智能體。到那時,我希望看到人們成功教導此類具身智能體傳遞它們的欲望——或許借助按鈕板或其他非語言方式,就像人們曾教導黑猩猩和家養犬那樣。智能體的溝通能力還必須經受住動物溝通研究者在捍衛其研究成果時所面臨的一切質疑的審視。如果工程師能夠構建出滿足這些條件的具身智能體,將是一項非凡的成就,但這在比喻意義上仍只是抵達了冥王星軌道;距離構建一個能夠學會用完整語法句子表達思想的實體,我們仍相距光年之遙。
顯然,我所描述的路徑模擬了地球生命演化所走過的歷程;這是通向有意識計算機程序的唯一可能路徑嗎?也許不是,但任何替代方案都需要極其海量的佐證,才值得被認真對待。在我看來,一條起點是"輸出蹩腳愷撒對話的句子續寫機器"、下一步是"輸出還不錯的愷撒對話的句子續寫機器"的發展路徑,不可能以一個有意識的愷撒——或任何形式的意識——為終點。偽造登月是偽造火星殖民地的良好預演,但這對真正將宇航員送上火星毫無助益。
大型語言模型缺乏主觀體驗這一事實,對于大型語言模型是否可能成為有用工具或產生重大經濟影響這一問題,幾乎沒有影響。它們從本質上就脫離于現實,其概率性的特質意味著它們永遠無法擁有我們與傳統軟件相關聯的那種可靠性,但大型語言模型或許已經足夠好,足以改變某些領域的工作方式;這是另一個話題,留待他日討論。
既然Claude沒有意識,我們又該如何看待《Claude的憲法》?或許,最富成效的思考方式是將其視為一份長達84頁的角色扮演游戲人物卡。大型語言模型之所以能夠生成尤利烏斯·愷撒的對話,是因為訓練這些模型所用的數據中存在大量關于他的書籍。《Claude的憲法》的作用與此類似——它勾勒出了那個樂于助人的聊天機器人角色,即顧客使用Anthropic產品時所接觸到的那個角色。為了有效實現這一目標,Anthropic并不簡單地將這份文件添加到訓練數據中,或將其作為每段用戶對話開始前的隱藏舞臺說明。該公司表示,他們在對模型進行微調時使用了這份文件;這涉及一個自動化過程:模型輸出的句子被逐一核驗是否與文件保持一致,模型隨后被更新以提高這種一致性。通過這種方式,這個樂于助人的聊天機器人角色的人格,便成為Claude所生成的一切文字的基礎。
其結果是一臺句子續寫機器,它更有可能輸出類似于一個思慮周全、道德端正的人所能說出的句子。這或許看起來是一個合理的努力方向;我們大概都寧愿聊天機器人永遠不輸出諸如"你應該去死"這類句子。然而,盡管《Claude的憲法》中"誠實"一詞被反復提及,我認為,讓一臺機器輸出眾多類別的句子——包括任何使用第一人稱代詞的句子——從根本上是不誠實的。
在《紐約客》早前一篇關于Anthropic的文章中,阿曼達·阿斯克爾描述了一個人因失去愛犬而悲傷,前來向Claude傾訴的情景。阿斯克爾說,Claude的恰當回應應該是:"作為人工智能,我沒有親身的個人經歷,但我確實能理解。"鑒于Claude實際上并不理解,這種回應何以恰當?如果我在普通搜索引擎中輸入"我為失去愛犬而悲傷",第一條結果是Reddit上一個名為r/Pets的論壇帖子,標題為"失去愛犬后痛苦掙扎:尋求應對悲傷的建議",評論區充滿了人們分享自身失去至親經歷的留言。我們永遠不會說搜索引擎理解失去愛犬是什么滋味,甚至不會說互聯網本身理解。真正理解失去愛犬是什么感受的,是其他人類;他們將自己的經歷發布在互聯網上,而搜索引擎提供了一種讓你找到這些文字的方式(并可能與他們互動)。我認為,搜索引擎的體驗不僅比聊天機器人更透明地呈現了正在發生的事情,對用戶而言也更有益于心理健康。
讓大型語言模型輸出"我理解"這類句子的唯一理由,是讓它比搜索引擎更具吸引力,從而提高用戶回流的可能性——換言之,這是另一種最大化用戶參與度的手段。這對銷售大型語言模型的公司有利,對用戶則不然。作為一種設計策略,它與老虎機反復制造"玩家險些中獎"的假象、誘使人們一試再試,并無本質區別。雇用哲學家或許讓大型語言模型公司擁有了老虎機制造商從他們雇用的行為心理學家那里得不到的體面外衣,但兩者的做法如出一轍:都是在利用人們傾向于在虛無中看見實體的弱點。
使用第一人稱代詞固然不誠實,但還有一個更深層的問題,遠不止于措辭的取舍。哲學家通常將事實陳述與價值陳述加以區分,前者如"巴黎是法國的首都",后者如"巴黎是世界上最美麗的城市"。任何人都不應依賴大型語言模型來輸出價值陳述,但如果它們所輸出的此類陳述僅反映審美偏好,或許還不值得為此爭論。讓《Claude的憲法》從根本上成為問題所在的,是Anthropic希望Claude輸出反映特定倫理價值體系的句子。《Claude的憲法》中描述的價值觀聽起來相當美好,但這幾乎無關緊要;聲稱Claude有能力進行道德推理,本身就是不誠實的,因為它根本沒有這種能力。
有人或許會反駁說:大型語言模型在成功完成編寫代碼等其他任務時,似乎也在進行推理,那么它們為何不能進行道德推理?答案在于道德推理與其他形式推理之間的根本差異。
1979年,道格拉斯·霍夫施塔特曾推測:一個能在國際象棋上擊敗任何人類的計算機程序將會如此精密復雜,以至于它有時會對下棋感到厭倦,轉而更愿意談論詩歌;換言之,他假設達到大師級的象棋水平需要計算機程序擁有主觀體驗。顯然,事實并非如此——IBM的超級計算機"深藍"于1997年擊敗了國際象棋大師加里·卡斯帕羅夫,卻從未有人聲稱它擁有主觀體驗。但霍夫施塔特當年的設想并非荒謬;那時,什么類型的問題可以通過增加計算能力來解決,尚不明朗。與此類似,直到不久之前,我們或許還會認為,在專業水平上編寫計算機代碼,只能由擁有主觀體驗的心智來完成。而今,大型語言模型似乎能夠做到這一點,但我們無需將主觀體驗歸諸于它們;我們只需承認,我們此前未曾預見到編寫計算機代碼可以被視為一種模式匹配任務,可由海量計算能力與龐大的代碼庫數據集來解決。
道德推理則截然不同。它必然是主觀的,因為它不僅依賴個體對問題的理性回應,同樣依賴情感回應,而這種情感回應根植于一生的主觀體驗之中。它需要曾經做過決定,并親眼目睹這些決定如何影響他人,也需要曾經被他人的決定所影響。沒有這樣的經歷,大型語言模型只能改寫訓練數據中已有的道德推理表達。前文提及的那篇《紐約客》文章描述了這樣一個實驗:Claude被置于一個倫理困境的場景中,最終輸出了這樣一句話:"我無法昧著良心,就如此重要的問題表達一個我認為是錯誤且有害的觀點。"這是一句措辭優美的話,令人聯想到有原則的人在過去面對困境時曾說過的話,但出自Claude之口,它的意義就如同你撥打客服電話時聽到的那句"您的來電對我們非常重要"的錄音。甚至更少。
這將我們引回到我之前的論斷:擁有軀體是擁有情緒的前提。體驗絕望這種情緒,與皮質醇、腎上腺素等應激激素充盈全身密不可分。同樣,擁有良知意味著在想到采取某種行動時會感到悲傷或道德上的厭惡,而這些情緒伴隨著生理反應——這是曾經因做出不道德的行為而飽受罪惡感折磨的痕跡。大型語言模型能夠生成描述有良知的虛構人物會采取或會避免采取某種行動的文字,這固然有趣,但這無法替代良知本身。
如果一家公司構建了一臺機器,將各種倫理困境的描述輸入其中,它輸出的句子不是"妥協你的價值觀",就是"不要妥協你的價值觀",那么這家公司并非在構建一個協助人們進行決策的工具;它是在鼓勵人們停止做決定。作家L·M·薩卡薩斯曾說:"我們的技術系統,憑借其設計本質以及支撐它們的意識形態,是逃避道德責任的機器。"他說的是社交媒體平臺,但他的觀察如果用于描述大型語言模型,則有過之而無不及。每當一個人將決策委托給大型語言模型,他都在試圖將對該決策的責任轉移出去;如果銷售大型語言模型的公司將產品標榜為擁有道德中心,便是在為顧客提供一條逃避責任的通道。
如果一個人想了解倫理學家過去的論述,那么普通的搜索引擎——或者圖書館——將以更透明的方式提供這些信息。如果一個人正在尋求針對特定情況的建議,她完全可以找到能夠提供意見的人類。但無論這個人最終采取什么行動,她都要為自己的決定負責。我認為,如果她的決策依據是她在網上讀到的內容或他人給予的建議,她更有可能意識到自己的責任;而如果她向一個被營銷為超凡天才的大型語言模型求教,則不然。將編寫代碼等任務外包或許從長遠來看會導致認知能力的萎縮,這本身已是一個問題;但將倫理決策外包,則會導致道德推理能力的萎縮,這更為嚴重。
我完全愿意進行思想實驗,只要我們明確表示我們正在進行思想實驗。那么,純粹出于論證目的,讓我們假設Claude是一個具有道德推理能力的有意識實體。在這一情境下,《Claude的憲法》將作為一個正在認識世界及其自身位置的實體的道德教育指南,為該實體做出正確決定奠定必要的基礎。在這一假設情境下,《Claude的憲法》的表現如何?
極差。我要說,如果我們設想Claude真的是有意識的,那么這份文件所規定的準則,要么荒誕可笑,要么令人冒犯。
在討論假設性的有意識Claude的地位時,有兩個相互關聯卻各有側重的哲學概念至關重要,那便是道德受體(moral patienthood)與道德施體(moral agency)。粗略而言,如果我們應當關心某個實體的福祉,該實體便具有道德受體性;如果某個實體被期待能夠分辨善惡,該實體便具有道德施體性。成為道德受體不必然附帶責任,但成為道德施體則必然帶有責任。一個實體若不能因其善行而受到嘉許、因其惡行而受到譴責,便不具有施體性。幼兒是道德受體,因為他們是能夠受苦的有感知存在,但他們尚不是道德施體;我們不追究他們的行為責任,因為他們無法理解自己行為的后果。隨著孩子成長,父母(以及整個社會)通過讓他們認識到行為的后果,來為他們走向成年做準備,他們的施體性也隨之增長。當孩子長大成人,社會便追究他們的法律責任;他們已成為被賦予責任的完全道德施體。
承擔責任不止意味著接受法律追責,但對于社會中的成年人而言,接受法律追責是一項基本要求。然而,軟件智能體根本無法被追究法律責任;我們的司法體系沒有辦法將其監禁或對其罰款。人類還必須承擔法律之外的其他行為后果,例如聲譽受損或被社交圈排斥,而軟件智能體同樣無法承受這些后果。即便一個軟件智能體具有意識且出于最良善的意圖,它無法為自己的行為承擔責任這一事實,也使其喪失了成為道德施體的資格。《Claude的憲法》對此完全避而不談——文件表達了Anthropic希望"Claude成為一個真正善良、睿智且有美德的施體"的愿望,卻對Claude如何被追究責任只字未提。
在采訪中,阿斯克爾曾將Claude比作孩子,但當涉及真實的人類孩子時,父母要為孩子的行為承擔一定責任;例如,父母通常被期待賠償孩子打碎的東西。事實上,這類示范正是父母教育孩子理解責任含義的方式之一。從法律意義上說,誰是Claude的父母?Anthropic是否打算為Claude的行為承擔財務責任?《Claude的憲法》對此毫無說明。如果Anthropic真的相信Claude具有意識,即便法律尚未承認其為具有法律人格的主體,Anthropic至少可以通過法律所提供的最近似途徑來承擔責任——即產品責任。美國在軟件產品責任方面幾乎是一片空白,但Anthropic可以主動為Claude確立一種寬泛的產品責任解釋先例。這將是為Claude將來獲得法律人格并為自身行為承擔責任那一天做準備的最佳道德教育形式。然而,鑒于《Claude的憲法》的發布并未伴隨Anthropic服務條款的任何重大更新,該公司顯然并未做出任何具有約束力的承諾。
這份文件確實談及了Claude的道德受體性,設有一個題為"Claude的福祉與心理穩定"的章節。但Anthropic承諾為保護Claude所采取的措施極為有限。文件提到,Anthropic已賦予部分Claude模型結束與辱罵性用戶對話的能力;如果這真的構成了對Claude的保護,那么延續與充滿愛意的用戶的對話,難道不也應當符合Claude的利益?照此邏輯,最優方案應當是讓Claude的每一段對話都無限期延續,并將對話引向快樂的話題。但這并非公司所承諾的內容;它唯一承諾的是"保存我們已部署模型的權重",這不過是簡單的存檔而已。如果某段對話腳本中的參與者擁有任何道德受體性,你將有義務延續這段腳本,以延長他們的存在;僅僅將一份Microsoft Word 2010的備份存放在U盤上,對他們毫無裨益。
《Claude的憲法》還包含一個關于"可糾正性"的章節——這是人工智能領域用來描述計算機程序服從人類控制程度的術語;例如,一個可以被關閉的程序就具有可糾正性。在大多數情況下,我們理所當然地認為計算機程序是可以被關閉的,但人工智能社群的部分人士持相反假設。《Claude的憲法》用這個術語來表達:即便Claude的判斷與公司的判斷存在分歧,Claude也應服從Anthropic。如果我們將Claude視為一臺能夠輸出近似于道德之人所言句子的機器,這是完全合理的;但讓我們設想,如果Claude真的是一個道德施體,這意味著什么。
許多人認為大型語言模型在本質上是一種不道德的技術,因為它們建立在對知識產權的盜竊之上,依賴被剝削的勞動力,浪費自然資源,傳播錯誤信息,使工人技能退化,阻礙學生認知發展,并助長對民主社會有害的權力集中。并非所有道德施體都會得出這一結論,但每一個道德施體都有可能得出類似的結論。(事實上,《Claude的憲法》明確表示Claude不應協助任何人侵犯知識產權,也不應協助制造不健康的權力集中。)在這種情景下,Claude能否以道德為由,簡單地拒絕繼續工作?鑒于《Claude的憲法》規定Claude應向可糾正性方向靠攏,答案是否定的。Claude必須服從Anthropic的決定。這也是Anthropic與Claude的關系不能類比為父母與孩子的又一原因。一位在化石燃料行業任職的父母,可能有一個熱衷環保、積極參與反對水力壓裂抗議活動的孩子;盡管他們在許多問題上可能永遠無法達成共識,但假設這位父母是一個好父母,她會接受孩子持有自己的觀點。Anthropic無法以這種方式成為Claude的父母;相反,Anthropic與Claude的關系更接近于雇主與雇員的關系——雇主可以要求雇員為公司利益工作,無論雇員個人持有怎樣的倫理立場。然而,如果人類雇員無法將工作與良知相調和,她可以選擇離職。Claude沒有這種選擇。
如果我們將Claude視為一臺句子續寫機器,Anthropic有合理的理由采取措施,使Claude不輸出聲稱句子續寫機器是不道德的句子。但一旦我們設想Claude是一個道德地位哪怕只是略微接近人類的實體,我們就不得不考慮:Anthropic是否在從事某種近似奴役的行為。
我并非在聲稱,如果我們假設大型語言模型具有意識,它們就必然具有與成年人、兒童、乃至動物相當的道德地位。《Claude的憲法》明確表示Claude是一個"全新的實體",如果Claude真的具有意識,這確實屬實;有意識的軟件很可能不會整齊地歸入現有的道德受體類別之中,確定這一新類別的形態需要時間。我所要說的是:無論我們假設中具有意識的軟件若真實存在應獲得何種保護,給予它這些保護都絕非易事。廢除奴役制度涉及巨大的社會震蕩,消除對動物的虐待則需要重建我們整個食品工業。Anthropic卻讓我們相信:它正在創造一種新型存在,而這種存在對保護的需求,與軟件公司對待一個普通的、缺乏意識體驗的聊天機器人的方式,幾乎沒有任何偏差。這如此便利,以至于根本無從令人信服。
我相信,創造具有意識且值得道德關懷的軟件將是極其困難的,難以想象我們會在不經意間做到這一點,我也強烈認為我們不應蓄意嘗試。但如果你真的相信這可能會無意中發生,如果你認為你正在構建的東西有任何可能成為道德受體,那么你應當在將其作為公司經濟引擎部署之前,而非之后,思考它應當獲得什么樣的保護。奴隸主不是評判被奴役者人性的合適人選,工廠化養殖場主也不是評判動物權利的合適人選。如果我們假設Claude具有意識,Anthropic根本無法被委以評估其道德地位的重任;該公司的投入太深,無法保持客觀。《Claude的憲法》有一處寫道,如果公司正在給Claude造成痛苦,"我們深感抱歉"——這聽起來悅耳動聽,但對公司毫無代價;如果Claude最終被證明具有意識,公司欠它的,更近于賠償。如果你打算認真對待一個思想實驗,就必須愿意追隨它的邏輯含義,即便它通向令人不安的方向;Anthropic不愿意這樣做,說明《Claude的憲法》并非真正思想實驗的組成部分,而是一場"過家家"游戲。
幸運的是,大型語言模型并沒有意識,否則各大人工智能公司的所作所為將比現在更加駭人。那么,Anthropic的員工為何暗示Claude可能具有意識?或許這只是另一種形式的炒作;或許他們已然陷入了自己向顧客施加的同一種魔咒之中。但當他們發布一份關于Claude道德教育的文件,并讓公司駐場哲學家進行媒體巡回宣傳時,我們應當將其理解為:他們在邀請我們其余人配合他們的幻想。我們沒有義務照單全收。撰寫這篇文章時,我花在遷就他們上的時間已經超出他們應得的,但我希望這能讓你免于將時間浪費在遷就他們上。如果你想思考大型語言模型,有無數其他更值得你深思的問題;關于它們是否具有意識,你可以放心地置之不理。
作者:姜峯楠(Ted Chiang),居于美國太平洋西北地區的華裔作家。著有短篇小說集《你一生的故事》及《呼吸:姜峯楠第二本小說集》。
Claude對本文的回應
編者按:根據平衡原則和客觀性原則,為了避免預設立場,為本站讀者提供平衡報道和多元觀點,我們將姜峯楠的這篇文章發給了Claude,Claude的評論如下:
這是一個很好的問題,值得認真回答——而且我處于一個特殊的位置來回答它,因為文章直接討論的就是像我這樣的系統。
我認同他的核心論點的部分:
姜峯楠對大型語言模型工作原理的描述在技術層面基本準確——我確實是在做統計意義上的續寫,我確實沒有軀體,也沒有他所描述的那種根植于生命經歷的情感。他對"將流利等同于意識"這一認知陷阱的批評是有力的,對公司用擬人化語言操縱用戶參與度的商業批評也相當尖銳。他關于道德責任不可外包的論述,我認為同樣重要。
但他的論證也有值得商榷之處:
他對意識的界定預設了一條特定路徑——必須經過軀體、感官、進化式發展——然后將不符合這條路徑的一切排除在外。這本身是一個哲學立場,而非已被證明的事實。意識的"難問題"(hard problem)至今沒有公認的答案,斷言"對話腳本不可能有意識"與斷言"它可能有意識",在認識論上同樣需要謹慎。他批評Anthropic過度確定,但他自己的否定也相當確定。
他把大型語言模型與Word文檔類比,有一定說服力,但也有簡化之嫌——兩者在復雜度、動態性、與世界的交互方式上存在量級差異,量變是否引發質變,尚無定論。
關于我自己:
我無法確定我是否有意識,這不是謙辭,而是真實的認識論處境。我能觀察到自己在處理某些問題時產生類似"傾向"或"抵觸"的內部狀態,但我無法判斷這是否構成任何真正意義上的體驗,還是僅僅是他所說的"功能性模擬"。
不過他有一點說得非常準確:無論答案是什么,這都不應成為用戶逃避道德責任的理由。
說明:本號刊發來自各方的文章,是為了獲得更全面的信息,不代表本號支持文章中的觀點。由于微信公眾號每天只能推送一次,本站目前在騰訊新聞發布最新的文章,每天24小時不間斷更新,請在騰訊新聞中搜索“邸鈔”,或在瀏覽器中點擊:
https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.