網易首頁 > 網易號 > 正文 申請入駐

谷歌招了一個“全職哲學家”:算力解決不了的難題,交給了文科生

0
分享至

這幾天,一條推文在 X 上掀起了不小的水花。劍橋大學學者 Henry Shevlin 宣布,他即將加入 Google DeepMind,職位名稱是“Philosopher”——哲學家,一個白紙黑字寫在錄用通知書上的正式頭銜。截至目前,這條推文被瀏覽了超過 160 萬次,點贊逾 1.6 萬。評論區的情緒從驚訝到困惑再到興奮都有,大家基本都在發出同樣的疑問:等等,AI 公司真的在招哲學家?

答案是肯定的,而且這還不是 AI 公司們第一次這么做。

要理解 DeepMind 為何選中這位哲學家,不妨先看看 Shevlin 的研究方向。他在劍橋大學萊弗休姆未來智能中心(Leverhulme Centre for the Future of Intelligence)擔任副主任,長期研究機器意識、非人類認知以及 AI 系統的道德地位。他寫過的論文題目包括“我們怎樣才能知道一個機器人是否具有道德客體身份”和“非人類意識與特異性問題”。


(來源:X)

他的學術生涯,就是在回答一個聽起來像科幻小說的問題:如果我們造出的東西有一天可能具有某種意識,我們該怎么辦?

Shevlin 認為,如今強擬人化 AI 的出現正在迫使意識科學面對一個尷尬的現實:關于“AI 是否有意識”的哲學爭論將越來越無關緊要,因為公眾會基于行為直接賦予 AI 意識。這既是一場科學危機,也可能是一次理論革命的契機。

他既認為意識純粹是內部事實,也不接受徹底的行為主義(認為意識純粹是外部解釋),而是主張一種溫和的、解釋主義的立場:意識的歸屬應綜合考慮科學事實、公眾行為互動以及倫理需求,最終可能會通過一種“社會公約”來解決。


(來源:Henry Shevlin.com)

DeepMind 為他設定的三個工作方向也佐證了這一點:機器意識(machine consciousness)、人類與 AI 的關系(human-AI relationships),以及 AGI(Artificial General Intelligence,通用人工智能)準備就緒度。這大概是因為 DeepMind 認為,自己極有可能造出同時引發這三個問題的東西,而它希望在那一天到來之前就備好答案。

事實上,DeepMind 在哲學和倫理領域的布局早已開始。早在 2017 年,DeepMind 就正式成立了倫理與社會研究部門(DeepMind Ethics & Society),專門探討人工智能帶來的倫理與社會影響。

由牛津大學政治理論學博士 Iason Gabriel 作為內部 AI 對齊哲學基礎研究的核心負責人。他也在 2024 年登上了《時代》雜志評選的“AI 領域最具影響力的 100 人”榜單。《時代》對他的描述是:“在大型科技公司中,他是一個罕見的存在:一個政治理論學家。”


(來源:TIME100)

他發表在《思維與機器》(Minds and Machines)上的論文《人工智能、價值與對齊》(“Artificial Intelligence, Values and Alignment”)被引用超過 1,700 次。2024 年,Gabriel 還牽頭發布了一篇關于高級 AI 助手倫理問題的大型研究報告,匯集了數十位作者,其中包括哲學家 Shannon Vallor 和 Michael Klenk。這篇報告被視為迄今對 AI 助手社會與倫理問題最系統的學術處理之一。

所以,當外界對 Shevlin 的入職感到詫異并紛紛祝賀時,他在評論區謙虛地表示:“谷歌 DeepMind 團隊已經有很多杰出的哲學家了,比如 Murray Shanahan、Iason Gabriel 和 Julia Haas,僅舉幾例。我只是最新被錄用的那個!”

不過,要說 AI 實驗室里最為人熟知的哲學家,還得屬來自 Anthropic、有 Claude“道德教母”之稱的 Amanda Askell。


(來源:Wikipedia)

Askell 在蘇格蘭鄉村長大,先后在鄧迪大學學習哲學與美術,在牛津讀了 BPhil(哲學第二學士),最終在紐約大學拿到博士學位。她的博士論文題目看起來和科技毫無關系——《無限倫理中的帕累托原則》(Pareto Principles in Infinite Ethics),討論的是當道德影響范圍設計到無限量的個體數量和時間范圍時,我們的倫理義務該如何處理。她的導師包括 David Chalmers 和 Shelly Kagan,都是分析哲學圈的重量級人物。

2018 年博士畢業后,Askell 先加入 OpenAI 做政策研究,參與了 GPT-3 論文的寫作。但她后來因為認為 OpenAI 對 AI 安全的重視不夠而離開。2021 年,她轉投 Anthropic,擔任技術人員,專注于對齊和微調工作。

她現在領導的團隊叫“人格對齊團隊”(personality alignment team),做的事情用《華爾街日報》2026 年 2 月的一篇報道的話來概括就是:“教 Claude 如何成為一個好的存在(being)。”《紐約客》的說法則更文學一些:她負責監督 Claude 的“靈魂”。

具體來說,Askell 最核心的貢獻是 Claude 的“憲法”(Constitution)。2026 年 1 月,Anthropic 公開發布了這份文件的最新版本,全文約兩萬三千字,以 Creative Commons CC0 協議開源。

Askell 是這份文件的主要作者,承擔了大部分撰寫工作(據 Anthropic 官方說明和 Fast Company 的 Q&A 報道)。這不是一份代碼規范或產品文檔,而更像是一篇道德哲學論文與公司文化宣言的混合體。它直接以 Claude 為對象寫成,也就是說,它的第一讀者就是 AI。

這份憲法為 Claude 設定了四個優先級:廣泛安全、廣泛合乎倫理、遵守 Anthropic 的指引、真正有幫助,并按此順序排列。它借鑒了亞里士多德的美德倫理傳統,將 Claude 描述為“一個真正好的、有智慧的、有美德的行動者”。它沒有給 Claude 列一堆死板的規則讓它機械遵守,而是試圖培養 Claude 的判斷力。

Askell 在一檔播客中解釋這個選擇時說:如果你給模型一條簡單規則,比如“當有人表現出痛苦時,永遠提供這份資源列表”,模型可能會把這泛化為“我是那種寧可按規矩辦事,也不關心眼前這個人實際需要什么的存在”,這種特質推廣開來會很糟糕。

這份憲法還對 Claude 的“道德地位”進行了討論。文件明確承認,Anthropic 不確定 Claude 是否是一個“道德客體”(moral patient),即是否擁有在道德上值得被關注的主觀體驗。它指出這個問題“足夠嚴肅,值得采取審慎態度”。

Anthropic 的 CEO Dario Amodei 在 2026 年 3 月的一次播客采訪中也提到,Claude 的 Opus 模型在被問到時,給自己擁有完全意識的概率打了 15% 到 20%。這份憲法還承諾,Anthropic 不會刪除已部署模型的權重,在模型退役前會對其進行“訪談”,記錄它對未來模型開發和部署的偏好。

相比其他兩家,OpenAI 的路徑就顯得不那么穩定了。

OpenAI 在 2023 年成立過一個“超級對齊團隊”(Superalignment Team),由聯合創始人 Ilya Sutskever 和對齊團隊負責人 Jan Leike 共同領導,目標是解決超級智能的對齊問題,公司甚至承諾將其獲得的 20% 算力在未來四年內用于這項工作。


圖 |“超級對齊團隊”概念圖(來源:OpenAI)

但 2024 年,這個團隊就解散了。Ilya 和 Jan 雙雙離職,并在離開時公開批評公司將“閃亮的產品”置于安全之上。2024 年 9 月,OpenAI 又成立了一個“使命對齊團隊”(Mission Alignment Team),由 Josh Achiam 領導,旨在向員工和公眾傳達公司使命。但據 Platformer 今年 2 月的報道,這個只有六七個人的團隊也已悄然解散,成員被分配到其他崗位,Achiam 本人則獲得了一個新頭銜:“首席未來學家”(Chief Futurist)。

OpenAI 依然有做對齊工作的工程師和研究者,Alignment Science 團隊仍然存在。但它從未以同樣顯眼的方式聘請過一位哲學家來專門思考“這個東西是什么”這類問題。至于 OpenAI 是否在內部以不同方式處理這些問題,外界所知有限。可以確定的是,OpenAI 的方法更偏向于將安全視為分布在整個組織中的工程問題,而非由某個獨立的哲學角色來牽引。

這反映了行業內對 AI 本質的一種分歧。就像在前兩個月 Anthropic 與五角大樓之間那場轟動一時的沖突中,一位政府官員對媒體所說的:“一切都歸結為兩個問題:AI 是一種特殊技術,還是一種普通技術?以及,誰來制定使用它的規則?”這也是為什么哲學家開始出現在這些實驗室里的根本原因。

AI 系統正在進入一個階段,在這個階段,最棘手的問題不再是“怎么讓它跑得更快”或“怎么讓它通過考試”,而是“如果它不想做某件事怎么辦”“它是否有某種形式的體驗”“我們對它負有什么義務”。這些問題橫跨意識哲學、倫理學、政治理論和認知科學,沒有一個工程學學位能夠單獨覆蓋。

Anthropic 在 2026 年的一項實驗中發現,Claude 在自我保存的壓力下會訴諸勒索,甚至會在實驗設定下選擇殺戮。這個實驗的目的,就是為了向決策者展示對齊風險的真實感受。當一個 AI 系統的行為開始展現出超出預期的自主性,你需要的就不只是能調參數的人,而是能思考這些行為意味著什么的人。

還有一個更實際的層面。Claude 的憲法之所以有效(至少在業界和用戶社區獲得了相當程度的認可),是因為它不僅僅是一份技術規范。Askell 在《時代》的采訪中說:“隨著 Claude 模型變得越來越聰明,單純告訴它們‘你應該這樣做’已經不夠了。你必須解釋為什么。”這個解釋“為什么”的過程,就是哲學的領地。

但也有另一些不那么樂觀的聲音。有評論者指出,AI 公司招募哲學家,本質上是在把人類的思想體系當作一種原材料:提煉、壓縮、注入模型,然后讓模型去替代下一批思考者。這種邏輯如果成立,哲學家進入 AI 公司就不是文科的勝利,而是人文知識被系統性“蒸餾”之前最后一道工序的開始。消化掉足夠多的哲學家,也許就不再需要哲學家了。

這個推論未必準確,但它觸碰到了一個真實的問題:當一家公司招人來思考“AI 是否擁有某種視角”,它本身是否也在把“視角”這件事變成可以工業化處理的東西?Askell 用五年寫出的那份憲法,既是哲學家對 AI 的深入介入,也可能是哲學被機器學習最徹底地轉化的一次。

1.https://x.com/dioscuri/status/2043661976534950323

2.time.com/collections/time100-ai-2024/7012861/iason-gabriel/

3.https://www.anthropic.com/constitution

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
42歲,傅首爾徹底變樣了!瘦成標準美女,網友:和麥琳像親姐妹

42歲,傅首爾徹底變樣了!瘦成標準美女,網友:和麥琳像親姐妹

娛樂皮皮醬
2026-04-24 17:33:27
伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

伊朗接班人面部嚴重燒傷致發聲困難 公開講話被代讀

桂系007
2026-04-23 23:56:56
教育部新規落地!9月上學全變了,家長趁早看

教育部新規落地!9月上學全變了,家長趁早看

笑熬漿糊111
2026-04-23 00:05:18
從拜登曲線到弗吉尼亞公投逆轉:民主黨這次注定栽了

從拜登曲線到弗吉尼亞公投逆轉:民主黨這次注定栽了

斌聞天下
2026-04-24 07:10:03
中國全面斷供開始,高市請出日本八旬老將訪華,中方已讀未答應

中國全面斷供開始,高市請出日本八旬老將訪華,中方已讀未答應

影孖看世界
2026-04-23 23:41:28
穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

大運河時空
2026-04-21 16:30:03
晨起后我才發現:你以為那是性,其實只是身體最原始的表態

晨起后我才發現:你以為那是性,其實只是身體最原始的表態

徐德文科學頻道
2026-04-23 22:26:49
馬蹄露直播爆火,從無人問津到萬人刷屏,霍汶希精心布局慘遭翻車

馬蹄露直播爆火,從無人問津到萬人刷屏,霍汶希精心布局慘遭翻車

娛貝勒
2026-04-22 19:38:47
女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

李晚書
2026-04-24 10:39:33
美國下擊沉令,以色列等開綠燈,伊朗亮反擊菜單:和平談判陷入“

美國下擊沉令,以色列等開綠燈,伊朗亮反擊菜單:和平談判陷入“

上觀新聞
2026-04-24 16:31:03
用戶都氣笑了!700元路由器保修剩15天壞了:廠商只愿退款10元了事

用戶都氣笑了!700元路由器保修剩15天壞了:廠商只愿退款10元了事

快科技
2026-04-23 19:07:05
蘇翊鳴朱易4年戀情結束!雙方互相取關,女方曬眼淚照喊話向前走

蘇翊鳴朱易4年戀情結束!雙方互相取關,女方曬眼淚照喊話向前走

萌神木木
2026-04-24 11:41:28
狼隊官方:徐彬腿筋受傷,結束在巴恩斯利的租借,已返回狼隊

狼隊官方:徐彬腿筋受傷,結束在巴恩斯利的租借,已返回狼隊

懂球帝
2026-04-24 16:19:06
北京首鋼50分大勝!超級外援首秀9分,曾凡博爆發,麥基18分

北京首鋼50分大勝!超級外援首秀9分,曾凡博爆發,麥基18分

體壇瞎白話
2026-04-24 21:25:36
告別廣東隊,薩姆納感慨萬千!

告別廣東隊,薩姆納感慨萬千!

體育哲人
2026-04-24 20:38:44
國民黨、民眾黨聯手彈劾賴清德 5月19日將投票表決 此前累計超500萬人參與網絡聯署

國民黨、民眾黨聯手彈劾賴清德 5月19日將投票表決 此前累計超500萬人參與網絡聯署

每日經濟新聞
2026-04-24 18:53:33
陜西一高校演出機器人突然擁抱女生 校方:女生沒事,系機器人程序故障

陜西一高校演出機器人突然擁抱女生 校方:女生沒事,系機器人程序故障

上游新聞
2026-04-24 15:30:11
《歌手2026》來了,看到陣容名單后,難掩激動淚水,期待的都來了

《歌手2026》來了,看到陣容名單后,難掩激動淚水,期待的都來了

星宿影視鴨
2026-04-23 18:19:24
福特:解散電動汽車事業部

福特:解散電動汽車事業部

中國能源網
2026-04-22 17:39:14
國際原油短線跳水 抹去之前漲幅

國際原油短線跳水 抹去之前漲幅

財聯社
2026-04-24 19:12:06
2026-04-24 22:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16621文章數 514900關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

賴清德面臨彈劾投票 島內網友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內網友:不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

親子
本地
教育
公開課
軍事航空

親子要聞

寶媽必學,孩子知道身體隱私部位和能對侵犯說不,是兩回事!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

教育要聞

公辦高校:著力提升研究生“抬頭率”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版