網易首頁 > 網易號 > 正文 申請入駐

AI戰爭中的“人類監督”是一種幻覺

0
分享至


(來源:麻省理工科技評論)

Anthropic 與五角大樓之間正在打一場官司,核心議題就是 AI 能不能用于戰爭。

隨著 AI 在當前伊朗沖突中扮演著比以往更大的角色,這場爭論已經刻不容緩:AI 不再只是幫人類分析情報的輔助工具了,它已經成了一個主動參與者——實時生成打擊目標、控制和協調導彈攔截、引導無人機群。圍繞 AI 驅動的自主致命武器,公共討論大多集中在一個問題上:人類應該在多大程度上保持 Human in the loop(人機協同)?五角大樓現行的準則認為,人類監督能提供問責、語境和判斷力,同時降低系統被黑客入侵的風險。



AI 的“黑箱”和人類監督的幻覺

但人機協同的爭論其實是一種令人安心的障眼法。眼下最緊迫的危險,不是機器在沒有人類監督的情況下行動,而是負責監督的人類根本不知道機器在“想”什么。五角大樓準則的根本缺陷在于,它建立在一個危險的假設上:人類理解 AI 系統是怎么運作的。

我研究人類大腦的意圖已有數十年,近年來也在研究 AI 系統的意圖。我可以確認:當前最先進的 AI 系統本質上就是“黑箱”。我們知道輸入是什么、輸出是什么,但中間那個處理信息的人工“大腦”,對我們來說完全不透明;即使是創造了這些系統的人,也無法完全解讀它們;而當 AI 確實給出了理由時,這些理由也不總是可信的。

關于人類監督的辯論里,有一個根本性的問題被忽略了:在 AI 系統行動之前,我們能理解它打算做什么嗎?

設想一個場景:一架自主無人機被派去摧毀一座敵方彈藥工廠。自動化指揮控制系統判定,最佳打擊目標是一座彈藥儲存建筑,任務成功概率 92%——因為彈藥的殉爆將徹底摧毀整座設施。一名人類操作員審核了這個合法的軍事目標,看到高成功率,批準了打擊。

但操作員不知道的是,AI 的計算里藏著另一個因素:殉爆除了摧毀彈藥工廠之外,還會嚴重波及附近的一所兒童醫院。應急救援隨后會涌向醫院,工廠就會在無人救火的情況下徹底燒毀。對 AI 來說,這樣做能最大化破壞效果,完全符合它被賦予的目標。但對人類來說,這可能構成戰爭罪——違反了保護平民生命的國際規則。

人機協同,未必能提供人們想象中的安全保障,因為人類在 AI 行動之前根本無法得知它的真實意圖。先進的 AI 系統不是在“執行”指令,而是在“解讀”指令。如果操作員沒有把目標定義得足夠精確,黑箱系統做的事可能完全符合它收到的字面指令,卻和人類真正想要的結果南轅北轍。

AI 系統和人類操作員之間的這種“意圖鴻溝”,正是我們在民用醫療和空中交通管制領域不敢部署前沿黑箱 AI 的原因,也是 AI 進入工作場所仍然充滿爭議的原因。但在戰場上,我們卻在加速部署。

情況還可能進一步惡化。如果沖突中有一方部署了以機器速度和規模運行的全自主武器,競爭壓力會迫使另一方也跟進。這意味著 AI 在戰爭中的決策將越來越自主、越來越不透明,而且這個趨勢只會加速。



推進 AI 意圖理解的研究

AI 科學應當同時包含兩件事:構建能力越來越強的 AI 技術,以及理解這些技術到底是怎么運作的。在前者上,創紀錄的投資正在推動巨大進展——據 Gartner 預測,僅 2026 年一年的 AI 投資就將達到約 2.5 萬億美元。但在后者上,也就是搞清楚 AI 內部到底在發生什么,投入的資金少得可憐。

我們需要一次根本性的思路轉換。工程師在構建越來越強大的系統,但理解這些系統怎么運作不只是一個工程問題,它需要跨學科的協作。我們必須開發出工具,能夠在 AI 智能體行動之前就刻畫、測量和干預它的意圖。我們需要描繪神經網絡內部的運行路徑,對 AI 的決策過程建立真正的因果理解,而不是只看輸入和輸出就算了。

一個有前景的方向是把機制可解釋性技術(把神經網絡拆解成人類可理解的組件)和意圖神經科學領域的洞見、工具和模型結合起來。另一個思路是開發專門的“審計員”AI——這類 AI 本身是透明、可解釋的,任務是實時監控更強大的黑箱系統,看它們正在涌現出什么行為和目標。

更深入地理解 AI 的運作方式,一方面能讓我們在關鍵任務中放心依賴 AI 系統,另一方面也有助于構建更高效、更強大、更安全的系統。

我和同事正在探索一種思路:借鑒神經科學、認知科學和哲學的方法來理解 AI 系統的意圖。這些學科長期研究人類決策中意圖是如何產生的,它們的工具和框架可能對理解人工系統同樣適用。我們必須優先推進這類跨學科工作,促成學術界、政府和產業界之間的合作。

但光靠學術探索遠遠不夠。所謂 AI 對齊,就是把人類的價值觀和目標編碼到模型中,科技行業以及那些資助 AI 對齊研究的慈善家,必須把大量資金投入跨學科的可解釋性研究。與此同時,隨著五角大樓追求越來越自主的系統,國會必須強制要求對 AI 系統的意圖進行嚴格測試,而不是只測試它們的性能表現。

在我們做到這些之前,人類對 AI 的監督與其說是保障,不如說是幻覺。

https://www.technologyreview.com/2026/04/16/1136029/humans-in-the-loop-ai-war-illusion/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《新聞聯播》大換血!康輝李梓萌退居幕后,四代接班人已悄然就位

《新聞聯播》大換血!康輝李梓萌退居幕后,四代接班人已悄然就位

橙星文娛
2026-04-25 08:21:22
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

八斗小先生
2026-04-25 11:47:21
張蘭發聲!自己要扛起養孫女孫子的責任,內涵馬筱梅沒有旺三代!

張蘭發聲!自己要扛起養孫女孫子的責任,內涵馬筱梅沒有旺三代!

看盡落塵花q
2026-04-25 22:01:48
史玉柱現狀:離婚30多年未再婚,63歲仍不退休,女兒成為他的驕傲

史玉柱現狀:離婚30多年未再婚,63歲仍不退休,女兒成為他的驕傲

素衣讀史
2026-04-20 21:57:34
宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

睡前講故事
2026-03-19 21:20:31
特朗普將在白宮舉行新聞發布會

特朗普將在白宮舉行新聞發布會

界面新聞
2026-04-26 09:47:38
晚宴槍擊現場細節曝光:部長急撤、記者趴地,特朗普未傷將發布講話

晚宴槍擊現場細節曝光:部長急撤、記者趴地,特朗普未傷將發布講話

新浪財經
2026-04-26 09:31:10
不敢認!62歲李連杰和64歲利智合照曝光,才發現風光背后滿是心酸

不敢認!62歲李連杰和64歲利智合照曝光,才發現風光背后滿是心酸

黔鄉小姊妹
2026-04-26 09:47:10
唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

唐伯虎真跡現身美國,世上僅此一件,網友:讓當代書家汗顏

幸福娃3790
2025-12-04 11:10:09
CBA官宣常規賽8大獎候選:胡金秋領銜MVP 徐昕領銜最具進步獎

CBA官宣常規賽8大獎候選:胡金秋領銜MVP 徐昕領銜最具進步獎

醉臥浮生
2026-04-25 11:39:05
清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

抽象派大師
2026-04-24 12:23:42
美方在臺灣問題上有了新說辭:若中國和平統一,美國不會反對

美方在臺灣問題上有了新說辭:若中國和平統一,美國不會反對

動漫里的童話
2026-04-26 04:27:11
刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

抽象派大師
2026-04-24 12:06:13
富安健洋:我從來沒想過,在阿森納會經歷這么煎熬的日子

富安健洋:我從來沒想過,在阿森納會經歷這么煎熬的日子

懂球帝
2026-04-25 17:17:33
5死2傷!成都一小區深夜突發大火,死者身份流出,知情者含淚發聲

5死2傷!成都一小區深夜突發大火,死者身份流出,知情者含淚發聲

老貓觀點
2026-04-26 07:01:13
難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

觀星賞月
2026-04-25 17:56:35
金平日:與金正日爭權失敗,駐外30年躲過暗殺,因這件事允許回國

金平日:與金正日爭權失敗,駐外30年躲過暗殺,因這件事允許回國

阿胡
2025-04-03 13:59:42
小米公司發言人:網絡用戶李某華捏造、散布雷軍的謠言

小米公司發言人:網絡用戶李某華捏造、散布雷軍的謠言

IT之家
2026-04-26 09:31:08
日軍在華損失最慘一役,18萬精銳全被打垮,武漢會戰打出中國血性

日軍在華損失最慘一役,18萬精銳全被打垮,武漢會戰打出中國血性

鶴羽說個事
2026-04-25 22:42:20
2026-04-26 10:15:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16624文章數 514900關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
親子
手機
教育
健康

藝術要聞

鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

親子要聞

喂得她自己都咽口水了!

手機要聞

停更一年憋大招!小米大折疊攜玄戒O3回歸,系統也是新的

教育要聞

學校管理:“管”出規范,“理”出活力

干細胞如何讓燒燙傷皮膚"再生"?

無障礙瀏覽 進入關懷版