无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

哈佛Science重磅:AI急診診斷準確率67%,超越資深主治!取代醫生尚早

0
分享至



新智元報道

編輯:犀牛 所羅門

【新智元導讀】哈佛研究登上Science:在76名真實急診患者的雙盲對決中,OpenAI o1診斷準確率67%碾壓人類醫生的50%,治療方案得分89%對34%更是斷崖式領先——但AI還看不見患者的臉色和痛苦,真正的變革不是「AI贏了」,而是急診室正在走向「醫生×患者×AI」三方共治的新范式。

剛剛,一顆重磅炸彈砸進了全球醫療圈。

哈佛大學醫學院聯合貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center),把一項令人坐立不安的研究結果發在了《Science》上。


在急診室的真實分診場景中,OpenAI的o1推理模型診斷準確率達到67%,而兩位經驗豐富的內科主治醫生,一個55%,一個50%。

AI贏了。

不是在做題,不是在考試,而是在真刀真槍的急診室里。


更扎心的數據還在后面——在制定治療管理方案的測試中,o1拿了89%,而人類醫生使用傳統資源輔助后,中位數只有34%。


差距不是一星半點,是兩倍多。

這不是一個AI公司的自賣自夸,這是哈佛醫學院牽頭、頂級學術期刊背書、雙盲評審確認的結果。

研究論文的通訊作者、哈佛醫學院AI實驗室負責人Arjun Manrai說了一句意味深長的話:「我們用幾乎所有基準測試了這個AI模型,它超越了此前所有模型和醫生基線。」


一個時代的裂縫,就這么被撕開了。

76個真實患者,零預處理,雙盲對決

這項研究最硬核的地方在于:它不是拿精心整理的教科書病例去考AI,而是直接把急診室里最原始、最混亂的電子病歷扔給了機器。

研究團隊從貝斯以色列急診科隨機選取了76名真實患者,在三個關鍵診斷節點進行對比——急診分診(患者剛進門)、急診醫生首次接診、以及收治入院或進ICU。

每個節點,兩位內科主治醫生和OpenAI的o1、4o模型同時給出鑒別診斷,每方最多列5個可能診斷。

關鍵細節是:研究人員對數據零預處理。

論文明確寫道,AI模型接收到的信息和醫生看到的電子病歷完全一致——那些凌亂的、缺失的、充滿噪聲的真實臨床數據。


然后,由另外兩名主治醫生進行「盲評」——他們不知道哪個診斷來自人類、哪個來自AI。

盲評結果顯示,評審醫生幾乎完全無法分辨診斷來源:一位醫生猜對AI/人類的準確率僅15.2%(83.6%的時候選了「分不清」),另一位更夸張,只有3.1%(94.4%「分不清」)。

換句話說,AI寫的診斷,連資深醫生都看不出是機器生成的。

在這樣的嚴苛條件下,o1模型在急診分診階段——信息最少、時間最緊、決策最關鍵的環節——給出了67.1%的準確率(包含精確診斷或非常接近的診斷)。

兩位人類醫生分別是55.3%和50.0%。


隨著信息逐漸增多,所有人的表現都在提升:到入院階段,o1準確率升至81.6%,醫生分別為78.9%和69.7%。

但差距始終存在,而且在信息最匱乏的初始階段差距最大。

這恰恰是最可怕的發現——急診最要命的就是「前幾分鐘」,患者剛被推進來,信息碎片化,生死攸關,醫生需要在極度不確定中做出判斷。

而恰恰在這個環節,AI表現最突出。

急診醫生不干了:拿內科醫生跟AI比,能說明什么?

論文發布后,一位名叫Kristen Panthagani的急診科醫生在社交媒體上直接開懟:這是一個「被過度炒作的有趣研究」。

她的核心質疑是:研究中和AI對比的是內科主治醫生,不是急診科醫生。

「如果我們要拿AI和醫生的臨床能力做比較,至少應該拿同一個??频尼t生來比。我不會驚訝于一個大語言模型能在神經外科的專科考試中打敗皮膚科醫生,但這并不能說明什么?!?/p>


她還指出了急診醫學的本質邏輯:「作為一名第一次看到患者的急診醫生,我的首要目標不是猜出最終診斷。我的首要目標是判斷你是否有一種可能會殺死你的疾病。」

這個反駁有力量嗎?

有。但也需要注意,研究論文本身已經承認了這一局限性,而且論文的核心論點從來不是「AI可以替代急診醫生」,而是「AI在有限信息下的推理能力已經達到值得臨床試驗的水平」。

急診醫生在現場做的遠不止「猜病名」——他們要看患者的面色、聽呼吸的聲音、感受疼痛的程度、判斷生命體征的微妙變化。

這些細微的非語言信號,有時候比任何檢驗指標都重要。

一個經驗豐富的急診醫生走進病房,掃一眼患者,可能就已經做出了80%的判斷——這種能力叫「臨床直覺」(clinical gestalt),它來自數以萬計的真實接診經驗,目前沒有任何AI能夠復制。

Manrai自己也承認,團隊正在研究AI處理影像和其他非文本信號的能力,「看到了快速進步的結果」,但距離臨床部署還有很長的路。

辛頓的「預言」教訓:放射科醫生沒下崗,反而更忙了

說到AI取代醫生這個話題,不得不提一個經典的「打臉」案例。

2016年,AI教父、諾貝爾獎得主Geoffrey Hinton說了一句震動醫學界的話:人們現在就應該停止培訓放射科醫生了。深度學習在五年內就會比放射科醫生做得更好,這完全是顯而易見的。


這句話當時嚇退了不少準備選擇放射科的醫學生。整個2010年代后期,媒體上鋪天蓋地都是「放射科即將消亡」的文章。

十年過去了。

梅奧診所的放射科醫生團隊從2016年至今增長了55%,達到400人。美國放射學會預測,未來30年放射科醫生供給還將增長26%。

全球最大的放射科醫生短缺正在發生——不是因為AI搶走了工作,而是因為AI讓影像檢查變得更便捷,反而催生了更多需求。

Hinton本人后來也承認自己「說得太寬泛了」。

他修正了預測:未來的醫學影像解讀將由「AI和放射科醫生的組合」來完成,AI會讓放射科醫生「效率大大提高,同時提升準確率」。

這個故事里有一個深刻的經濟學原理——杰文斯悖論:當一項技術讓某種資源的使用更高效時,這種資源的總需求反而可能大幅增加。

影像診斷變便宜、變快了,于是醫生開了更多檢查,放射科醫生反而更忙了。

哈佛這項新研究的作者們顯然吸取了辛頓的教訓。

論文通訊作者Manrai在新聞發布會上明確說:「我們的發現并不意味著AI取代醫生,盡管有些賣AI醫療產品的公司可能會這么說。」

共同通訊作者、貝斯以色列AI項目負責人Adam Rodman則更直白:「目前AI診斷沒有任何正式的問責框架。患者想要的是人來引導他們度過生死攸關的決策,引導他們面對艱難的治療選擇?!?/p>

不是「AI贏了」

而是醫療決策權在重組

據美國醫學會(AMA)2026年調查,超過80%的美國醫生已經在職業中使用AI——是2023年的兩倍。

17%的醫生使用AI進行「輔助診斷」。

2025年的一項Elsevier研究發現,20%的臨床醫生已經在向大語言模型尋求「第二意見」。

哈佛這項研究證明,AI在信息最匱乏、決策最緊迫的急診場景中,推理能力已經超過了人類醫生。

三個數據疊加在一起,指向一個清晰的趨勢:醫療決策的權力結構正在發生根本性的重組。

過去的急診室模式是:患者進來→醫生判斷→做出決策。

未來的模式可能變成:患者進來→AI快速掃描電子病歷給出初步判斷→醫生結合臨床觀察和AI建議做出決策→患者參與討論治療方案。

研究作者Rodman預測,未來會出現三種分化:一部分任務人類持續做得更好,一部分任務AI持續做得更好,還有一部分任務需要人機協作增強。

這就是研究者所說的「醫生-患者-AI」三方協作模式。

聽起來很像自動駕駛。

L2級別——AI輔助人類決策;L3級別——AI主導、人類監督;L4級別——特定場景全自動。

目前AI在醫療領域大概處在L2到L3之間的階段:它已經能在「文字世界」里給出超越人類的判斷,但在真實的、多模態的臨床場景中,它還需要人類的眼睛、耳朵和直覺來補位。

AI誤診了,誰負責?

在所有討論中,有一個房間里的大象無人敢正面觸碰:AI出錯了,誰來承擔責任?

Rodman在接受《衛報》采訪時坦言:目前AI診斷沒有任何正式的問責框架。

如果一名醫生誤診了,有成熟的醫療糾紛處理體系——患者可以投訴、可以訴訟、醫生面臨執照風險。

但如果AI給出了錯誤建議,醫生采納了,患者受到了傷害——是算醫生的責任?AI公司的責任?醫院的責任?還是三方共擔?

更復雜的場景是:如果AI給出了正確建議,但醫生否決了AI的判斷、堅持自己的錯誤診斷,導致患者延誤治療——此時醫生要不要為「忽視A建議」承擔額外責任?

還有一個更隱蔽的風險:過度依賴

當醫生習慣了AI給出的高準確率判斷,他們的獨立思考能力會不會退化?就像GPS讓很多人喪失了自主導航能力一樣,AI輔助診斷是否會讓醫生的臨床推理「肌肉」逐漸萎縮?

這些問題,目前沒有任何國家有清晰的答案。

參考資料:

https://www.science.org/doi/10.1126/science.adz4433

https://www.harvardmagazine.com/ai/ai-outperforms-doctors-diagnosis-harvard-study

風險提示及免責條款:市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資責任自負。


點個在看支持一下??

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
張柏芝母親節曬仨兒子,8歲三胎兒子出鏡,謝霆鋒疑似陪同吃飯

張柏芝母親節曬仨兒子,8歲三胎兒子出鏡,謝霆鋒疑似陪同吃飯

老吳教育課堂
2026-05-13 15:35:27
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
解放戰爭1946-1949年,我軍戰死的軍長以上級別將領是哪3位?

解放戰爭1946-1949年,我軍戰死的軍長以上級別將領是哪3位?

歷史龍元閣
2026-05-12 14:25:12
別犯政治幼稚病!美國國務卿被拉黑?法新社:盧比奧隨特朗普訪華

別犯政治幼稚??!美國國務卿被拉黑?法新社:盧比奧隨特朗普訪華

瑜說還休
2026-05-13 11:32:46
每體:拉什福德在巴塞羅那富人區租了一棟超700平米的住宅

每體:拉什福德在巴塞羅那富人區租了一棟超700平米的住宅

懂球帝
2026-05-13 17:20:07
女版楊瀚森?李月汝WNBA新季首次全場被棄用 飛翼吞首敗

女版楊瀚森?李月汝WNBA新季首次全場被棄用 飛翼吞首敗

醉臥浮生
2026-05-13 10:06:14
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
西方專家感嘆:“中國是全世界,唯一強得悄無聲息的超級大國”!

西方專家感嘆:“中國是全世界,唯一強得悄無聲息的超級大國”!

何氽簡史
2026-04-15 19:24:08
唐湘龍痛批國民黨“跪美賣臺”;郭正亮:大陸已確定要駐軍臺灣!

唐湘龍痛批國民黨“跪美賣臺”;郭正亮:大陸已確定要駐軍臺灣!

放開他讓wo來
2026-05-13 11:03:55
孫銘陽正式宣布退出國家隊:我隨時都在,有召必回!

孫銘陽正式宣布退出國家隊:我隨時都在,有召必回!

現代快報
2026-05-13 15:38:07
兩次訪華,特朗普隨行美企高管有何不同?科技大佬占比近半,能源領域徹底淡出

兩次訪華,特朗普隨行美企高管有何不同?科技大佬占比近半,能源領域徹底淡出

時代周報
2026-05-13 15:16:23
9年無緣東決!有人要被清算了!

9年無緣東決!有人要被清算了!

柚子說球
2026-05-13 07:04:09
中國隊8強對手出爐!出線后至少5人獲健將稱號 無需高考+保送大學

中國隊8強對手出爐!出線后至少5人獲健將稱號 無需高考+保送大學

侃球熊弟
2026-05-13 03:10:32
比中國巨石還猛?這家6元低價+電子布紡織機龍頭   主力爆買3億元

比中國巨石還猛?這家6元低價+電子布紡織機龍頭 主力爆買3億元

元芳說投資
2026-05-13 06:00:22
湖人真該裁掉他!東契奇兩次對其不滿,八村塁因得罪他慘遭棄用?

湖人真該裁掉他!東契奇兩次對其不滿,八村塁因得罪他慘遭棄用?

你的籃球頻道
2026-05-13 15:02:44
4位伴娘婚禮前夜集體跑路,新娘指責其眼紅,伴娘稱待客太寒磣

4位伴娘婚禮前夜集體跑路,新娘指責其眼紅,伴娘稱待客太寒磣

觀世記
2026-05-12 16:38:25
好牛逼的狀元!29歲帶隊進西決,30歲帶隊進東決,31歲帶隊進東決

好牛逼的狀元!29歲帶隊進西決,30歲帶隊進東決,31歲帶隊進東決

球毛鬼胎
2026-05-12 11:24:51
白人女性與黑人女性的體味差異,網友真實分享引發熱議

白人女性與黑人女性的體味差異,網友真實分享引發熱議

特約前排觀眾
2025-12-22 00:20:06
排面拉滿!山姆兩家新店落地山東,本土商業能拿到啥好處

排面拉滿!山姆兩家新店落地山東,本土商業能拿到啥好處

閃電新聞
2026-05-12 18:05:23
什么事讓你知道好言難勸該死的鬼?全族都沒攔住,父子倆終身殘疾

什么事讓你知道好言難勸該死的鬼?全族都沒攔住,父子倆終身殘疾

夜深愛雜談
2026-05-01 10:49:01
2026-05-13 17:51:00
圖解金融 incentive-icons
圖解金融
圖解金融,你的金融視界
5493文章數 26716關注度
往期回顧 全部

科技要聞

騰訊一季度營收1964.6億元 同比增9%

頭條要聞

4月汽車銷量發布 前十名僅剩一款燃油車

頭條要聞

4月汽車銷量發布 前十名僅剩一款燃油車

體育要聞

14年半,74萬,何冰嬌沒選那條更安穩的路

娛樂要聞

白鹿掉20萬粉,網友為李晨鳴不平

財經要聞

盤中最高4041.99點!創業板創歷史新高

汽車要聞

C級純電轎跑 吉利銀河"TT"申報圖來了

態度原創

手機
家居
教育
旅游
軍事航空

手機要聞

OPPO新一代ColorOS 16正式版陸續開推,五月升級一覽發布

家居要聞

內在自敘,無域有方

教育要聞

避開考編內卷!公費師范生升學就業雙兜底,高中生的“優選”賽道

旅游要聞

畢節亮相世界品牌莫干山大會,發出避暑邀約

軍事要聞

沙特被指3月曾對伊朗發動多次“報復性”空襲

無障礙瀏覽 進入關懷版