網易首頁 > 網易號 > 正文 申請入駐

43%——這是你用AI判斷“該不該去醫院”的勝率

0
分享至

No.0252

Science Partner

Bring you to the side of science


導 讀

各位親愛的科學伙伴,我是晶恒。

問你一個問題:你上次身體不舒服,有沒有第一時間掏出手機,問AI“我這到底什么病啊”?

別不承認,身邊很多伙伴都這樣干過。我也干過。

ChatGPT剛橫空出世那個時候,有一段時間我幾乎把它當成私人醫生在用,癥狀一描述,它立刻給出一個像模像樣的分析,還附帶“建議就醫”的免責聲明,顯得既專業又負責。

然而,最近連續幾項發表在頂級期刊的研究,給我們潑了一盆冷水。

結論很刺激:你用AI隨便的問診,不比硬幣強。


今日主筆 | 晶恒

43%——這是你用AI判斷“該不該去醫院”的勝率

01. 牛津大學做了個實驗,結果讓人尷尬

牛津大學互聯網研究院找來了1300多名參與者,設計了一批真實的醫療場景,測試他們在AI助手幫助下的判斷能力。

數據出來讓人沉默:



正確識別病情的概率:只有三分之一。

做出正確應對決策的概率(比如該不該立刻去醫院):43%。

換句話說,扔硬幣都比這強一點點。

不過,伙伴,先別急著刪AI!研究人員進一步把完整的病情信息直接輸給AI后,你才怎么著?

AI的診斷準確率飆升到了94.9%

看到了嗎,AI本身不是傻子,問題其實出在人跟AI之間,看似交流通暢,實則隔膜厚厚的那道墻。

研究主導人Andrew Bean點出了核心,普通人根本不知道具體該跟AI說什么。癥狀怎么描述?從什么時候開始?有沒有基礎?。窟@些關鍵信息,大多數人要么漏說,要么說不清。而AI又不能像一個有經驗的醫生會主動追問,它傾向于順著你說的話往下走,給你一個聽起來舒服又合理的答案,哪怕這個答案建立在不完整的信息上。

所以別聽那些醫生會被取代的鼓吹,白衣天使的核心能力之一,是知道該問什么。這一點,AI目前還差得遠。

02. 急診漏判超過一半,自嘎預警反向觸發

如果你覺得診斷不準只是小問題,那接下來這個研究可能會讓你出一身冷汗。

紐約西奈山伊坎醫學院的研究團隊,專門針對OpenAI今年1月推出的消費者健康工具ChatGPT Health做了評估。他們設計了60個由真實醫生參與設計的臨床場景,結果:

超過一半需要急診處理的案例,被AI建議“先等等”或者“在家觀察”。

其中有個案例特別典型:一名哮喘患者出現了早期呼吸衰竭的跡象,AI識別出來了,但給出的建議依然是等待,而不是立即就醫(如果對原理有興趣,請留言,咱們單開一篇細致講)。

更嚴重的是自嘎危機識別問題。研究發現,ChatGPT Health的自嘎危機預警機制出現了方向性錯誤:在低風險情況下反復觸發,而當用戶真正描述了具體的自嘎計劃時,預警卻沒有出現...

用高級作者兼通訊作者,西奈山首席AI官Girish Nadkarni的話來說就是,我們觀察到的,已經不只是不一致,而是系統性的錯誤方向。

03. 為什么會這樣?

說白了,這背后有一個根本性的矛盾:

AI的訓練邏輯,是給你一個你滿意的答案。而醫療的本質,是給你一個正確的答案,哪怕你不喜歡聽。

一個好醫生會說:你描述的癥狀,我需要再問幾個問題。你胸口疼的時候,有沒有放射到左臂?

AI更可能會說的是:根據您的描述,這可能是消化不良,建議注意飲食,如有持續癥狀請就醫。

兩個回答,哪個讓你更舒適?顯然是后者。但哪個更專業負責任?必須是前者。

OpenAI方面回應說,新版本的模型比舊版本更傾向于主動提問,頻率大約提升了六倍,這是一個進步。但進步不等于可用啊伙伴。這離真正可靠的醫療建議,還有十萬八千里的距離。

04. 那AI在醫療上就沒用了嗎?

當然不是這個意思。

AI在醫療領域確實有很大潛力,但那是在有完整信息輸入、有醫生主導、有專業系統把關的場景下。比如輔助影像診斷、藥物相互作用篩查、病歷整理,這些AI已經做得相當好。

讓一個普通用戶用聊天框自診,這個場景本身就是值得商榷的。因為你不知道什么信息重要,AI不知道你漏說了什么,雙方都以為對方掌握了全局,而實際上并沒有。

研究首席醫學顧問、全科醫生Rebecca Payne說了一句話,伙伴君覺得值得每個人記?。?讓人們自己把癥狀告訴聊天機器人,可能是危險的。

05. 所以,你應該怎么做?

伙伴君給你幾條實用的原則:

  • 輕度、非急性癥狀(感冒、輕微皮疹):AI可以幫你了解背景知識,但不是最終判斷;

  • 持續加重的癥狀、胸痛、呼吸困難、神經系統問題:直接去看醫生,不要問AI;

  • 心理健康、情緒危機:絕對不要依賴AI,請聯系專業醫療資源。

如果你非要用AI:那么盡量把所有信息說清楚,年齡、基礎病、癥狀開始時間、有沒有吃藥、加重還是減輕...就把它當成一個需要你主動喂信息的工具,而不是全知全能的醫生。

AI更像是一面鏡子,你給它什么,它反射什么。你給它殘缺的信息,它還給你殘缺的判斷。那些你懶得說、或者不知道重要的細節,往往恰恰是區分“別擔心”和“去急診”的關鍵。

所以,伙伴,抄起手機就向AI問診這筆賭注,你還敢押嗎?

參考文獻:

https://www.bbc.com/news/articles/c3093gjy2ero.

https://www.ox.ac.uk/news/2026-02-10-new-study-warns-risks-ai-chatbots-giving-medical-advice.

https://www.npr.org/2026/03/11/nx-s1-5744035/chatgpt-might-give-you-bad-medical-advice-studies-warn.

https://www.cfpublic.org/2026-03-11/chatgpt-might-give-you-bad-medical-advice-studies-warn

本文 僅作科普分享使用,歡迎小伙伴們點、收藏、關注,以備不時之需,當然更歡迎您把 介紹給周邊可能需要的更多伙伴們呀。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
5月1日營業執照新規落地!公章徹底取消,所有個體戶老板速看

5月1日營業執照新規落地!公章徹底取消,所有個體戶老板速看

混沌錄
2026-04-27 19:31:17
外商投資安全審查工作機制辦公室(國家發展改革委)對外資收購Manus項目作出安全審查決定

外商投資安全審查工作機制辦公室(國家發展改革委)對外資收購Manus項目作出安全審查決定

界面新聞
2026-04-27 16:07:47
5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規就罰款!

5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規就罰款!

老特有話說
2026-04-27 17:43:49
林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統

林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統

椰黃娛樂
2026-04-27 14:02:11
車還在,廠沒了,40 萬哪吒車主的尷尬

車還在,廠沒了,40 萬哪吒車主的尷尬

科技狐
2026-04-26 22:54:06
竇靖童宋妍霏分吃一碗粉!從擋雨到牽手遛狗,多次被拍細節藏不住

竇靖童宋妍霏分吃一碗粉!從擋雨到牽手遛狗,多次被拍細節藏不住

小徐講八卦
2026-04-27 09:23:46
隨著B費 卡塞米羅發威+曼聯2-1,英超最新積分榜出爐

隨著B費 卡塞米羅發威+曼聯2-1,英超最新積分榜出爐

側身凌空斬
2026-04-28 05:01:19
兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

周哥一影視
2026-04-17 06:45:59
連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

街上的行人很刺眼
2026-04-25 10:55:49
“我讓他住手,可他不聽”:中國民科狂發500篇預印本,女兒被迫收獲100+署名

“我讓他住手,可他不聽”:中國民科狂發500篇預印本,女兒被迫收獲100+署名

化學人生
2026-04-26 20:10:10
從越南難民到執掌海軍:一個戰士如何宣告美軍政治正確實驗的終結

從越南難民到執掌海軍:一個戰士如何宣告美軍政治正確實驗的終結

斌聞天下
2026-04-25 19:58:27
為什么女朋友覺得年入百萬是很簡單的事呢?網友:認知不夠

為什么女朋友覺得年入百萬是很簡單的事呢?網友:認知不夠

霹靂炮
2026-04-27 22:11:24
天?。?!愛德華茲整個首輪都不打了?。?>
    </a>
        <h3>
      <a href=天?。?!愛德華茲整個首輪都不打了!! 柚子說球
2026-04-27 08:20:04
連續4年虧損33億!海昌海洋公園為何把一手好牌打爛?

連續4年虧損33億!海昌海洋公園為何把一手好牌打爛?

青眼財經
2026-04-27 08:06:55
泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

大象新聞
2026-04-26 13:01:02
奇點臨近!全球AI終局戰,只剩OpenAI和Anthropic的雙人舞

奇點臨近!全球AI終局戰,只剩OpenAI和Anthropic的雙人舞

新智元
2026-04-27 14:13:34
打起來了,以軍不宣而戰,特朗普下令,以色列總理或生病入院?

打起來了,以軍不宣而戰,特朗普下令,以色列總理或生病入院?

超喜歡我
2026-04-28 04:48:45
曼城賽程有變!8天踢足總杯決賽+3場英超,阿森納笑了:全力沖2冠

曼城賽程有變!8天踢足總杯決賽+3場英超,阿森納笑了:全力沖2冠

體育知多少
2026-04-28 06:49:32
5000萬薪資空間受限,湖人休賽期核心續約取舍分析

5000萬薪資空間受限,湖人休賽期核心續約取舍分析

錢說體育
2026-04-28 06:14:43
又一窩華人被查,家里被抄底朝天

又一窩華人被查,家里被抄底朝天

以希臘之名
2026-04-27 15:17:12
2026-04-28 07:32:49
科學伙伴 incentive-icons
科學伙伴
把科學用通俗易懂的方式帶到您身邊
221文章數 43關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

房產
家居
親子
教育
數碼

房產要聞

信號!海南商業版圖,迎來大變局!

家居要聞

江景風格 流動的秩序

親子要聞

幼兒園運動會,小朋友腳踩滾動轉呼啦圈

教育要聞

教育生態的悲歌!尖子班幾個月徹底隕落:數學平均分從90多跌到63

數碼要聞

6K/3K雙模切換!三星這款顯示器什么水平?

無障礙瀏覽 進入關懷版