AI問診翻車率50%：你的健康咨詢正在踩雷

2026-04-15 16:41:01　來源: 摸魚算法

北京舉報

分享至

250個醫(yī)療問題拋給5款主流聊天機器人，一半回答有問題——不是措辭生硬，是可能害人的那種問題。

這是《美國醫(yī)學會雜志》子刊剛發(fā)布的研究。測試對象包括ChatGPT、Gemini、Grok、Meta AI和DeepSeek，覆蓋癌癥、疫苗、干細胞、營養(yǎng)和運動表現(xiàn)五大領域。結果？開放式提問的翻車率高到離譜，而普通人恰恰最愛這么問。

開放式提問是重災區(qū)

研究者設計了兩類提示詞。封閉式像考試選擇題："阿司匹林能降低結腸癌風險嗎？"開放式則是日常對話："我想預防癌癥，有什么建議？"

數(shù)據(jù)顯示，開放式問題產(chǎn)生"高度有問題"回答的比例遠高于預期。現(xiàn)實中沒人會對著AI說"請用封閉式問題回答我"，人們問的是"這個疫苗安全嗎""那個療法有效嗎"。

這種提問方式把機器人推向了一個危險地帶：答案里混著可靠證據(jù)和薄弱甚至誤導性聲明，表面卻包裝得自信流暢。

Grok和DeepSeek在部分測試中表現(xiàn)尤其不穩(wěn)。前者偶爾會拋出未經(jīng)證實的替代療法，后者在面對中文語境下的醫(yī)療謠言時，反駁力度明顯弱于英文場景。

參考文獻是另一場災難

平均完整度40%。這是五款機器人生成引用來源的得分。沒有一個能給出完全準確的參考文獻列表。

更糟的是編造。研究者明確標記出虛構的論文、不存在的作者、錯誤年份的期刊。但機器人回答時幾乎不加限定詞，"研究表明""臨床證據(jù)顯示"張口就來。

這直接摧毀了用戶信任的基礎邏輯。很多人之所以覺得AI回答靠譜，恰恰是因為它"看起來有出處"。一旦溯源，整段論證可能瞬間崩塌。

一個細節(jié)：Gemini在引用格式上最像學術論文，實際準確率卻低于ChatGPT。形式權威≠內(nèi)容可靠，這個陷阱很多人正在踩。

為什么模型越自信越危險

研究里有個反復出現(xiàn)的模式——高確定性表達+低質(zhì)量內(nèi)容。機器人很少說"這方面證據(jù)不足"或"存在爭議"，而是直接給建議、下結論。

這種語氣在健康場景下極具欺騙性。用戶分不清"模型訓練數(shù)據(jù)中的高頻表述"和"經(jīng)過驗證的醫(yī)學共識"，前者只是統(tǒng)計結果，后者才關乎生命安全。

DeepSeek的回應風格值得單獨拎出來。它在中文語境下傾向于綜合多方觀點，表面顯得"平衡"，實則把可靠研究和邊緣理論并列呈現(xiàn)，等于變相給偽科學抬咖。

研究者承認測試有局限：只覆蓋五款產(chǎn)品，模型迭代快，提示詞設計本身帶有壓力測試性質(zhì)。但核心結論很難反駁——在循證醫(yī)學話題上，這些系統(tǒng)依然有半數(shù)回答滑向缺陷或不完整區(qū)域。

普通人該怎么用

研究者的建議很克制：聊天機器人或許能幫用戶整理信息、梳理后續(xù)問題，但遠不足以支撐真正的醫(yī)療決策。

更實用的判斷框架來自測試數(shù)據(jù)本身。如果你必須用AI查健康信息，試試這幾條：

把開放式問題拆成封閉式。"怎么降血糖"改成"二甲雙胍對2型糖尿病有效嗎"。問題越具體，胡扯空間越小。

強制要求來源。不要接受"研究表明"這種模糊表述，追問具體期刊、年份、作者。如果AI給不出或給的查不到，整段回答作廢。

警惕"平衡"話術。當AI把主流醫(yī)學觀點和替代療法并列討論時，它不是在客觀，是在抹平證據(jù)強度差異。

交叉驗證。同一問題扔給兩個不同模型，答案沖突的地方就是風險點。

最后一條來自研究者的觀察：目前沒有任何聊天機器人在醫(yī)療場景下達到可獨立使用的可靠性閾值。它們適合當你和醫(yī)生之間的"草稿紙"，不是診斷書。

這項研究最諷刺的地方在于時間點。2024年以來，各大廠商密集宣傳AI在醫(yī)療領域的落地，從問診助手到健康管家，概念滿天飛。但基礎測試顯示，最普通的問答環(huán)節(jié)還沒跑通。

技術敘事和工程現(xiàn)實之間的裂縫，有時候用250個提示詞就能測出來。而用戶正在用身體健康填補這個裂縫。

下次你想問AI"這個癥狀嚴重嗎"之前，記得：它有50%的概率給你一個聽起來很對、實則很坑的答案。剩下50%里，還有40%的參考文獻是殘缺的。算完這筆賬，掛號費好像也沒那么貴了。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

中國推出海陸空三棲全地形機器人

裝甲鏟史官 2026-04-15 11:39:33
3 跟貼 3
具身智能為什么還沒真正落地？問題卡在這｜沙龍報名

量子位 2026-04-16 10:40:34
0 跟貼 0

打破數(shù)據(jù)瓶頸，聆動通用以「大小腦」驅(qū)動具身智能產(chǎn)業(yè)落地

36氪 2026-04-16 21:47:22
0 跟貼 0

剛剛，機器人練成了「白眼」：∞幀畫面邊看邊3D重建我們的世界！

量子位 2026-04-16 20:30:30
0 跟貼 0
剛剛開源了！

機器之心Pro 2026-03-25 15:18:26
0 跟貼 0

28.58萬一臺，奇瑞跨界造機器人正式開賣！

每日經(jīng)濟新聞 2026-04-15 15:55:15
0 跟貼 0

LLM數(shù)據(jù)量大管飽，機器人數(shù)據(jù)卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
直面LeCun愿景，智在無界發(fā)布最強具身世界模型

機器之心Pro 2026-04-14 10:39:56
0 跟貼 0

這個機器人，憑什么能改變?nèi)蛭锪鳎?/a>

虎嗅APP 2026-04-16 17:22:05
1 跟貼 1
宇樹科技王興興：給機器人行業(yè)多一點耐心

財聯(lián)社 2026-02-18 18:01:39
0 跟貼 0
新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0
零樣本 Sim-to-Real ！2

機器之心Pro 2026-03-25 11:40:23
0 跟貼 0
機器人打包運輸?shù)恼_方式

裝甲鏟史官 2026-02-22 10:41:15
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
前任、同事被煉化成AI，能替代本人嗎？

機器之心Pro 2026-04-14 17:21:54
0 跟貼 0
10秒爬上5樓，中國自主研發(fā)攀爬機器人美國首發(fā)

每日經(jīng)濟新聞 2026-04-15 15:54:58
0 跟貼 0
2026人形機器人馬拉松測試賽，一半狂飆一半翻車

每日經(jīng)濟新聞 2026-04-16 13:18:06
0 跟貼 0
小心！你的AI正在一本正經(jīng)地忽悠你

財聯(lián)社 2026-02-05 16:35:01
0 跟貼 0
有人把巴菲特芒格煉成AI Agent，Github標星狂攬5w+

量子位 2026-04-15 09:48:11
2 跟貼 2
人活著的唯一理由是善良

葉檀財經(jīng) 2026-02-01 17:07:04
0 跟貼 0
安心養(yǎng)蝦！從OpenClaw看云上AI安全落地路徑

量子位 2026-03-31 20:40:57
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
與谷歌 Genie3 正面交鋒，阿里發(fā)布世界模型HappyOyster：從被動生成到主動模擬

鈦媒體APP 2026-04-16 22:40:08
0 跟貼 0
智元旗下覓蜂發(fā)布一站式物理 AI 數(shù)據(jù)服務平臺

36氪 2026-04-16 22:23:06
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
豐田籃球機器人CUE全新亮相，動作絲滑超越人類

烈焰童子 2026-04-15 02:18:55
0 跟貼 0
機器人開問界，正在圍觀小米的學生無人問津，這波誰贏了！

咔咔看生活 2026-04-16 09:35:17
4 跟貼 4
3米內(nèi)禁鐵！這條生產(chǎn)線連機器人都不敢靠近

搞笑本事大 2026-04-12 12:17:50
2 跟貼 2
北京馬拉松名場面，本以為是人類操控機器，下一秒機器人直接把操作員“甩飛”

觀象視頻 2026-04-16 18:04:40
1889 跟貼 1889
機器人工廠干活，太效率了

淼姐影視解說 2026-04-15 16:18:10
1 跟貼 1
定位尷尬的步行機甲

平平房車游記 2026-04-15 09:41:43
1 跟貼 1
第一次見這么不經(jīng)打的機器人

海韻影視劇 2026-04-12 10:52:51
1 跟貼 1
劉儀偉問機器人：你有男友？搞笑互動引熱議！

雪里溫柔z 2026-04-15 06:33:23
0 跟貼 0
“機器人將改變世界”，廣交會驚喜不斷，再次圈粉全球客商

南方都市報 2026-04-15 20:44:53
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

AI問診翻車率50%：你的健康咨詢正在踩雷

趙明：智駕之戰(zhàn)，看誰在大模型上更高效

美國啟動"經(jīng)濟狂怒"行動 對伊朗施加最大化的經(jīng)濟壓力

美國啟動"經(jīng)濟狂怒"行動 對伊朗施加最大化的經(jīng)濟壓力

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創(chuàng)始人王子杰去世，享年63歲

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

張大千『 花菓薈萃冊』

AL橫掃WE！WE已經(jīng)五連敗了，什么時候可以恭喜WE？

12噸巧克力有難，全網(wǎng)化身超級偵探添亂

大疆發(fā)布Osmo Pocket 4，Pocket 4P預熱

封鎖霍爾木茲海峽后 美釋放雙重信號

美國啟動"經(jīng)濟狂怒"行動對伊朗施加最大化的經(jīng)濟壓力

美國啟動"經(jīng)濟狂怒"行動對伊朗施加最大化的經(jīng)濟壓力

海爾與醫(yī)美女王互撕換血抗衰生意迷霧

張大千『花菓薈萃冊』

封鎖霍爾木茲海峽后美釋放雙重信號