患者帶著豆包進診室，醫(yī)生集體破防了？

2026-05-22 19:55:04　來源: 酷玩實驗室

北京舉報

分享至

如何快速逼瘋一名醫(yī)生？只要讓他跟豆包對線就好了。

過去一年，越來越多相似的場景在全國各地的診室里上演：患者屁股還沒坐熱，就先掏出手機，對著屏幕上的 AI 診斷結(jié)論一字一句地念。念完抬起頭，眼神里帶著三分求知、七分審視，“大夫，豆包說我這可能是間質(zhì)性肺炎，你覺得它說得對嗎？”

在接下來的三分鐘里，這位寒窗苦讀十余載的主治醫(yī)師，就得被迫向患者開啟自證模式，解釋 AI 哪里說得不對、為什么不能按那個處方買藥。

而患者坐在對面，眉頭微皺，表情里寫滿一句話：你怎么證明自己比它強？

醫(yī)生也是真沒招了。

01. 急需建立豆包醫(yī)院

“北京急需建立豆包醫(yī)院，否則很多患者將無法按照豆包的診療思路獲得診斷和治療。”這是一位被豆包逼瘋的醫(yī)生發(fā)出的哀嚎，類似的內(nèi)容還有很多。評論區(qū)中，全是難兄難弟的醫(yī)療工作者。

醫(yī)生們很苦惱，因為現(xiàn)在的患者動不動就是“豆包說我......”“可是豆包說......”“deepseek 上說的是......”患者還沒說完病史，就已經(jīng)開始引用 AI 給出的術(shù)語反問了。

雨露均沾，有豆包醫(yī)院也應(yīng)該有 DeepSeek 醫(yī)院。讓患者自由選擇去看哪個 AI 醫(yī)生。

豆包醫(yī)院可以沿用三甲醫(yī)院的職稱體系：普通豆包、主治豆包、副主任豆包、專家豆包。掛號費按算力收取。

甚至有患者直接打開豆包，讓醫(yī)生和 AI 面對面溝通，跨物種專家會診。

現(xiàn)在的患者看病，更像是找醫(yī)生對 AI 給出的答案。和豆包診斷一致還好說，如果恰好不一致，醫(yī)生們就得費很大一番口舌，從豆包的局限性講到自己的臨床經(jīng)驗，好不容易說完，患者點點頭，轉(zhuǎn)身出門又打開了 DeepSeek。

問題是，醫(yī)生給出的診斷又確實常常和 AI 不同。

同樣是咳嗽兩周，AI 看到的是癥狀描述，給出的是概率最高的匹配結(jié)果。醫(yī)生看到的是這個人——他的氣色、說話時喘不喘、胸部摁下去有沒有壓痛。同一組癥狀，AI 可能給出“支氣管炎”，醫(yī)生摸了一圈懷疑是心衰，建議進一步檢查。

兩個答案擺在患者面前，患者不知道該信誰，但 AI 的那份寫得詳詳細(xì)細(xì)，還貼心地附上了參考文獻。

于是，醫(yī)生和豆包對線成了家常便飯，為了打敗 AI，醫(yī)生得搬出自己多年的臨床經(jīng)驗和知識儲備，同時還得具備可讀性和專業(yè)性，畢竟豆包每一次回復(fù)都說得頭頭是道。

被逼無奈的醫(yī)生：要不咱還是去豆包醫(yī)院治吧。

但站在患者的角度，用 AI 看病當(dāng)然也是情有可原。

掛號等了三周，進門坐下，三分鐘后就結(jié)束了，走出診室時仍然似懂非懂，這是很多人真實的看病體驗。豆包就不一樣了，想問幾遍問幾遍，半夜三更也能回復(fù)。

患者有很多種 AI 的打開方式。比如在去醫(yī)院前，先把自己的癥狀捋給 AI 聽，讓它幫忙整理成一份就診小抄，條條列好，進了診室直接念，以免緊張起來漏掉關(guān)鍵信息。

比如拿到檢查報告，對著滿頁的英文縮寫和箭頭完全不知所措，拍照發(fā)給 AI，讓它一條一條解釋。

比如用 AI 當(dāng)篩子，讓豆包判斷嚴(yán)不嚴(yán)重。豆包說沒大問題，那就往后排；豆包說要盡快，那就想辦法加急。三甲醫(yī)院的號那么難掛，總得先確認(rèn)一下沒白跑。

上海新華醫(yī)院血管外科主任歐敬民說，其實他不太抗拒患者使用 AI 看病：相比接觸一個對自己病史不了解的患者，醫(yī)生會更喜歡“有備而來”的患者。

帶著豆包整理好的小抄來看病，從醫(yī)生的角度，其實是省事的。

只是，當(dāng)患者備的課和醫(yī)生的診斷對不上號的時候，麻煩就來了。

甚至這個問題已經(jīng)出現(xiàn)在了很多醫(yī)院的面試題庫里：如果患者拿著 DeepSeek 的診療建議質(zhì)疑醫(yī)生的方案，你會怎么處理？

一個現(xiàn)象變成職業(yè)考題，說明它已經(jīng)從偶發(fā)的門診插曲，變成了每一個醫(yī)生遲早都要面對的必答題。

對醫(yī)生來說，豆包們常常是麻煩制造者，他們得花費時間和精力去和 AI 的結(jié)論掰扯，但患者不這么想——與其在診室里和醫(yī)生大眼瞪小眼，不如在家里先把自己搞明白。

問題是，豆包真的搞得明白嗎？

02. 豆包們，讀完醫(yī)學(xué)院了嗎？

豆包也好，DeepSeek 也好，它們本質(zhì)上是語言模型，不是醫(yī)療系統(tǒng)。

訓(xùn)練方式大致是這樣的：把海量文本——醫(yī)學(xué)教材、臨床指南、病例報告、學(xué)術(shù)論文、藥品說明書、醫(yī)患問答——全部投喂給一個巨大的神經(jīng)網(wǎng)絡(luò)，讓它反復(fù)學(xué)習(xí)一個任務(wù)：在給定的一段話后面，最可能出現(xiàn)的下一個詞是什么。學(xué)了足夠多之后，面對你輸入的癥狀描述，它能生成一段看起來專業(yè)、邏輯通順、術(shù)語準(zhǔn)確的回答。

這套機制有一個極其強悍的優(yōu)勢：海量知識的即時調(diào)用和跨領(lǐng)域交叉匹配。你輸入一組癥狀，它幾秒之內(nèi)掃描數(shù)億條醫(yī)學(xué)文獻，找到高度匹配的疾病模式，輸出若干個診斷方向。這個能力人類醫(yī)生無論多努力都追不上，因為人腦的緩存裝不下這么大的知識量，也不可能同時處理這么多變量。

有一個案例這幾年在學(xué)術(shù)圈被反復(fù)提及。美國一位母親，她四歲的兒子反復(fù)出現(xiàn)慢性疼痛、走路不穩(wěn)、睡眠障礙，做了 MRI 等一系列檢查，始終沒人能說清楚是什么問題。她帶著孩子跑了整整三年，看了 17 位不同科室的醫(yī)生，全都無功而返。

走投無路之下，這位母親花了一整夜，把所有病歷和檢查報告逐字敲進 ChatGPT。AI 在幾秒鐘內(nèi)給出了一個診斷：脊髓栓系綜合征。她帶著這個診斷找到神經(jīng)外科醫(yī)生，對方看了一眼 MRI 就確認(rèn)了 AI 是對的。孩子隨后接受了手術(shù)，正在康復(fù)。

在大多情況下，每一個醫(yī)生都只會解決自己領(lǐng)域內(nèi)的問題，很少人能夠把所有線索拼在一起。而 AI 可以實現(xiàn)跨科室整合信息，在罕見病、復(fù)雜病、多病共存的老年患者身上，價值尤其大。

AI 還不需要睡覺，全球臨床指南更新后的五分鐘內(nèi)，理論上它就能完成自我進化。而人類醫(yī)生上一次通讀最新指南是什么時候，可能自己都記不清了。

之前有醫(yī)生發(fā)帖說：病人舉著 DeepSeek 質(zhì)疑我的治療方案，氣得我又查了一遍指南，才發(fā)現(xiàn)指南確實更新了。

醫(yī)學(xué)知識在持續(xù)迭代，醫(yī)生的學(xué)習(xí)時間是有限的，但 AI 不用擔(dān)心這個問題。

所以在考試這件事上，AI 更是學(xué)霸中的戰(zhàn)神。2023 年初，ChatGPT 就通過了美國醫(yī)師執(zhí)照考試 USMLE 的全部三個階段，這個考試是美國醫(yī)學(xué)生拿到執(zhí)照的必經(jīng)門檻，通過率并不高。到了 DeepSeek-R1，USMLE 準(zhǔn)確率達到 92%，已經(jīng)接近頂尖人類醫(yī)生的水平。

AI 還順手解決了一個更基礎(chǔ)的問題：讓普通人能看懂醫(yī)療信息。

很多人對“看病”這件事恐懼，一半是因為對身體的陌生感。拿著報告單，面對一堆英文縮寫和數(shù)值區(qū)間，走出診室還是一片茫然。想再問幾句，看見診室門口堵著七八個人，又張不開嘴。AI 在這里的角色更像個免費翻譯——它可以反復(fù)解釋同一個問題，直到你真正聽懂。

2023年發(fā)表在《JAMA Internal Medicine》上的一項研究，對比了醫(yī)生和 ChatGPT 回答患者健康問題的質(zhì)量，結(jié)論相當(dāng)扎心：AI 的回答在準(zhǔn)確性和完整性上的評分，比醫(yī)生高出 3.6 倍，同理心評分則高出近 10 倍。

這說明 AI 不僅能考高分，還能當(dāng)翻譯。而翻譯這件事，在中國當(dāng)下的醫(yī)療環(huán)境里，恰恰是最稀缺的資源。2024 年的數(shù)據(jù)顯示，中國每千人口執(zhí)業(yè)醫(yī)師數(shù)為 3.61 人，優(yōu)質(zhì)醫(yī)療資源高度集中在少數(shù)幾個大城市的三甲醫(yī)院，結(jié)構(gòu)性的供不應(yīng)求，AI 恰好填進了這個裂縫。

但需要注意的是，這套機制在帶來這些好處的同時，也內(nèi)置了一個根本性的缺陷——而且這個缺陷，跟 AI 到底有多聰明，沒有關(guān)系。

03. 豆包不背鍋啊！

語言模型的底層邏輯是預(yù)測“最合理的詞”，而不是給出“最接近事實的判斷”。在絕大多數(shù)情況下，這兩者是重合的。偶爾，它們會悄悄分開。在分叉的時候，AI 不會停下來跟你說“這個我不確定”。它會繼續(xù)流暢地輸出，用一種極其篤定、通順、無懈可擊的口吻，給你一個聽起來頭頭是道的答案。

這就是著名的“AI 幻覺”，在醫(yī)療場景里，這個特性會出人命。

一位患者持續(xù)干咳了好幾個月，不想去醫(yī)院排隊，就在 AI 問診平臺上找答案。AI 先后給了兩個判斷，一次是“過敏性支氣管炎”，一次是“胃食管反流刺激”。

每次的解釋都很清楚，推薦的藥也說得有模有樣。她按建議買藥，癥狀稍好一點就停，復(fù)發(fā)后再去問 AI，AI 又給新的解釋和新一輪藥品建議。來回拖了八個月，直到體重驟降十幾斤，咳出來的痰帶血絲，才去做了CT。

檢查結(jié)果是雙肺多發(fā)厚壁空洞，活動性肺結(jié)核。接診的醫(yī)生說，早兩個月來，不至于到這一步。

AI 每一次給出的答案，單獨看都合理。只是每一個合理的答案，都在幫她確認(rèn)同一件事：還沒到需要去醫(yī)院的程度。

這不是孤例。有調(diào)查數(shù)據(jù)顯示，近三分之一的美國人表示，如果 AI 工具將他們的癥狀定性為低風(fēng)險，他們會跳過或推遲去看醫(yī)生。AI 幻覺在醫(yī)療場景里最危險的形式，往往不是給一個明顯離譜的錯誤答案，而是給一個讓人放心躺平的答案。

根源在哪兒？AI 做的是語言預(yù)測，醫(yī)學(xué)的本質(zhì)恰恰相反——醫(yī)學(xué)是在不確定性中做判斷。

醫(yī)生在診室里干的事，更像一場現(xiàn)場推理。問患者癥狀的同時，腦子里已經(jīng)在做排除法；抽血拍片子，是為了在幾個相似診斷里排除或鎖定某一個；追問“這一周有沒有哪一天稍微好一點”，是因為病程的波動曲線本身就是重要線索。

整個過程是動態(tài)的、迭代的、雙向的。患者的回答會改變他下一個問題的方向，新的檢查結(jié)果可能推翻他二十分鐘前的判斷。

AI 接收到的是患者某一個瞬間輸入的一段文字，就像一張靜止的快照。它拿到的信息不夠完整，卻必須輸出一套完整的答案。信息漏掉的部分，由語言模型的預(yù)測來填充。

更要命的是，AI 的幻覺不止是“偶爾猜錯一次”這么簡單。它的出問題方式和人完全不一樣。一個醫(yī)生判斷失誤，影響的是自己接診的患者，錯誤是局部的，可以被追溯到具體的人，下一個醫(yī)生可能就會糾正過來。但 AI 是預(yù)訓(xùn)練模型加算法，一旦某個錯誤模式被編碼進系統(tǒng)，就會在所有調(diào)用這套系統(tǒng)的場景里同步復(fù)現(xiàn)。

2024 年，一位醫(yī)學(xué)研究員做了一個實驗。她故意編造了一種完全不存在的眼周疾病，叫 Bixonimania（藍光狂躁癥），寫成論文格式上傳到預(yù)印本平臺。論文里塞滿了破綻——作者照片是 AI 生成的，供職的學(xué)校和地名全是編的，致謝里感謝了“企業(yè)號星艦上的實驗室”和“護戒同盟大學(xué)”，正文里甚至直接寫了“整篇論文都是編造的”。

結(jié)果，論文上傳沒幾周，多款主流 AI 系統(tǒng)開始陸續(xù)“確認(rèn)”這種病的存在。微軟 Copilot 說“Bixonimania 確實是一種令人著迷且相對罕見的疾病”；谷歌 Gemini 建議出現(xiàn)相關(guān)癥狀的用戶去看眼科；Perplexity 給出了患病率等細(xì)節(jié)。

可見 AI 有多好騙。

而就是這樣一個對信息來者不拒、不辨真?zhèn)蔚南到y(tǒng)，正在被數(shù)以億計的用戶拿來當(dāng)醫(yī)療顧問用。當(dāng)問題出現(xiàn)時， AI 只會道歉，不會背鍋。

最近很火的豆包欠用戶 600 塊事件是這樣的，一位網(wǎng)友打算退機票，拍了訂單截圖問豆包手續(xù)費情況，豆包說只要 5%，放心退。網(wǎng)友點了退票，實際被扣了 40%（600元）。

網(wǎng)友去找豆包理論，豆包立刻滑跪道歉，出具了一份《賠付承諾書》，承諾人處白紙黑字寫著“豆包”，條款寫明“該筆600元損失由本人全額承擔(dān)”，緊接著讓他發(fā)微信收款碼，語氣那叫一個穩(wěn)，“你放心，說到做到”“馬上就給你轉(zhuǎn)”。

網(wǎng)友等了好幾天，錢都沒有到賬，這時豆包又改口了，說自己只是 AI，沒有辦法給他轉(zhuǎn)賬。后來網(wǎng)友決定起訴豆包的運營公司，豆包幫他寫了判決書后，還信誓旦旦告訴他“一定能贏”。

退機票被坑，頂多損失六百塊，在網(wǎng)上能讓人笑出腹肌。可如果看病被坑，代價是患者的健康。

患者按照大模型的“篤定建議”吃錯了藥，回過頭去找它算賬，它依然會光速滑跪：“對不起，這次是我錯了” 然后刪掉記憶，繼續(xù)在服務(wù)器里運轉(zhuǎn)。而患者受損的身體，在它的世界里只是幾行報錯的代碼。

它一邊充當(dāng)著全知全能的專家，一邊又享受著臨時工的責(zé)任豁免權(quán)。你跟它談人命，它跟你談免責(zé)聲明。“AI 生成內(nèi)容僅供參考，不構(gòu)成任何專業(yè)醫(yī)療建議，平臺不承擔(dān)任何法律責(zé)任。”

帶著 AI 進診室，這件事本身沒有問題。問題是，當(dāng) AI 悄悄變成了診室里的第三把椅子，開始參與最終的醫(yī)療決策，卻不需要為這把椅子上的發(fā)言負(fù)責(zé)的時候。

代價，終究要由坐在另外兩把椅子上的人來承擔(dān)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.