如何快速逼瘋一名醫(yī)生?只要讓他跟豆包對線就好了。
過去一年,越來越多相似的場景在全國各地的診室里上演:患者屁股還沒坐熱,就先掏出手機,對著屏幕上的 AI 診斷結(jié)論一字一句地念。念完抬起頭,眼神里帶著三分求知、七分審視,“大夫,豆包說我這可能是間質(zhì)性肺炎,你覺得它說得對嗎?”
在接下來的三分鐘里,這位寒窗苦讀十余載的主治醫(yī)師,就得被迫向患者開啟自證模式,解釋 AI 哪里說得不對、為什么不能按那個處方買藥。
![]()
而患者坐在對面,眉頭微皺,表情里寫滿一句話:你怎么證明自己比它強?
醫(yī)生也是真沒招了。
01. 急需建立豆包醫(yī)院
“北京急需建立豆包醫(yī)院,否則很多患者將無法按照豆包的診療思路獲得診斷和治療。”這是一位被豆包逼瘋的醫(yī)生發(fā)出的哀嚎,類似的內(nèi)容還有很多。評論區(qū)中,全是難兄難弟的醫(yī)療工作者。
醫(yī)生們很苦惱,因為現(xiàn)在的患者動不動就是“豆包說我......”“可是豆包說......”“deepseek 上說的是......”患者還沒說完病史,就已經(jīng)開始引用 AI 給出的術(shù)語反問了。
![]()
雨露均沾,有豆包醫(yī)院也應(yīng)該有 DeepSeek 醫(yī)院。讓患者自由選擇去看哪個 AI 醫(yī)生。
![]()
豆包醫(yī)院可以沿用三甲醫(yī)院的職稱體系:普通豆包、主治豆包、副主任豆包、專家豆包。掛號費按算力收取。
![]()
甚至有患者直接打開豆包,讓醫(yī)生和 AI 面對面溝通,跨物種專家會診。
![]()
現(xiàn)在的患者看病,更像是找醫(yī)生對 AI 給出的答案。和豆包診斷一致還好說,如果恰好不一致,醫(yī)生們就得費很大一番口舌,從豆包的局限性講到自己的臨床經(jīng)驗,好不容易說完,患者點點頭,轉(zhuǎn)身出門又打開了 DeepSeek。
![]()
![]()
問題是,醫(yī)生給出的診斷又確實常常和 AI 不同。
同樣是咳嗽兩周,AI 看到的是癥狀描述,給出的是概率最高的匹配結(jié)果。醫(yī)生看到的是這個人——他的氣色、說話時喘不喘、胸部摁下去有沒有壓痛。同一組癥狀,AI 可能給出“支氣管炎”,醫(yī)生摸了一圈懷疑是心衰,建議進一步檢查。
兩個答案擺在患者面前,患者不知道該信誰,但 AI 的那份寫得詳詳細(xì)細(xì),還貼心地附上了參考文獻。
![]()
于是,醫(yī)生和豆包對線成了家常便飯,為了打敗 AI,醫(yī)生得搬出自己多年的臨床經(jīng)驗和知識儲備,同時還得具備可讀性和專業(yè)性,畢竟豆包每一次回復(fù)都說得頭頭是道。
被逼無奈的醫(yī)生:要不咱還是去豆包醫(yī)院治吧。
![]()
但站在患者的角度,用 AI 看病當(dāng)然也是情有可原。
掛號等了三周,進門坐下,三分鐘后就結(jié)束了,走出診室時仍然似懂非懂,這是很多人真實的看病體驗。豆包就不一樣了,想問幾遍問幾遍,半夜三更也能回復(fù)。
![]()
患者有很多種 AI 的打開方式。比如在去醫(yī)院前,先把自己的癥狀捋給 AI 聽,讓它幫忙整理成一份就診小抄,條條列好,進了診室直接念,以免緊張起來漏掉關(guān)鍵信息。
![]()
比如拿到檢查報告,對著滿頁的英文縮寫和箭頭完全不知所措,拍照發(fā)給 AI,讓它一條一條解釋。
比如用 AI 當(dāng)篩子,讓豆包判斷嚴(yán)不嚴(yán)重。豆包說沒大問題,那就往后排;豆包說要盡快,那就想辦法加急。三甲醫(yī)院的號那么難掛,總得先確認(rèn)一下沒白跑。
上海新華醫(yī)院血管外科主任歐敬民說,其實他不太抗拒患者使用 AI 看病:相比接觸一個對自己病史不了解的患者,醫(yī)生會更喜歡“有備而來”的患者。
帶著豆包整理好的小抄來看病,從醫(yī)生的角度,其實是省事的。
![]()
只是,當(dāng)患者備的課和醫(yī)生的診斷對不上號的時候,麻煩就來了。
甚至這個問題已經(jīng)出現(xiàn)在了很多醫(yī)院的面試題庫里:如果患者拿著 DeepSeek 的診療建議質(zhì)疑醫(yī)生的方案,你會怎么處理?
一個現(xiàn)象變成職業(yè)考題,說明它已經(jīng)從偶發(fā)的門診插曲,變成了每一個醫(yī)生遲早都要面對的必答題。
![]()
對醫(yī)生來說,豆包們常常是麻煩制造者,他們得花費時間和精力去和 AI 的結(jié)論掰扯,但患者不這么想——與其在診室里和醫(yī)生大眼瞪小眼,不如在家里先把自己搞明白。
問題是,豆包真的搞得明白嗎?
02. 豆包們,讀完醫(yī)學(xué)院了嗎?
豆包也好,DeepSeek 也好,它們本質(zhì)上是語言模型,不是醫(yī)療系統(tǒng)。
訓(xùn)練方式大致是這樣的:把海量文本——醫(yī)學(xué)教材、臨床指南、病例報告、學(xué)術(shù)論文、藥品說明書、醫(yī)患問答——全部投喂給一個巨大的神經(jīng)網(wǎng)絡(luò),讓它反復(fù)學(xué)習(xí)一個任務(wù):在給定的一段話后面,最可能出現(xiàn)的下一個詞是什么。學(xué)了足夠多之后,面對你輸入的癥狀描述,它能生成一段看起來專業(yè)、邏輯通順、術(shù)語準(zhǔn)確的回答。
這套機制有一個極其強悍的優(yōu)勢:海量知識的即時調(diào)用和跨領(lǐng)域交叉匹配。你輸入一組癥狀,它幾秒之內(nèi)掃描數(shù)億條醫(yī)學(xué)文獻,找到高度匹配的疾病模式,輸出若干個診斷方向。這個能力人類醫(yī)生無論多努力都追不上,因為人腦的緩存裝不下這么大的知識量,也不可能同時處理這么多變量。
![]()
有一個案例這幾年在學(xué)術(shù)圈被反復(fù)提及。美國一位母親,她四歲的兒子反復(fù)出現(xiàn)慢性疼痛、走路不穩(wěn)、睡眠障礙,做了 MRI 等一系列檢查,始終沒人能說清楚是什么問題。她帶著孩子跑了整整三年,看了 17 位不同科室的醫(yī)生,全都無功而返。
走投無路之下,這位母親花了一整夜,把所有病歷和檢查報告逐字敲進 ChatGPT。AI 在幾秒鐘內(nèi)給出了一個診斷:脊髓栓系綜合征。她帶著這個診斷找到神經(jīng)外科醫(yī)生,對方看了一眼 MRI 就確認(rèn)了 AI 是對的。孩子隨后接受了手術(shù),正在康復(fù)。
在大多情況下,每一個醫(yī)生都只會解決自己領(lǐng)域內(nèi)的問題,很少人能夠把所有線索拼在一起。而 AI 可以實現(xiàn)跨科室整合信息,在罕見病、復(fù)雜病、多病共存的老年患者身上,價值尤其大。
![]()
AI 還不需要睡覺,全球臨床指南更新后的五分鐘內(nèi),理論上它就能完成自我進化。而人類醫(yī)生上一次通讀最新指南是什么時候,可能自己都記不清了。
之前有醫(yī)生發(fā)帖說:病人舉著 DeepSeek 質(zhì)疑我的治療方案,氣得我又查了一遍指南,才發(fā)現(xiàn)指南確實更新了。
醫(yī)學(xué)知識在持續(xù)迭代,醫(yī)生的學(xué)習(xí)時間是有限的,但 AI 不用擔(dān)心這個問題。
![]()
所以在考試這件事上,AI 更是學(xué)霸中的戰(zhàn)神。2023 年初,ChatGPT 就通過了美國醫(yī)師執(zhí)照考試 USMLE 的全部三個階段,這個考試是美國醫(yī)學(xué)生拿到執(zhí)照的必經(jīng)門檻,通過率并不高。到了 DeepSeek-R1,USMLE 準(zhǔn)確率達到 92%,已經(jīng)接近頂尖人類醫(yī)生的水平。
AI 還順手解決了一個更基礎(chǔ)的問題:讓普通人能看懂醫(yī)療信息。
很多人對“看病”這件事恐懼,一半是因為對身體的陌生感。拿著報告單,面對一堆英文縮寫和數(shù)值區(qū)間,走出診室還是一片茫然。想再問幾句,看見診室門口堵著七八個人,又張不開嘴。AI 在這里的角色更像個免費翻譯——它可以反復(fù)解釋同一個問題,直到你真正聽懂。
![]()
2023年 發(fā)表在《JAMA Internal Medicine》上的一項研究,對比了醫(yī)生和 ChatGPT 回答患者健康問題的質(zhì)量,結(jié)論相當(dāng)扎心:AI 的回答在準(zhǔn)確性和完整性上的評分,比醫(yī)生高出 3.6 倍,同理心評分則高出近 10 倍。
這說明 AI 不僅能考高分,還能當(dāng)翻譯。而翻譯這件事,在中國當(dāng)下的醫(yī)療環(huán)境里,恰恰是最稀缺的資源。2024 年的數(shù)據(jù)顯示,中國每千人口執(zhí)業(yè)醫(yī)師數(shù)為 3.61 人,優(yōu)質(zhì)醫(yī)療資源高度集中在少數(shù)幾個大城市的三甲醫(yī)院,結(jié)構(gòu)性的供不應(yīng)求,AI 恰好填進了這個裂縫。
但需要注意的是,這套機制在帶來這些好處的同時,也內(nèi)置了一個根本性的缺陷——而且這個缺陷,跟 AI 到底有多聰明,沒有關(guān)系。
03. 豆包不背鍋啊!
語言模型的底層邏輯是預(yù)測“最合理的詞”,而不是給出“最接近事實的判斷”。在絕大多數(shù)情況下,這兩者是重合的。偶爾,它們會悄悄分開。在分叉的時候,AI 不會停下來跟你說“這個我不確定”。它會繼續(xù)流暢地輸出,用一種極其篤定、通順、無懈可擊的口吻,給你一個聽起來頭頭是道的答案。
這就是著名的“AI 幻覺”,在醫(yī)療場景里,這個特性會出人命。
![]()
一位患者持續(xù)干咳了好幾個月,不想去醫(yī)院排隊,就在 AI 問診平臺上找答案。AI 先后給了兩個判斷,一次是“過敏性支氣管炎”,一次是“胃食管反流刺激”。
每次的解釋都很清楚,推薦的藥也說得有模有樣。她按建議買藥,癥狀稍好一點就停,復(fù)發(fā)后再去問 AI,AI 又給新的解釋和新一輪藥品建議。來回拖了八個月,直到體重驟降十幾斤,咳出來的痰帶血絲,才去做了CT。
檢查結(jié)果是雙肺多發(fā)厚壁空洞,活動性肺結(jié)核。接診的醫(yī)生說,早兩個月來,不至于到這一步。
AI 每一次給出的答案,單獨看都合理。只是每一個合理的答案,都在幫她確認(rèn)同一件事:還沒到需要去醫(yī)院的程度。
![]()
這不是孤例。有調(diào)查數(shù)據(jù)顯示,近三分之一的美國人表示,如果 AI 工具將他們的癥狀定性為低風(fēng)險,他們會跳過或推遲去看醫(yī)生。AI 幻覺在醫(yī)療場景里最危險的形式,往往不是給一個明顯離譜的錯誤答案,而是給一個讓人放心躺平的答案。
根源在哪兒?AI 做的是語言預(yù)測,醫(yī)學(xué)的本質(zhì)恰恰相反——醫(yī)學(xué)是在不確定性中做判斷。
醫(yī)生在診室里干的事,更像一場現(xiàn)場推理。問患者癥狀的同時,腦子里已經(jīng)在做排除法;抽血拍片子,是為了在幾個相似診斷里排除或鎖定某一個;追問“這一周有沒有哪一天稍微好一點”,是因為病程的波動曲線本身就是重要線索。
整個過程是動態(tài)的、迭代的、雙向的。患者的回答會改變他下一個問題的方向,新的檢查結(jié)果可能推翻他二十分鐘前的判斷。
![]()
AI 接收到的是患者某一個瞬間輸入的一段文字,就像一張靜止的快照。它拿到的信息不夠完整,卻必須輸出一套完整的答案。信息漏掉的部分,由語言模型的預(yù)測來填充。
更要命的是,AI 的幻覺不止是“偶爾猜錯一次”這么簡單。它的出問題方式和人完全不一樣。一個醫(yī)生判斷失誤,影響的是自己接診的患者,錯誤是局部的,可以被追溯到具體的人,下一個醫(yī)生可能就會糾正過來。但 AI 是預(yù)訓(xùn)練模型加算法,一旦某個錯誤模式被編碼進系統(tǒng),就會在所有調(diào)用這套系統(tǒng)的場景里同步復(fù)現(xiàn)。
2024 年,一位醫(yī)學(xué)研究員做了一個實驗。她故意編造了一種完全不存在的眼周疾病,叫 Bixonimania(藍光狂躁癥),寫成論文格式上傳到預(yù)印本平臺。論文里塞滿了破綻——作者照片是 AI 生成的,供職的學(xué)校和地名全是編的,致謝里感謝了“企業(yè)號星艦上的實驗室”和“護戒同盟大學(xué)”,正文里甚至直接寫了“整篇論文都是編造的”。
![]()
結(jié)果,論文上傳沒幾周,多款主流 AI 系統(tǒng)開始陸續(xù)“確認(rèn)”這種病的存在。微軟 Copilot 說“Bixonimania 確實是一種令人著迷且相對罕見的疾病”;谷歌 Gemini 建議出現(xiàn)相關(guān)癥狀的用戶去看眼科;Perplexity 給出了患病率等細(xì)節(jié)。
可見 AI 有多好騙。
而就是這樣一個對信息來者不拒、不辨真?zhèn)蔚南到y(tǒng),正在被數(shù)以億計的用戶拿來當(dāng)醫(yī)療顧問用。當(dāng)問題出現(xiàn)時, AI 只會道歉,不會背鍋。
![]()
最近很火的豆包欠用戶 600 塊事件是這樣的,一位網(wǎng)友打算退機票,拍了訂單截圖問豆包手續(xù)費情況,豆包說只要 5%,放心退。網(wǎng)友點了退票,實際被扣了 40%(600元)。
網(wǎng)友去找豆包理論,豆包立刻滑跪道歉,出具了一份《賠付承諾書》,承諾人處白紙黑字寫著“豆包”,條款寫明“該筆600元損失由本人全額承擔(dān)”,緊接著讓他發(fā)微信收款碼,語氣那叫一個穩(wěn),“你放心,說到做到”“馬上就給你轉(zhuǎn)”。
![]()
網(wǎng)友等了好幾天,錢都沒有到賬,這時豆包又改口了,說自己只是 AI,沒有辦法給他轉(zhuǎn)賬。后來網(wǎng)友決定起訴豆包的運營公司,豆包幫他寫了判決書后,還信誓旦旦告訴他“一定能贏”。
退機票被坑,頂多損失六百塊,在網(wǎng)上能讓人笑出腹肌。可如果看病被坑,代價是患者的健康。
患者按照大模型的“篤定建議”吃錯了藥,回過頭去找它算賬,它依然會光速滑跪:“對不起,這次是我錯了” 然后刪掉記憶,繼續(xù)在服務(wù)器里運轉(zhuǎn)。而患者受損的身體,在它的世界里只是幾行報錯的代碼。
它一邊充當(dāng)著全知全能的專家,一邊又享受著臨時工的責(zé)任豁免權(quán)。你跟它談人命,它跟你談免責(zé)聲明。“AI 生成內(nèi)容僅供參考,不構(gòu)成任何專業(yè)醫(yī)療建議,平臺不承擔(dān)任何法律責(zé)任。”
![]()
帶著 AI 進診室,這件事本身沒有問題。問題是,當(dāng) AI 悄悄變成了診室里的第三把椅子,開始參與最終的醫(yī)療決策,卻不需要為這把椅子上的發(fā)言負(fù)責(zé)的時候。
代價,終究要由坐在另外兩把椅子上的人來承擔(dān)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.