无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

華西醫院團隊讓AI學會“看病”,動態診斷準確率提升

0
分享至

過去幾年,大型語言模型在醫學考試中屢創佳績,甚至能超越人類醫生。然而現實中的診斷遠非回答選擇題那么簡單——醫生需要從一句主訴開始,逐步追問病史、安排檢查、修正假設,整個過程充滿不確定性?,F有AI模型能否勝任這種動態、迭代的臨床診斷流程,一直是個懸而未決的問題。

近日,Nature Communications期刊發表了四川大學華西醫院運動醫學中心李箭教授、骨科研究所付維力教授以及華西生物醫學大數據中心李康教授共同領導團隊的研究成果,題為《Grounding large language models in clinical diagnostics》的研究。該工作系統評估了多個主流大語言模型在真實診斷場景中的表現,并開發了一個名為ClinDiag-GPT的專用模型,探索了人機協作的可行路徑。


研究團隊首先構建了一套模擬真實臨床環境的評估框架。在這個框架中,被測的“醫生智能體”只拿到患者的初始信息(例如“腹痛三天”),然后必須主動提問,逐步獲取病史、體格檢查和檢驗結果,最終給出診斷。配套的數據集包含4421個真實病例,涵蓋32個??疲渲屑扔屑痹\常見病,也有疑難和罕見病。測試結果令人意外:在靜態問答中表現亮眼的GPT-4o、Claude-3-Haiku、通義千問等模型,一旦進入動態診斷流程,準確率就驟降到30%左右,遠低于它們靜態問答中60%的水平。進一步分析發現,這些模型普遍存在信息采集不全、過早錨定某個診斷、忽視矛盾證據等問題——這些恰恰是人類醫生也會犯的認知偏誤。


針對上述短板,研究團隊利用7616個真實病例轉化而成的多輪診斷對話數據,對通義千問2.5-72B進行了監督微調,得到了ClinDiag-GPT。在同樣的動態診斷測試中,該模型以39.76%的準確率超越了所有基線模型。更重要的是,它在病史采集階段的錯誤率為20.56%(其他模型高達40%-52.8%),體格檢查階段為19.44%(其他模型28%-46%),診斷檢驗階段為46.67%(其他模型55.6%-62.2%)。錨定偏誤和確認偏誤的發生率也顯著降低。這表明,通過針對性的訓練,AI不僅可以記住醫學知識,還能學會遵循臨床規范、主動收集信息、抵抗認知偏誤。

研究最后進行了一項三臂對照試驗:醫生單獨診斷60個病例的準確率為40%,ClinDiag-GPT單獨為23.33%,而人機協作組達到了45%,且平均耗時從醫生的22分鐘縮短至15分鐘。尤其值得注意的是,在罕見病子集中,人機協作的優勢最為明顯。研究者認為,AI憑借廣博的知識儲備,可以彌補醫生在少見病上的經驗盲區;而醫生則能憑借臨床判斷校準AI的偏差。雖然ClinDiag-GPT的絕對準確率仍有提升空間,但這項研究證實了一條務實路徑:讓AI成為醫生的得力助手,而非替代者。

READING

BioPeers

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Shams:黃蜂沒主動兜售三球,但森林狼報價豐厚讓他們放手

Shams:黃蜂沒主動兜售三球,但森林狼報價豐厚讓他們放手

懂球帝
2026-06-25 22:30:08
曾多次擊敗王楠,25歲退役后入美籍,如今成為美國乒乓球隊主教練

曾多次擊敗王楠,25歲退役后入美籍,如今成為美國乒乓球隊主教練

以茶帶書
2026-06-25 16:14:59
全線跳水,虧大發了

全線跳水,虧大發了

曹多魚的財經世界
2026-06-26 13:43:11
今年夏天太反常!6月不熱早晚涼,老話的征兆別不當回事

今年夏天太反常!6月不熱早晚涼,老話的征兆別不當回事

三農雷哥
2026-06-24 16:54:34
一夜三瘋狂!勇士2年1400萬簽老將 3年8500萬鎖悍將 老脆矮全湊齊

一夜三瘋狂!勇士2年1400萬簽老將 3年8500萬鎖悍將 老脆矮全湊齊

阿訊說天下
2026-06-26 11:19:08
31國軍演正式倒計時!中方一改往日低調,亮出東風17震懾全場

31國軍演正式倒計時!中方一改往日低調,亮出東風17震懾全場

小小科普員
2026-06-26 14:52:04
傳奇落幕!18年半掌控美聯儲,三次救中國!一句話改寫全球經濟史

傳奇落幕!18年半掌控美聯儲,三次救中國!一句話改寫全球經濟史

混沌錄
2026-06-25 21:47:15
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
婆婆當眾將剩菜倒進我碗中,我放下碗筷對丈夫說:看到沒!離婚吧

婆婆當眾將剩菜倒進我碗中,我放下碗筷對丈夫說:看到沒!離婚吧

茶余飯后故事會
2026-06-25 19:11:16
連裝都懶得裝了?漏洞這么多

連裝都懶得裝了?漏洞這么多

走讀新生
2026-04-22 13:46:02
重磅!美國就俄烏戰爭作出公開表態!白俄對烏打開邊境

重磅!美國就俄烏戰爭作出公開表態!白俄對烏打開邊境

史政先鋒
2026-06-25 20:58:05
桂圓這樣吃才補氣血!堅持一周睡眠變香,90%的人都吃錯了!

桂圓這樣吃才補氣血!堅持一周睡眠變香,90%的人都吃錯了!

白米飯怎么吃
2026-06-23 19:19:48
越南,已經主動從中國的經濟巨艦上跳船了!

越南,已經主動從中國的經濟巨艦上跳船了!

回京歷史夢
2026-06-22 18:43:18
今年廣西高考物理類競爭太大,600分以上的上萬人,650以上超千人

今年廣西高考物理類競爭太大,600分以上的上萬人,650以上超千人

起喜電影
2026-06-26 07:14:15
內塔尼亞胡公開演講遭打斷 民眾高喊“滾回家去”

內塔尼亞胡公開演講遭打斷 民眾高喊“滾回家去”

看看新聞Knews
2026-06-26 16:38:05
北大武大赴泰招生每月補貼3500,國內孩子學費卻在漲,引全民熱議

北大武大赴泰招生每月補貼3500,國內孩子學費卻在漲,引全民熱議

今朝牛馬
2026-06-23 17:27:37
美國朝野痛哭流涕,全世界有三個國家,美國搞不定

美國朝野痛哭流涕,全世界有三個國家,美國搞不定

揭秘歷史的真相
2026-06-25 21:26:08
離婚當天婆家擺慶功宴,我在暗處布下天羅網,結賬時全家臉都綠了

離婚當天婆家擺慶功宴,我在暗處布下天羅網,結賬時全家臉都綠了

城南雪花開
2026-02-25 20:33:23
高考數學150分后,他最讓人服氣的不是滿分

高考數學150分后,他最讓人服氣的不是滿分

朗威談星座
2026-06-26 08:05:58
你的公積金是什么段位?

你的公積金是什么段位?

細說職場
2026-06-26 12:42:12
2026-06-26 17:15:00
BioPeers incentive-icons
BioPeers
生命科學最新文獻分享解讀報道
454文章數 3關注度
往期回顧 全部

科技要聞

美國政府要求OpenAI分批發布GPT-5.6

頭條要聞

朝鮮領導層重大調整:"反腐少將"被查 趙甬元被"召回"

頭條要聞

朝鮮領導層重大調整:"反腐少將"被查 趙甬元被"召回"

體育要聞

三球換里德:森林狼和黃蜂誰更癲?!

娛樂要聞

劉嘉玲想放棄梁朝偉,沒有自理能力

財經要聞

懸在科技頭上的達摩克利斯之劍

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預訂

態度原創

本地
旅游
教育
親子
公開課

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

旅游要聞

老一輩都聽過的滇王故事,一座古廟串聯起整個消失的古滇王國!

教育要聞

官方發布!四川省2026年普通高校招生錄取控制分數線來了!

親子要聞

1-3歲皮膚嬌嫩階段,換季兒童被怎么選能低敏親膚不會悶出疹子?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版