編輯丨王多魚
排版丨水成文
如今,越來越多的人開始向大語言模型(LLM)尋求醫療建議,然而,這些模型在醫療領域的準確性仍然偏低,給出的答案市場模棱兩可,甚至因受到未經證實的信息影響而給出錯誤答案。
2026 年 4 月 20 日,加州大學圣地亞哥分校及谷歌研究院的研究人員合作,在 Nature 子刊Nature Health上發表了題為:A multi-agent framework combining large language models with medical flowcharts for self-triage 的研究論文。
該研究開發了一個結合大語言模型與醫療流程圖的多智能體系統——TriageMD,用于患者的自我分診。它就像一個不再自由發揮,而是嚴格遵循權威醫學流程圖來看病的 AI 醫生。該研究證明了透明、準確且通用的 AI 輔助自我分診的可行性,有可能在臨床環境之外支持患者的知情決策,同時提高醫療資源的利用效率。
![]()
如今,在線健康資源和 AI 聊天機器人已成為許多人尋求醫療建議的第一站。數據顯示,超過 95% 的美國成年人在網上搜索過健康信息,近三分之一的人使用過 ChatGPT 等工具來咨詢醫療問題。然而,這些工具存在明顯缺陷:診斷準確率低、建議模糊、容易“幻覺”(生成錯誤信息),且決策過程不透明,就像一個“黑箱”。
這導致了嚴重的醫療資源錯配:近 40% 的美國急診就診者實際上并不緊急。人們要么因不確定而延誤治療,要么因誤判而涌入急診室,加劇了醫療系統的負擔。因此,一個可靠、透明且易于使用的自我分診工具,對患者和整個醫療體系都至關重要。
TriageMD 如何工作?三步走,像護士一樣問診
TriageMD的核心思想很簡單:將 AI 靈活的自然語言對話能力,與標準化臨床流程圖的嚴謹性相結合。它模擬了分診護士一步步詢問病情的過程。
整個系統就像一個三人協作的醫療團隊——
1、檢索智能體:相當于“分診臺”。根據你的人口信息(例如年齡、性別)和主訴(對癥狀的描述),從 100 個美國醫學學會流程圖中,快速找到最相關的那一個。
2、決策智能體:相當于“分析醫生”。解讀你對每個問題的回答(是/否/不確定),并根據流程圖邏輯,決定下一個該問什么問題。
3、對話智能體:相當于“溝通護士”。將決策結果轉化為簡潔、共情的語言,用通俗易懂的方式向你提問或給出建議。
最終,系統會給出一個清晰的行動建議,例如“建議在 24 小時內看急診”或“可在家觀察,如果出現 XX 癥狀再就醫”。整個過程都有據可循,你可以看到 AI 是基于哪條權威路徑在為你分析。
![]()
多智能體自我分診系統概述
表現如何?用數萬次模擬對話嚴格測試
為了全面評估該系統的可靠性,研究團隊沒有使用難以獲取的真實患者對話記錄,而是利用多個大語言模型生成了大規模、多樣化的合成數據集進行測試。
找得準嗎? 在 2000 條模擬患者開場白測試中,系統準確找到最相關流程圖的成功率是84.1%。如果放寬到相似度排名前 3 的流程圖,命中率高達95.2%。這意味著系統能很好地理解你的核心問題。
聊得通嗎? 在導航測試中,系統面對 37200 條風格各異的模擬患者回復(包括簡潔的、描述的、模糊的、不確定的甚至跑題的),整體導航準確率達到了99.1%。即使患者回答含糊其辭(例如“我猜不是吧”),系統也能敏銳地識別出其中的不確定性,并停下來要求澄清,而不是武斷地繼續。
更安全、更透明的 AI 醫療未來
這項研究為 AI 在消費級醫療應用領域指明了一條新路:通過引入“流程圖”這一人類醫生和 AI 都能理解的共同語言,打破了 AI 的“黑箱”。
對患者而言:你獲得的不再是一個不知來源的模糊建議,而是一個基于權威臨床路徑的、可追溯的個性化指導。這能幫助你在焦慮和不確定中,做出更明智的就醫決策。
對醫療系統而言:它能有效分流非緊急患者,減輕急診壓力,讓資源更合理地配置。
對AI開發者而言:它提供了一種可控、可審計的AI部署框架。醫生可以審查和編輯背后的流程圖數據庫,確保AI輸出的安全性與專業性。
當然,TriageMD仍是一個“概念驗證”系統。未來,它需要在實際臨床環境中進行進一步驗證,并考慮更復雜的癥狀和多病共存的情況。但毫無疑問,TriageMD 為我們展示了一個 AI 與人類專業知識深度融合的未來:AI 不再是一個令人不安的“預言家”,而是一個嚴格遵循操作規程、值得信賴的“智能助手”。
論文鏈接:
https://www.nature.com/articles/s44360-026-00112-2
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.