來源:市場資訊
(來源:網易智能)
6月22日消息,百川智能與清華大學近日聯合發布醫療增強大模型Baichuan-M4,重點圍繞"信息不完整"這一臨床痛點,強化主動問診追問、長程病程記憶、循證溯源與任務調度四項能力。
![]()
據官方披露,在 OpenAI 提出的醫療評測基準 HealthBench上,M4綜合得分68.6(Hard 子集49.7,Professional 子集55.1);事實性幻覺率3.3%。據介紹,通用大模型擅長"拿到完整病例后答題",但現實中患者敘述零散,M4的改動主要落在主動追問這一環節。
問診方面,M4會圍繞癥狀性質、誘因、危險信號等多輪追問,優先排查危急情況。百川聯合150余位一線醫生,參照 OSCE 思路構建動態問診評測 SCAN-bench,M4初診與復診得分分別為79.0與74.7。
記憶方面,M4推出"全病程記憶",打通歷史病歷、多輪問診、化驗趨勢與用藥反饋,長上下文臨床記憶評測得分86.9,較上一代 M3提升21.1分。
循證方面,M4采用"證據錨定",結論對應到原始論文或指南具體段落,內置標準化臨床路徑超1000個、覆蓋200余種疾病;自建循證評測 Baichuan-EBM 上引用精度90.0%。
此外,百川面向醫療場景構建調度層 Baichuan-Harness,由模型自主決定追問/檢索/調病史時機,并對工具調用施加安全約束。官方將 M4定位為可完成連續診療動作的醫療智能體雛形。(袁雪麗)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.