![]()
Baichuan-M4 三大醫療榜單同時登頂世界第一。
本文為IPO早知道原創
作者|Stone Jin
據IPO早知道消息,在日前舉行的「AI 醫療新范式」學術論壇上,百川智能創始人兼 CEO 王小川發表主題演講,展示新一代醫療大模型 Baichuan-M4 與 AI 家庭醫生「百小醫」。三家國家頂尖醫院分別分享了與百川聯合開展的臨床研究成果。
作為專注醫療的大模型公司,百川智能創始人、CEO王小川在演講中開門見山:coding 對應創造、video 對應快樂,健康是智力模型尚未解開的一環。百川認為通過技術突破, AI 將為中國醫療創造新供給,提升用戶的就醫體驗,并形成圍繞家庭的全周期健康管理
![]()
Baichuan-M4 三大醫療榜單登頂世界第一
幻覺率3.3%全球最低
AI 進入醫療,方向沒錯,但做法需要認真。王小川提出,百川看到了技術、產品、信任三個維度的問題。
首先是技術,這也是當天論壇上被反復提及的行業現實:過去一年,通用大模型被大規模用于醫療健康咨詢,規模已達數千萬人次。患者發燒問 AI,孩子起疹子問 AI,拿到體檢報告看不懂也問 AI。
但一線臨床的反饋并不好。多位與會嘉賓指出,通用模型的回答聽起來流利、看起來專業,實際上經常“看似對、實際危險”。幻覺被包裝成了確定性,患者帶著 AI 給的“診斷”走進診室質疑醫生,醫患矛盾反而加劇。
王小川在演講中指出,AI真正進入醫療,必須依靠醫療增強大模型。他將醫療對大模型的剛性要求總結為三點
低幻覺。醫療容不得編造,一個錯誤判斷可能危及生命。《BMJ Open》2026 年的研究系統評估了主流通用模型的醫療回答,約 50% 被評為“有問題”,近 20% 屬于“高度有問題”。通用模型當前的幻覺率在嚴肅醫療場景下不可接受。
強循證。臨床診斷有嚴格的循證路徑,不是“根據癥狀猜一個最可能的病”。通用模型缺乏系統性的循證推理能力。《JAMA Network Open》2026 年評測了 21 款主流大模型在 29 個標準化臨床案例中的表現,鑒別診斷階段的錯誤率普遍超過 80%——不按指南邏輯層層排除,而是過早鎖定一個答案。
會提問。任何受過訓練的醫生都不會在患者說完第一句話時就下結論。牛津大學 2026 年發表于《Nature Medicine》的研究揭示了一個關鍵差距:AI 讀標準化病歷時準確率可達 94.9%,但真實患者自助使用時驟降至 34.5%。原因在于患者描述往往不完整,而通用模型不會像醫生一樣追問。
三條剛需,通用模型一條都不達標。為此,百川把每一項都做到了極致優化。
![]()
論壇現場,百川 M系列醫療專用大模型再次展現了技術創新領先的實力:
全新亮相的Baichuan-M4,在 HealthBench、HealthBench Hard、HealthBench Professional 三大權威醫療榜單中同時位列世界第一,全面超越 GPT-5.5、Opus 4.7、DeepSeek-V4-Pro 等頂尖模型。
依托原創的事實性感知強化學習算法,Baichuan-M4將裸模型的事實性幻覺率降至 3.3%,再創全球新低。
在循證路徑上,M4 將權威醫學指南拆解為 1000 余條原子化臨床路徑(SKILL),每一條由頂尖臨床專家定義與校驗。循證不是模型背誦的知識,而是每一步推理的執行骨架。
深度問診能力大幅領先通用大模型,不僅能像臨床醫生一樣步步追問,更擁有超長記憶,足以托起患者長周期的健康管理。
疊加 Harness 調度、記憶與自進化能力后,M4 更將從“醫療大腦”,升級為“醫療智能體”。
在此之前,百川 M3 于 2026 年 1 月發布時即刷新 HealthBench 最高紀錄。全球最大穩定幣公司 Tether 進軍 AI 醫療時,從 OpenAI、量化巨頭 Ubiquant AI 與百川三個候選中選定 M3 作為唯一教師模型。M3 在幾乎所有核心評測指標上都展現出明顯優勢,尤其在高復雜度醫學問題上拉開了顯著差距。
百小醫不只是一款AI醫療APP
更是微信里的AI家庭醫生
模型能力再強,并不直接等同于患者的最終獲益。王小川說:“M4 是大腦,百小醫是身體。”大腦解決的是能力問題,身體解決的是觸達問題。中國醫療最核心的矛盾,始終是優質醫療資源供給不足。AI 的發展恰恰為破解這個難題打開了一扇窗,但前提是找到對的產品形態。
百川現場展示了面向用戶的 AI 家庭醫生「百小醫」,產品核心定位直指:“明明白白看醫生,安安心心管家人”。
在百川的定義里,AI 家庭醫生的核心在于兩個理念判斷:
第一,不替代,而是接手。它不替代真人醫生的臨床決策,而是精準接住醫生看不見、來不及管的碎片時間。在一次完整的就醫歷程中,診前的癥狀梳理、就醫準備,診后的病情解讀、用藥管理和日常監測,占據了約 95% 的時間跨度,而診中那5% 的關鍵決策點——下診斷、開處方、做手術——則必須由真人醫生來完成。百川把這種協作稱為“雙醫模式”。
第二,它不止管單人,更要統管家人健康。中國家庭的健康命題向來是深度綁定的。百小醫主動引導用戶添加企業微信「百小醫@百川家醫」,拉入家庭群后自動為每位成員建立獨立的健康檔案,在自然對話中捕捉并結構化每個人的身體狀態、用藥歷史和檢查數據;識別日常閑聊中的高危信號,主動提醒復診和用藥。子女在外地,打開微信就能掌握父母的身體狀況;面對“勸不動父母去醫院”、“爸媽被保健品忽悠”這些中國家庭的真實痛點,百小醫以專業判斷介入,把焦慮轉化為行動。正如王小川所說:“AI 家庭醫生應該在你最常打開的地方等著你。微信是中國人的數字生活底座,AI 就該在那里。”一個家庭,本就該當成一個家庭來管。
![]()
沿著“雙醫協同”的邏輯,百川在論壇上進一步提出了「四級診療」新范式:在現有的三級醫院、二級醫院、基層醫院體系之下,通過 AI 家庭醫生構建堅實的“家庭底座”,與現有三級體系協同運轉。向上,AI 家庭醫生在最前端完成疾病的初步手查和主動分診;向下,三級醫院的隨訪與疾病管理能力沿同一路徑下沉,直接觸達到每一個家庭。百川同時宣布將 M4 與百小醫的能力底座開放給藥企、保險、智能硬件、醫療機構共建生態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.