網易首頁 > 網易號 > 正文申請入駐

王小川：AI進入醫療須靠醫療增強大模型，通用模型達不到要求

2026-05-26 19:44:38　來源: IPO早知道

湖南舉報

分享至

Baichuan-M4 三大醫療榜單同時登頂世界第一。

本文為IPO早知道原創

作者｜Stone Jin

據IPO早知道消息，在日前舉行的「AI 醫療新范式」學術論壇上，百川智能創始人兼 CEO 王小川發表主題演講，展示新一代醫療大模型 Baichuan-M4 與 AI 家庭醫生「百小醫」。三家國家頂尖醫院分別分享了與百川聯合開展的臨床研究成果。

作為專注醫療的大模型公司，百川智能創始人、CEO王小川在演講中開門見山：coding 對應創造、video 對應快樂，健康是智力模型尚未解開的一環。百川認為通過技術突破， AI 將為中國醫療創造新供給，提升用戶的就醫體驗，并形成圍繞家庭的全周期健康管理

Baichuan-M4 三大醫療榜單登頂世界第一

幻覺率3.3%全球最低

AI 進入醫療，方向沒錯，但做法需要認真。王小川提出，百川看到了技術、產品、信任三個維度的問題。

首先是技術，這也是當天論壇上被反復提及的行業現實：過去一年，通用大模型被大規模用于醫療健康咨詢，規模已達數千萬人次。患者發燒問 AI，孩子起疹子問 AI，拿到體檢報告看不懂也問 AI。

但一線臨床的反饋并不好。多位與會嘉賓指出，通用模型的回答聽起來流利、看起來專業，實際上經常“看似對、實際危險”。幻覺被包裝成了確定性，患者帶著 AI 給的“診斷”走進診室質疑醫生，醫患矛盾反而加劇。

王小川在演講中指出，AI真正進入醫療，必須依靠醫療增強大模型。他將醫療對大模型的剛性要求總結為三點

低幻覺。醫療容不得編造，一個錯誤判斷可能危及生命。《BMJ Open》2026 年的研究系統評估了主流通用模型的醫療回答，約 50% 被評為“有問題”，近 20% 屬于“高度有問題”。通用模型當前的幻覺率在嚴肅醫療場景下不可接受。

強循證。臨床診斷有嚴格的循證路徑，不是“根據癥狀猜一個最可能的病”。通用模型缺乏系統性的循證推理能力。《JAMA Network Open》2026 年評測了 21 款主流大模型在 29 個標準化臨床案例中的表現，鑒別診斷階段的錯誤率普遍超過 80%——不按指南邏輯層層排除，而是過早鎖定一個答案。

會提問。任何受過訓練的醫生都不會在患者說完第一句話時就下結論。牛津大學 2026 年發表于《Nature Medicine》的研究揭示了一個關鍵差距：AI 讀標準化病歷時準確率可達 94.9%，但真實患者自助使用時驟降至 34.5%。原因在于患者描述往往不完整，而通用模型不會像醫生一樣追問。

三條剛需，通用模型一條都不達標。為此，百川把每一項都做到了極致優化。

論壇現場，百川 M系列醫療專用大模型再次展現了技術創新領先的實力：

全新亮相的Baichuan-M4，在 HealthBench、HealthBench Hard、HealthBench Professional 三大權威醫療榜單中同時位列世界第一，全面超越 GPT-5.5、Opus 4.7、DeepSeek-V4-Pro 等頂尖模型。
依托原創的事實性感知強化學習算法，Baichuan-M4將裸模型的事實性幻覺率降至 3.3%，再創全球新低。
在循證路徑上，M4 將權威醫學指南拆解為 1000 余條原子化臨床路徑（SKILL），每一條由頂尖臨床專家定義與校驗。循證不是模型背誦的知識，而是每一步推理的執行骨架。
深度問診能力大幅領先通用大模型，不僅能像臨床醫生一樣步步追問，更擁有超長記憶，足以托起患者長周期的健康管理。

疊加 Harness 調度、記憶與自進化能力后，M4 更將從“醫療大腦”，升級為“醫療智能體”。

在此之前，百川 M3 于 2026 年 1 月發布時即刷新 HealthBench 最高紀錄。全球最大穩定幣公司 Tether 進軍 AI 醫療時，從 OpenAI、量化巨頭 Ubiquant AI 與百川三個候選中選定 M3 作為唯一教師模型。M3 在幾乎所有核心評測指標上都展現出明顯優勢，尤其在高復雜度醫學問題上拉開了顯著差距。

百小醫不只是一款AI醫療APP

更是微信里的AI家庭醫生

模型能力再強，并不直接等同于患者的最終獲益。王小川說：“M4 是大腦，百小醫是身體。”大腦解決的是能力問題，身體解決的是觸達問題。中國醫療最核心的矛盾，始終是優質醫療資源供給不足。AI 的發展恰恰為破解這個難題打開了一扇窗，但前提是找到對的產品形態。

百川現場展示了面向用戶的 AI 家庭醫生「百小醫」，產品核心定位直指：“明明白白看醫生，安安心心管家人”。

在百川的定義里，AI 家庭醫生的核心在于兩個理念判斷：

第一，不替代，而是接手。它不替代真人醫生的臨床決策，而是精準接住醫生看不見、來不及管的碎片時間。在一次完整的就醫歷程中，診前的癥狀梳理、就醫準備，診后的病情解讀、用藥管理和日常監測，占據了約 95% 的時間跨度，而診中那5% 的關鍵決策點——下診斷、開處方、做手術——則必須由真人醫生來完成。百川把這種協作稱為“雙醫模式”。

第二，它不止管單人，更要統管家人健康。中國家庭的健康命題向來是深度綁定的。百小醫主動引導用戶添加企業微信「百小醫@百川家醫」，拉入家庭群后自動為每位成員建立獨立的健康檔案，在自然對話中捕捉并結構化每個人的身體狀態、用藥歷史和檢查數據；識別日常閑聊中的高危信號，主動提醒復診和用藥。子女在外地，打開微信就能掌握父母的身體狀況；面對“勸不動父母去醫院”、“爸媽被保健品忽悠”這些中國家庭的真實痛點，百小醫以專業判斷介入，把焦慮轉化為行動。正如王小川所說：“AI 家庭醫生應該在你最常打開的地方等著你。微信是中國人的數字生活底座，AI 就該在那里。”一個家庭，本就該當成一個家庭來管。

沿著“雙醫協同”的邏輯，百川在論壇上進一步提出了「四級診療」新范式：在現有的三級醫院、二級醫院、基層醫院體系之下，通過 AI 家庭醫生構建堅實的“家庭底座”，與現有三級體系協同運轉。向上，AI 家庭醫生在最前端完成疾病的初步手查和主動分診；向下，三級醫院的隨訪與疾病管理能力沿同一路徑下沉，直接觸達到每一個家庭。百川同時宣布將 M4 與百小醫的能力底座開放給藥企、保險、智能硬件、醫療機構共建生態。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.