網易首頁 > 網易號 > 正文 申請入駐

首創“證據錨定”,百川推出最低幻覺循證增強醫療大模型M3 Plus

0
分享至



1月22日,百川智能正式發布 Baichuan-M3 Plus,嚴肅醫療場景下的問答準確性、可靠性,再次刷新了剛剛推出的M3所創下的世界紀錄。憑借獨創的六源循證技術與M3基座結合,M3 Plus將幻覺率降低至2.6%,低于 Open Evidence,達到全球最低水平;首創“證據錨定”技術,不僅給出引文來源,還能將模型生成的每一句醫學結論,精確錨定到原始論文中的對應證據段落,使 AI 的醫學判斷真正做到可核驗、可追責、可教學。

更具意義的是,百川宣布推出「海納百川」計劃,將全球最低幻覺的循證增強醫療大模型以API形式,免費開放給中國醫療服務機構,共同繁榮國內的AI醫療生態,推動中國AI醫療的變革,讓每一位中國醫務工作者都能擁有可靠、好用的AI助手。

低幻覺率再次刷新世界紀錄,讓AI具備邁向臨床的診療能力

對于中國的醫生而言,擁抱AI的先決條件,是AI真實具備了足夠優秀的診療能力。當患者頻繁使用DeepSeek、豆包等通用大模型的AI產品去尋求診療建議,大量的誤判、幻覺,不僅讓醫生不勝其煩,更逐漸演變為一場對中國醫療AI技術的信任危機。

隨著上周百川M3大模型的正式開源,這一局面已被徹底打破。M3不僅在 Healthbench、Healthbench Hard 等多個權威評測中登頂榜首,實現了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領域完成超越,以3.5%的幻覺率領跑全球。

作為百川拓展低幻覺技術路線的成功實踐,M3首創的 Fact-Aware RL的強化學習范式,使底座模型在無工具的設定下,幻覺也能大幅降低到SOTA水平。在此基礎上,M3 Plus 將 M2 Plus 模型已驗證有效的六源循證范式,引入模型訓練和推理過程,確保模型的每條建議都有專業醫學證據支持。最終,M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%。即便與行業標桿 Open Evidence相比,M3 Plus 也完成了超越。



首創“證據錨定”技術:讓 AI 的每一句醫學結論,都能被逐句核驗

在循證醫學體系中,真正決定醫生是否信任一條結論的,從來不是語言是否流暢,而是結論背后的證據是否權威、是否準確、是否可追溯。相比“說得像不像醫生”,臨床更關心的是:這句話,究竟依據哪篇論文、哪條指南、哪一段原文。

當前行業中,無論是通用大模型還是醫療模型,大多已支持“文獻引用”——在結論后標注論文或指南來源。但在實際使用中,醫生往往會發現:點開引文,依然無法判斷 AI 的這句結論究竟源自哪一段證據。更常見的問題是兩類:一是“張冠李戴”,引用編號存在,但文獻內容對不上;二是“內容沖突”,文獻本身正確,但被引用的段落與結論并不匹配,甚至存在拼接、誤讀。

百川 M3 Plus 首創“證據錨定(Evidence Anchoring)”技術,不是簡單標注“引用自哪篇文獻”,而是要求模型生成的每一句醫學結論,都必須精確對應到原始論文或指南中的具體證據段落。每一句判斷,都能被逐字溯源、逐條核驗。

為實現這一目標,百川將“證據錨定”作為獨立訓練目標,引入 Citation Reward Model,對錯誤引用進行明確懲罰,讓模型只能在“確實有證據支持”的空間中推理與生成。最終,結論與證據段落的匹配準確率超過 95%,真正讓 AI 的醫學判斷做到可核驗、可追責、可教學。



M3 Plus API 調用價格較上一代模型大幅降低70%

在大模型快速演進的當下,能力越強的模型,調用成本往往越高,許多優秀的應用因此難以規;涞,更難真正走進臨床一線。百川認為,只有持續降低智力成本,AI 才能覆蓋臨床、教學等真實場景,成為醫生和患者“用得起、用得好”的基礎能力。

為此,M3 Plus 在系統層面進行了全面的工程重構,通過 MoE 架構優化、模型量化以及 Gated Eagle-3 投機解碼等關鍵技術,在嚴格保證模型能力與可靠性的前提下,實現了 API 調用成本較上一代降低 70%,為 AI 在醫療場景的規模化應用掃清了關鍵障礙。

百川全面開放M3 Plus的技術能力,API限時免費體驗15天,所有開發者均可申請使用。

「海納百川」計劃開啟,M3 Plus 向行業伙伴免費開放

隨著人工智能開始進入門診、病房和醫學教學等真實場景,越來越多醫生在工作中接觸到 AI:查資料、看指南、對照證據、推敲診療方案。但在高強度、強責任的臨床環境中,AI 能在多大程度上真正幫到醫生,仍需要在真實使用中不斷探索。

醫生“用好 AI”的新局面,要靠足夠多的行業伙伴在真實場景里一起打磨——怎么嵌入醫療流程、怎么做證據呈現、怎么做風險提示、怎么支持年輕醫生成長。

為此,百川發起 「海納百川」計劃:面向所有服務醫務工作者的機構,免費提供全球幻覺最低循證增強醫療大模型 M3 Plus 的 API,把服務醫生的AI能力直接交到生態伙伴手里。

從核心技術的持續突破,到面向行業生態的免費開放,「海納百川」不僅是一個名字,更是一份推動中國AI+醫療發展的承諾。百川愿與行業伙伴一道,圍繞醫生、面向患者,推動醫療 AI 更安全、更可及、更有溫度地發展,讓技術進步真正轉化為人民健康的長期福祉。

「海納百川」計劃|參與條件:

適用對象:

為醫務工作者提供服務的機構

醫務工作者包括醫生、藥劑師、醫技師、護士、健管師、醫學生等

適用場景僅限于:

臨床輔助決策、醫學教育

用途限制:

僅用于真實服務場景、不得用于數據生產

使用要求:

產品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
王楚欽:誰敢說穩贏我們?反正我不信 放馬過來 看看能打成什么樣

王楚欽:誰敢說穩贏我們?反正我不信 放馬過來 看看能打成什么樣

念洲
2026-04-29 14:48:01
斯諾克世錦賽:墨菲連贏2局!趙心童9-11落后,吳宜澤7-5逆轉瓦菲

斯諾克世錦賽:墨菲連贏2局!趙心童9-11落后,吳宜澤7-5逆轉瓦菲

劉姚堯的文字城堡
2026-04-29 22:55:30
為什么住院14天必須出院

為什么住院14天必須出院

老郭在學習
2026-04-29 13:49:19
哈蘭德出鏡啤酒廣告引爭議,挪威足協:他有權這樣做,我們無法干涉

哈蘭德出鏡啤酒廣告引爭議,挪威足協:他有權這樣做,我們無法干涉

懂球帝
2026-04-29 17:17:14
圖解丨中國臺灣人均GDP首次同時超過日本和韓國

圖解丨中國臺灣人均GDP首次同時超過日本和韓國

格隆匯APP
2026-04-27 17:45:34
中央定調點名!廣東突然在深圳宣布一個10萬億大蛋糕!

中央定調點名!廣東突然在深圳宣布一個10萬億大蛋糕!

深圳夢
2026-04-28 21:56:14
從戰前的兩千架到700萬架,烏克蘭的無人機產量為何能暴增?

從戰前的兩千架到700萬架,烏克蘭的無人機產量為何能暴增?

高博新視野
2026-04-29 07:30:22
No!東契奇次輪報銷!湖人徹底天塌了

No!東契奇次輪報銷!湖人徹底天塌了

籃球實戰寶典
2026-04-29 18:51:29
儲戶1800萬元存款被銀行員工轉走,涉事銀行稱需“等司法結論”,律師:銀行應承擔第一順位賠付責任

儲戶1800萬元存款被銀行員工轉走,涉事銀行稱需“等司法結論”,律師:銀行應承擔第一順位賠付責任

極目新聞
2026-04-29 19:34:48
蘋果唯一的缺點也沒了

蘋果唯一的缺點也沒了

星球商業評論
2026-04-28 22:04:34
溥儀這氣質哪像傀儡?拋開立場,那時的溥儀骨子里依然是傲慢的!

溥儀這氣質哪像傀儡?拋開立場,那時的溥儀骨子里依然是傲慢的!

史之銘
2026-04-28 22:35:50
今年,許多人集體消失了!

今年,許多人集體消失了!

放牛娃的遐想
2026-04-29 08:26:55
A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

夜深愛雜談
2026-04-29 21:30:15
墨菲被罰8分送自由球!趙心童單桿71分逆轉,吳宜澤5-5暫平瓦菲!

墨菲被罰8分送自由球!趙心童單桿71分逆轉,吳宜澤5-5暫平瓦菲!

劉姚堯的文字城堡
2026-04-29 22:12:48
震驚!李白《靜夜思》被篡改“床前看月光”,網友:這才是原始版

震驚!李白《靜夜思》被篡改“床前看月光”,網友:這才是原始版

火山詩話
2026-04-29 19:47:16
剛剛,直線拉升!美伊談判,大消息!

剛剛,直線拉升!美伊談判,大消息!

中國基金報
2026-04-29 18:48:19
霸王茶姬奶茶中喝出水銀?官方通報:奶茶中異物系購買人投放

霸王茶姬奶茶中喝出水銀?官方通報:奶茶中異物系購買人投放

界面新聞
2026-04-29 17:41:51
王楚欽擁抱法國名將!卻無視18歲日本新星 網友:松島輝空太傲慢

王楚欽擁抱法國名將!卻無視18歲日本新星 網友:松島輝空太傲慢

念洲
2026-04-29 16:36:45
難以置信!有福州家長深夜11點多接班主任電話,被宣讀防溺水事項

難以置信!有福州家長深夜11點多接班主任電話,被宣讀防溺水事項

火山詩話
2026-04-29 08:42:45
“手術必須100%成功,不接受任何意外”這句話說完,三甲醫院主任霸氣回懟:不擔風險,手術暫停!

“手術必須100%成功,不接受任何意外”這句話說完,三甲醫院主任霸氣回懟:不擔風險,手術暫停!

醫護健康科普
2026-04-29 17:16:58
2026-04-29 23:40:49
藍媒匯 incentive-icons
藍媒匯
由資深媒體人打造的新媒體平臺
1420文章數 594關注度
往期回顧 全部

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

頭條要聞

補壹刀:解放軍兩支艦隊同時行動 信息量非常大

頭條要聞

補壹刀:解放軍兩支艦隊同時行動 信息量非常大

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節目組2小時

財經要聞

蘇州,率先進入牛市

汽車要聞

技術天花板再摸高 全能型的奕境X9首秀

態度原創

教育
手機
房產
家居
公開課

教育要聞

明確!中科院東莞材料研究所首年依托中科大招收博士研究生

手機要聞

子系迭代旗艦集體漲價:標準版起步就是4000元 機圈變天了

房產要聞

80億投資!浙商總部基地+?诒闭,金沙灣這是要起飛啊!

家居要聞

寂然無界 簡潔風格

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版