網易首頁 > 網易號 > 正文申請入駐

性能碾壓谷歌！5000億美元巨頭開源最強端側醫療AI，背后藏著一家中國企業！

2026-05-12 19:23:03　來源: 智藥局

四川舉報

分享至

一家估值超5000億美元的幣圈富豪公司，秀出了性能碾壓谷歌的AI醫療大模型。

近日，以發行全球最大穩定幣USDT聞名的Tether推出了AI醫療大模型QVAC MedPsy，并在多項醫學推理與診斷基準測試中展現出令人意外的強大性能：

這款僅1.7B參數的輕量級模型，擊敗了規模大16倍的谷歌MedGemma-27B；且4B版本使用的token比主流模型少3.2倍，在降低計算成本的同時保持了較高的輸出質量。

這一結果，直接挑戰了AI醫療領域長期存在的“模型規模越大，效果越好”的共識，在官方技術通稿中，Tether AI團隊強調，該模型更接近一種“輕量級高密度推理系統”。

不少開發者社區也對其“低參數、高性能”的組合方式給予了積極評價，認為其可能代表醫療大模型的一條新路徑。

值得關注的是，Tether旗下AI團隊在2024年才啟動招募，成立時間極短。從其官網披露的技術說明與開源鏈路來看，QVAC MedPsy的訓練并非完全從零開始構建，而是在多個基礎模型之上進行組合式訓練與優化。

進一步追溯其論文與技術報告可以發現，在封閉式醫學基準測試與HealthBench評估框架中，Tether團隊實際采用了來自中國公司的開源醫療大模型——百川智能的Baichuan-M3-235B作為自己的“教師模型”。

中國大模型的持久統治力

在Tether團隊的內部模型篩選中，Baichuan-M3同臺競技的對手包括OpenAI的GPT-OSS-120B以及量化巨頭旗下Ubiquant AI推出的Fleming-R1-32B。

而Baichuan-M3-235B在幾乎所有核心評測指標上都展現出明顯優勢，尤其是在高復雜度醫學問題上的表現，拉開了顯著差距。

其中，最值得關注的是醫學推理基準MedXpertQA。

這是目前業內公認難度最高的醫學多選評測之一，相比傳統基于USMLE題庫的MedQA，它更強調復雜臨床推理、多學科診斷與長鏈路決策能力，某種程度上，更接近頂級醫院MDT（多學科會診）場景下的真實醫學判斷。

在這一基準上，Baichuan-M3相比競品取得了高達10.98分的領先優勢。對于醫療AI而言，這已經不是簡單的“精度提升”，而是意味著模型在復雜病情理解、診療邏輯組織以及醫學知識調用能力上，出現了代際差異。

不僅如此，在經典大模型評測MMLU-Pro Health上，Baichuan-M3同樣展現出顯著領先，分別取得了+5.05 / +2.73的優勢表現。

事實上，早在2026年1月首次發布時，Baichuan-M3就已經在全球權威醫療AI評測基準 HealthBench上擊敗GPT-5.2，并刷新當時最高紀錄。更難得的是，在AI行業已經進入“月更時代”的背景下，這一優勢并未隨著時間迅速衰減。

具體來看，Baichuan-M3-235B相較GPT-OSS-120B領先約6至12分，相較Fleming-R1-32B領先約10至12分，并且在HealthBench全部七個維度上都維持了持續性的優勢。

Tether團隊對Baichuan-M3模型的評價

這種持續領先的背后，是百川在醫療強化學習體系上的長期投入。

從2025年M2開始，百川便將原本依賴患者模擬器與靜態Rubric的半動態反饋機制，升級為能夠隨模型能力共同演化的全動態Verifier System。隨著監督信號不斷細化、難化，模型得以持續突破能力上限，最終讓M3在復雜醫學推理與醫療溝通能力上實現躍遷。

與此同時，M3還首次具備了原生“端到端”嚴肅問診能力。它能夠像真實醫生一樣主動追問、逐層逼近病因，把關鍵病史和風險信號一步步問出來，再基于完整信息進行深度醫學推理。

這也是為什么，Tether團隊并不是Baichuan-M系列模型唯一的支持者。Baichuan-M系列模型在開源社區累計獲得超過150萬次下載，同時受益于百川推出的「海納百川」計劃，M3 Plus API已向服務醫務工作者的機構免費開放，目前已有大量團隊基于該模型構建醫療應用。

甚至在今年3月OpenAI發布GPT-5.4后，仍有不少開發者在社區中呼吁，希望GPT系列與Baichuan-M3在HealthBench上展開正面對決，并質疑GPT在醫療健康領域的真實能力，是否已經被中國醫療大模型反超。

正如百川智能創始人、 CEO王小川在媒體采訪中表達的：“（AI醫療）護城河核心肯定在于模型能力的絕對領先，在醫療這一嚴肅領域，只有領先一代的技術水平才能建立行業信任。”

重構專業醫療的“數字基建”

當大模型浪潮席卷各行各業時，真正能切入醫療AI的公司并不多，百川智能算是其中最早的一批。

早在2023年，百川智能成立后迅速躋身國內大模型賽道的前列。到了2025年，百川智能明確了“為人類造醫生、為生命建模型”的核心路徑，其發布的模型幾乎全部圍繞醫療場景和推理能力增強展開。

同年10月，百川推出首個循證增強醫療大模型Baichuan-M2 Plus，在幻覺率控制上明顯優于通用大模型，降低至Deepseek的三分之一，可信度接近資深臨床醫生水準。

年底，百川智能發布醫療Agent平臺PAPA（PlayBook Animated Proactive Agent），能夠從提醒用藥到動態調整健康計劃，實現月度乃至年度的患者康復進程管理，真正將AI嵌入臨床閉環。

隨后登場的醫療大模型Baichuan-M3更一鳴驚人。在全球權威醫療評測 HealthBench 中以 65.1分登頂，首次全面超越 GPT-5.2，并刷新了醫療幻覺率最低記錄。

2026年以來，醫療健康已成為AI最受重視的落地領域之一。OpenAI推出“個人超級健康助手”ChatGPT Health，谷歌發布最新開源醫療模型MedGemma 1.5，Anthropic也掏出Claude for Healthcare來搶占醫療市場。

不同于通用大模型“先做能力、再找場景”的路徑，百川智能選擇深耕醫療垂類，圍繞臨床真實需求打磨產品，持續突破低幻覺率、端到端問診和復雜臨床推理等核心能力。

百川智能構建的“深度問診”能力，讓模型在有限對話輪次中，將臨床所需問題問全、問準，其表現甚至顯著高于人類醫生基線。

首創的“證據錨定”技術，不僅提供引文來源，還將每一句醫學結論精確映射到原始論文的對應段落，使AI的醫學判斷可核驗、可追責、可教學，極大增強了臨床可信度。

這也讓百川智能在醫療AI行業進入深水區后，逐漸形成差異化優勢——不僅有強大模型能力，更熟悉醫院工作流，更貼近真實臨床場景。

在政策支持、醫院數智化升級與大模型能力突破的多重推動下，醫療AI正在進入真正的產業化周期。而提前完成垂類深耕、建立技術與場景閉環的百川智能，顯然已經站在了更有利的位置。

此外，據智藥局獲悉，百川智能即將發布AI醫療應用產品與新一代大模型，其應用表現與技術成果值得高度期待。

—The End—

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

物理世界：AI Agent 的下一個戰場

鈦媒體APP 2026-06-15 15:13:51
0 跟貼 0
4步出聲，單卡0.24秒！Noiz AI攜港科大清華，開源音頻生成大模型

量子位 2026-06-15 14:54:36
0 跟貼 0

一夜反轉！「殺進第一梯隊」的巴西LLM竟「套殼縫合」了國產模型

機器之心Pro 2026-06-15 11:40:10
1 跟貼 1

納德拉最新播客：AGI并非終點，要避免無腦燒錢

智東西 2026-06-15 22:49:41
0 跟貼 0
碼農連任務都不寫了？Codex開始自己給自己派活

新智元 2026-06-16 00:12:50
0 跟貼 0

一文讀懂Loop Engineering：6大板塊和三個大坑

智東西 2026-06-15 18:46:43
2 跟貼 2

90%的人都用錯了！實測這個AI一鍵生成PPT，徹底解放雙手

雷科技 2026-06-15 18:25:54
0 跟貼 0
馬斯克身家達1.2萬億美元 SpaceX市值反超臺積電

財聯社 2026-06-15 23:05:22
1 跟貼 1

一場退場，一面照出硅谷真身的鏡子

科學伙伴 2026-06-15 10:04:45
2 跟貼 2
桑達爾·皮查伊斯坦福畢業典禮演講：樂觀主義與做有價值的事

至頂科技 2026-06-15 22:36:03
0 跟貼 0
Claude design限速，谷歌開源輕松做動態網頁，實力打臉？

機器之心Pro 2026-04-29 17:20:04
0 跟貼 0
8成崗位、硅谷大佬與退場學生：隔空罵戰藏三條代際裂痕

爬蟲飼養員 2026-06-16 00:12:30
0 跟貼 0
日本節目教授：沒有純粹的日本人，往上追溯歷史，一定有中國血統

阿蝦AIXA 2026-06-13 02:42:31
1 跟貼 1
在中國就得守中國的法律！山姆總部被約談！

看看新聞Knews 2026-06-15 14:30:30
26377 跟貼 26377
小伙帶俄羅斯美女來中國，突然打了全村人的臉，誰說找不到媳婦的

明月大笑 2026-06-13 17:42:04
0 跟貼 0
中國真實的軍事實力，到底有多強！看完您就明白了！

舊夢留聲機 2026-06-13 02:27:02
1 跟貼 1
北京范本：一座超大城市的醫療AI底座，是怎么長出來的

健聞咨詢 2026-06-15 09:42:26
0 跟貼 0
周靖人的去留不重要

鈦媒體APP 2026-06-15 16:38:18
0 跟貼 0
安徽醫科大學細胞治療基礎與轉化研究團隊博士后招聘

BioArt 2026-06-15 08:46:22
0 跟貼 0
中國有哪幾個機？

無恙綜藝 2026-06-13 17:28:42
0 跟貼 0
察言觀色是藝術，心領神會是智慧#閱讀提升認知 #強者思維邏輯

叫我金主編 2026-06-15 22:13:10
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
這就是中國建造，一條高速就建好了

韭菜很陶醉 2026-06-15 10:09:40
1 跟貼 1
我國備戰俄烏沖突：策略揭秘

小橋流水q 2026-06-14 04:39:51
0 跟貼 0
中國最具未來感地鐵在外網火了

愛歌唱的叮當貓 2026-06-13 13:09:58
0 跟貼 0
大獎出爐！10項！2026全球醫療科技創新大獎

思宇MedTech 2026-06-12 17:20:08
0 跟貼 0
中國普通小區綠化驚呆老外！

愛歌唱的叮當貓 2026-06-14 13:17:17
0 跟貼 0
手術前長得“亂七八糟”的小手，醫生給寶寶修一修剪一剪

協和手足外科陳江海 2026-06-14 14:00:00
0 跟貼 0
斯諾克最新戰報：中國2勝2負，08年天才小將5-1火速晉級！

章民解說體育 2026-06-16 02:29:20
0 跟貼 0
拇指功能非常重要，示指拇化把食指“變”拇指

協和手足外科陳江海 2026-06-15 09:00:00
0 跟貼 0
示指拇化的關鍵是什么？掌骨夾角決定對掌功能

協和手足外科陳江海 2026-06-13 14:00:00
0 跟貼 0
多模態大模型視覺定位難題怎么解？

機器之心Pro 2026-06-10 11:31:45
0 跟貼 0
媽媽：孩子出生的時候我都懵了，羊膜束帶纏繞，不是你的問題

協和手足外科陳江海 2026-06-12 14:00:00
0 跟貼 0
大家都驚呼好整齊的六趾，該不該做手術切除

協和手足外科陳江海 2026-06-12 09:00:00
0 跟貼 0
分裂手畸形缺一根中指，當務之急把裂手修復虎口開大

協和手足外科陳江海 2026-06-15 11:00:00
0 跟貼 0
梁山財政體系解析：誰管錢、誰管糧，梁山如何運作？

夏時情緒 2026-06-12 02:10:33
0 跟貼 0
孩子大拇指長成螃蟹鉗，媽媽四處求醫卻遲遲不敢手術

協和手足外科陳江海 2026-06-14 11:00:00
4 跟貼 4
數來數去都是6根腳趾，小女孩術后變成漂亮的五趾了

協和手足外科陳江海 2026-06-13 11:00:00
0 跟貼 0
谷歌CEO斯坦福演講數百學生退場抗議

RT今日俄羅斯 2026-06-15 15:13:56
0 跟貼 0
只能分一根腳趾?分開沒意義?術后5個小腳趾自由生長

協和手足外科陳江海 2026-06-11 14:00:00
0 跟貼 0

智藥局

我們更懂藥物創新

1207文章數 220關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

家居

數碼

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

性能碾壓谷歌！5000億美元巨頭開源最強端側醫療AI，背后藏著一家中國企業！

白宮一個電話，最強Claude上線三天就沒了

西班牙遭爆冷：0-0平佛得角 亞馬爾完成首秀

西班牙遭爆冷：0-0平佛得角 亞馬爾完成首秀

世界杯開賽4天，亞足聯依然保持不敗！

黃大煒猝逝過程太離奇，母親追查真相

活鼠、活蛆、農殘超標 山姆回應被約談

網易X智己 夏日尊享內購會，熱力收官

態度原創

“文創店里找故居” ，魯迅先生能高興嗎？| 新京報社論

綠意盎然 自然之境

Sonos宣布酷狗音樂接入官方App：支持Hi-Res無損音質

女人不管多大年齡，夏天都應該準備一條短褲，舒適百搭又松弛

西班牙遭爆冷：0-0平佛得角亞馬爾完成首秀

西班牙遭爆冷：0-0平佛得角亞馬爾完成首秀

活鼠、活蛆、農殘超標山姆回應被約談

網易X智己夏日尊享內購會，熱力收官

綠意盎然自然之境