「智能是平等的,但是context是不平等的。」
Sam Altman不久前說了一句話,大意是:智能終將像水電一樣成為基礎設施,人人都能調用。但他也指出,AI當前最大的瓶頸不在智能,在「context gap」——系統沒法持續理解用戶的真實場景。
a16z在今年3月的一篇分析里說得更直接:沒有正確context的AI Agent,基本無用。
![]()
這兩個判斷疊在一起,恰好解答了一個困擾我很久的疑惑:
為什么有些很火的垂直賽道,遲遲未能形成馬太效應?比如醫療。
AI發展到現在,通用大模型的格局已經很清楚了。頭部三五家吃下絕大多數市場,后來者連牌桌都很難上。
強者恒強,幾乎是常識。
但醫療偏偏是個例外。這條賽道熱了好幾年,上百家公司涌進來,論文一茬接一茬,評測榜單你追我趕。
可奇怪的是,似乎沒有人真正拉開明顯差距。為什么?
如果從context的角度進行思考,答案很可能是:
不是大家實力接近,恰恰相反,是因為整個行業卡在了同一個結構性死結里——
數據、模型、場景,三者的閉環斷了。
閉環怎么斷的
先說數據。
數據在醫療行業的角色有點像「蕭何」,成也它,敗也它。
看起來數據足夠豐富,病歷、影像、檢驗結果幾乎無處不在,所以早期大家一窩蜂涌進來。
但真正進來之后才發現:數據確實不缺了,但沒法直接用啊。
![]()
很多廠商手里的確有大量原始醫療數據,但由于缺乏專業的標準化治理能力,所以難以轉化為有效訓練素材。
說白了,專業的事交給專業的人。醫療數據的標準化處理,需要懂醫學的人來干。
懂醫學的人從哪來?
像DeepMind這樣的頂級實驗室還能自搭內部醫學團隊,但對大多數公司來說,他們往往只能依賴外部醫學標注團隊或醫院合作方,通過「外包」來補齊能力缺口。
走外包當然沒問題,問題是高質量的醫學治理資源本身就是稀缺品,而且很難規模化復制。
通俗點,能接這種活的團隊就那么多,排隊都排不過來。
所以結果就變成:
原始數據看起來很多,但真正經過專業治理、能穩定喂進訓練流程的,其實非常有限。
說到底,原始數據不等于context。沒經過治理的數據,是噪音,不是信號。
![]()
△圖片由AI生成
再說場景。
很多人的想法是,雖然高質量數據少了點,但只要把模型扔進真實環境跑起來,不就能持續獲取新數據、形成數據飛輪了嗎?
思路沒錯,但飛輪恰恰卡在了這一步。
問題出在產品形態。
絕大多數醫療AI產品仍停留在「問答助手」階段,能回答問題,卻無法深度嵌入醫生的工作流。
一個問答機器人哪怕每天被問一萬次,沉淀下來的也只是「用戶問了什么、AI怎么答的」,而真正有價值的數據,來自診療過程本身——
醫生如何診斷、如何開藥、如何調整治療方案,以及患者最終恢復得怎么樣。
進不去這些核心環節,就拿不到有效增量數據。
拿不到有效增量數據,模型當然還能靠公開文獻和語料繼續「刷分」,但這種提升更多停留在知識層面,而非臨床決策與工作流層面。
結果就是一個很矛盾的現象:評測很強,但醫院里的實際使用頻率并不高。
于是死循環形成了:
產品進不了臨床→拿不到真實診療數據→模型迭代沒有燃料→產品更進不去。
![]()
△圖片由AI生成
而現實的發展軌跡,幾乎就是這個循環的真實寫照。
據動脈智庫統計,截至去年5月,國內累計發布的醫療大模型已達到288個,僅半年就新增133個。但與模型數量的快速增長形成鮮明對比的是,行業整體滲透率仍不足10%~20%。
所以說,現在整個行業面臨的困境是:不是智能不夠,是context攢不起來。
而當一個系統既無法持續積累真實臨床context,又無法嵌入真實決策流程時,這個死結,本質上就已經被寫死了。
問題只剩下一個:
有沒有人,能把它重新解開?
答案是:還真有
環顧四周,訊飛醫療剛發布的「星火醫療大模型V3.5」就這樣進入了我的視野。
除了比較「新」這個因素外,它身上有兩點瞬間吸引了我:
一是在多項關鍵醫療測評上打敗了GPT-5.5,雖說有「主場優勢」,但能和OpenAI如今最強的模型過招,至少說明模型底子沒問題。
二是眾所周知訊飛一直深耕醫院場景,如果說有人有機會打破前面那個死循環,那么訊飛大概是最有可能的一個。
而接下來的資料,也印證了我的判斷。
查完一圈發現,它和賽道里其他玩家明顯不同的地方在于:不只是評測能打,而且是真落地了。
評測方面。IDC《中國醫療大模型技術評估,2026》綜合實力行業第一,15項核心指標中12項領跑;MedBench智能體評測98.9分登頂;醫療知識問答、醫療語言理解、診斷治療推薦、醫療文書生成、醫療多模態交互、醫療多輪交互等多項關鍵臨床任務綜合能力,超越GPT-5.5最高推理檔(Extra High)。
![]()
不過說實話,評測第一在這個賽道不稀奇,畢竟榜單輪流坐莊,今天你第一明天他第一,大家早就看習慣了。
真正稀缺的,是評測成績和臨床價值能對上賬。
而擺在我眼前的是這樣幾個數字:
在多家頭部三甲醫院的真實應用中,使用星火醫療大模型V3.5生成病歷的醫生采納率達到91%,病歷書寫時間縮短52%。
翻譯翻譯,超過九成的病歷醫生看過能簽字,一天下來就省出幾小時。
影像端同樣跨過了實用門檻,X線、MR報告生成的醫生采納率75%,質控達到專家會診水準。
而這些,還只是我看到的,模型能力的冰山一角。病歷內涵質控、智能用藥審核、跨專科輔助診斷、居民端的體檢報告解讀和慢病管理——多個剛需場景都已經跑起來了。
在國內醫療大模型賽道,評測和臨床兩面同時對上賬的玩家,目前屈指可數。
而訊飛醫療,至少已經用成績站到了前排。
訊飛醫療的context是怎么攢起來的
但成績單本身仍不是重點,重點是:同一個死循環,訊飛醫療憑什么跑通?
答案,依舊要回到context身上尋找。
而差距正在于context——訊飛醫療的context,不是天上掉下來的,是十年一步一步跑出來的。
![]()
十年下來,訊飛醫療已經構建起了一套「場景→數據→治理→模型→更廣場景」的自強化循環體系。
它做的第一件事,是把場景鋪到足夠廣。
不是挑幾家醫院做試點,是從基層衛生院到三甲醫院到影像云平臺的全域覆蓋。
什么樣才能稱得上「全域」?看一組數字你就明白了:
目前訊飛醫療已經覆蓋全國806個區縣、7.7萬余家基層醫療機構,累計輔助診斷超12億次。同時攜手600多家等級醫院,其中包括50余家百強醫院和7家十強醫院。
這個覆蓋密度,在行業里并不常見。
而且不是接入了就完事,病歷生成、處方審核、影像初篩,這些產品是直接嵌進醫生每天的工作流里的。
但光鋪醫院還不夠,一個患者的就醫過程,不是只發生在醫院里。
現在大家遇到頭疼腦熱都習慣先在手機上問一問癥狀,如果拿不準可能會去小區診所或基層衛生院做個基礎診斷,嚴重一點再轉到大醫院做進一步診療,出院之后也沒結束,還要做康復隨訪、慢病管理這些長期跟蹤。
訊飛醫療的產品,剛好把這條鏈路從頭串到了尾。
這意味著什么?
沉淀下來的數據,不是某一個環節的碎片,而是一條從「咨詢→首診→診療→康復」的完整context鏈。
這種東西,只做一個環節的玩家根本攢不出來。
居民端醫院端左右開弓,場景一旦足夠深入,數據就開始自然沉淀。
而沉淀下來的數據,就成了訊飛醫療最核心的一層壁壘。
日積月累下來,它目前已擁有16億人次脫敏醫療語音數據、12億次真實診療數據,再加上每天新增超過220萬份語音、影像、病歷等跨模態樣本。
這種規模的真實醫療數據儲備,已經很難在短期內復制。
![]()
△圖片由AI生成
但光有數據量還不夠。前面說了,原始數據不等于context,關鍵在治理。
訊飛醫療的數據治理,不是外包,是全職的醫學專家團隊在主導。
這一環是整個飛輪里最容易被低估的壁壘。
原始數據人人都有,但把數據變成context的能力,行業里極少數玩家具備。
有了高質量數據,這下終于可以訓練出一個好模型了。
而在「訓模型」這個步驟里,訊飛醫療有個動作很關鍵:從算力底座到模型訓練,走通了國產化路線。
算力層面,星火醫療大模型V3.5基于昇騰910B全國產算力底座訓練,率先在國產算力平臺上跑通了DSA(動態稀疏注意力)和MTP(多Token預測)的長文本高效訓練,推理吞吐量提升4.5倍。
對醫療這個相對敏感的行業來說,國產算力合規在今天已經不是加分項,而逐漸成為一項重要準入門檻。實踐中,這也是政府端、醫院端客戶比較看重的一點。
最后一環,是從模型回到應用。
模型在面向醫生和面向居民的兩端同時落地應用,而醫生端和居民端的雙向協同,讓飛輪多了一個加速器。
全部串起來,你將得到一個完整循環:
場景進入→數據沉淀→數據被治理成context→模型增強→再進入更深場景。
「原神,就此啟動。」
AI醫療行業的馬太效應,悄然出現了
到這里,我算是大概弄明白了訊飛醫療背后的運作邏輯。
看起來確實挺復雜,但往回一想,其實還是能用開頭那句話說清楚:
智能是平等的,但context不是。
![]()
雖然「context」是近一兩年才被大家廣泛提及的概念,但訊飛醫療其實已經默默攢了十年,從最早鋪場景、做數據治理、適配國產算力,到今天星火醫療大模型V3.5的全面落地——
這些事在當時未必有一個統一的名字,但回過頭看,每一步都是在為嚴肅醫療的context的積累做準備。
每一環都需要時間,環環相扣。后來者即便在某個點上追上來,也很難同時補齊全部要件。
而這,恰恰就是馬太效應開始形成的標志:
不是某次評測拿了第一,是一個完整的正向飛輪開始轉動。
先跑通的人越轉越快,沒跑通的人還在死循環里打轉。
![]()
△圖片由AI生成
不過說一千道一萬,一切都還要回到那個最樸素的問題:
醫生到底用不用?有沒有真正跨過那道實用門檻?
評測跑分高,只能說明模型能力上限不錯,但更關鍵的是,在真實病歷里,醫生愿不愿意采納、甚至愿意簽字負責。
而前面提到的91%采納率,不是實驗室指標,是真實診室里的反饋——
這說明醫生在日常工作中,已經用實際行動投了票。
訊飛醫療,已經拿到了這張信任票。
說實話,我個人的感覺是,這一輪醫療AI的變化,可能比很多人想象得更慢,但也更確定。
星火醫療大模型V3.5這次的落地,與其說是一次產品升級,不如說是讓這個行業的分層開始變得肉眼可見。
前面那種「大家都在做模型、誰也沒拉開太大差距」的階段,可能真的要過去了。
接下來會發生什么,其實不難想。
資源大概率會開始往少數已經跑通鏈路的玩家那里集中,比如真實臨床數據、醫院合作深度、醫學人才密度,這些東西本來就不是可以快速復制的。
而另一邊,那些還停留在「通用模型+輕量醫療適配」的玩家,空間會越來越被壓縮。
倒不是誰不夠努力,而是這個游戲開始變成另一種規則了:不是比誰更聰明,是比誰更早把閉環跑起來。
說到底,大模型的下半場,比的可能真的不是「智能」,而是context。
而context這種東西,也挺現實的。
光靠訓練堆不出來,開會喊口號更沒用,它就得扎進真場景里,一點一滴磨出來。
誰先攢夠,誰就有機會起飛。
訊飛醫療,下的便是這盤棋。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.