撰文丨王聰
編輯丨王多魚
排版丨水成文
你有沒有想過,我們身體里每一個細胞、每一寸組織,都是由什么構成的?基因是藍圖,但真正“干活”的是蛋白質——它們構成了我們的肌肉、驅動著神經信號、抵抗著病毒入侵。然而,長久以來,我們對人體蛋白質的了解就像一張只有幾座大城市的地圖,很多區域仍是空白。
2026 年 6 月 17 日,西湖大學郭天南研究員、上海交通大學醫學院李巖教授、哈爾濱醫科大學季勇教授、西湖實驗室朱怡研究員作為共同通訊作者(岳靚、姜玟昊、李賽男、羅蒙為論文共同第一作者),在國際頂尖學術期刊Nature 上發表了題為:Spatial distribution of the proteome in the human body and in cancers 的研究論文。
該研究系統性繪制了迄今為止分辨率最高、覆蓋范圍最廣的人體蛋白質組空間圖譜。該研究不僅讓我們看清了 13609 種蛋白質在全身 58 種主要組織、251 種亞型中的分布,更揭示了它們在 25 種癌癥中的“叛變”模式,為精準醫療和藥物開發打開了新的大門,也為未來的“虛擬細胞”(AIVC)建模奠定了基礎。
![]()
什么是“蛋白質組”?為什么它如此重要?
簡單來說,我們的基因組像是一本包含約2萬個“食譜”(基因)的菜譜,而蛋白質就是按照這些食譜烹飪出來的“菜肴”。同樣的食材,在不同廚師手中會變成不同的菜;同樣,同一個基因在不同組織中表達的蛋白質種類和數量也截然不同——這就是為什么心臟能跳動、大腦能思考、肝臟能解毒...
過去,科學家們主要通過測量 RNA 來間接推測蛋白質的情況,但這種方法并不準確。因為從 RNA 到蛋白質,中間還有復雜的調控環節。正如論文所指出的,“mRNA 豐度與蛋白質表達之間只有中等程度的相關性”——而蛋白質才是真正發揮功能、也是藥物作用的分子。因此,直接測量蛋白質,才能最真實地反映人體的生理狀態。
這項研究做了什么?——一場前所未有的“蛋白質普查”
為了完成這張地圖,研究團隊付出了巨大的努力:
他們收集了 2856 份樣本,樣本來源包括:9 位成年遺體捐獻者、8 位健康志愿者、9 位胎兒捐贈者和 1015 位癌癥患者。這些樣本覆蓋了幾乎整個人體:從大腦、心臟、肝臟這樣的主要器官,到耳蝸、晶狀體、軟骨這樣精細的結構,以及血液、唾液、尿液等體液。在癌癥方面,研究團隊分析了 25 種不同類型癌癥的癌組織及其配對的癌旁正常組織。
研究團隊使用了最先進的“武器”——數據非依賴采集質譜(DIA-MS)技術。這項技術就像一個超級靈敏的“蛋白質掃描儀”,能夠一次性、無偏倚地檢測數千種蛋白質。最終,他們在嚴格的質控標準下,成功定量了 13609 種蛋白質,這是目前同類研究中覆蓋范圍最廣的一次。
![]()
人類蛋白質組草圖概述
五大核心發現:從發育到癌癥的全景洞察
1、胎兒→腫瘤→癌旁→健康:一條蛋白質表達的“演化軌跡”
研究團隊做了一個非常有意思的分析:他們將所有樣本按照“胎兒組織(F)→腫瘤組織(T)→癌旁組織(NT)→健康成人組織(N)”的順序排列,發現蛋白質的表達呈現出一種有序的“偽時間”軌跡。
這揭示了一個深刻的生物學規律:腫瘤的發生,某種程度上是一種“去分化”過程——癌細胞會重新開啟一些本該在胚胎期才活躍的基因程序,同時關閉那些成熟組織特有的功能。例如,RNA 剪接相關的蛋白質在胎兒和腫瘤中都高度活躍,而免疫應答相關的蛋白質則在健康和癌旁組織中更為豐富。
有趣的是,大腦是一個例外。無論是發育還是癌變過程中,腦組織的蛋白質組都表現出驚人的穩定性——這可能解釋了為什么原發性腦腫瘤相對罕見,以及大腦的發育受到極其嚴格的基因調控。
2、每個器官都有自己獨特的“蛋白質身份證”
該研究發現,有 1717 種蛋白質是“組織富集”的,即它們在特定組織中含量遠高于其他部位。其中,大腦擁有的組織特異性蛋白質數量最多,而晶狀體中組織特異性蛋白占總蛋白的比例最高——這符合晶狀體作為透明光學介質的特殊功能需求。
一個有趣的例子是PANX3蛋白。此前在人類蛋白質圖譜(HPA)數據庫中,它被標注為“未檢測到”。但在這項研究中,PANX3 被確認為耳蝸中最富集的蛋白質。研究團隊還合成了這種蛋白的特異性肽段進行驗證,確認了它在聽覺系統中的獨特表達——這對于理解聽力機制和相關疾病具有重要意義。
3、藥物的“靶點分布圖”揭示了副作用之謎
為什么有些藥物對肝臟毒性特別大?為什么某些藥物會影響甲狀腺功能?這項研究給出了分子層面的解釋。
研究團隊將組織特異性蛋白質與 DrugBank 數據庫中的藥物靶點進行了匹配,發現肝臟擁有最多的組織富集型藥物靶點。例如,CYP2C8——一種主要在肝臟中表達的代謝酶,可被多達 302 種藥物靶向,包括抗病毒藥、降糖藥和抗癌藥。當這些藥物與吉非羅齊(一種降脂藥)聯用時,會導致 CYP2C8 被不可逆抑制,使其他藥物血藥濃度升高 8-10 倍,引發橫紋肌溶解、急性腎損傷等嚴重不良反應。
另一個案例是三氯生(一種廣泛使用的抗菌劑)。流行病學研究發現它可能影響甲狀腺功能。該研究證實,三氯生的靶點——甲狀腺過氧化物酶,正是在甲狀腺中高度富集的蛋白質。這一發現完美地將臨床觀察與分子機制聯系了起來。
4、25 種癌癥的“蛋白質指紋”各不相同
通過比較配對腫瘤和癌旁組織的蛋白質組,研究團隊識別出 8940 種差異表達蛋白,并發現了一些令人驚訝的模式——
肝細胞癌擁有最多的腫瘤特異性差異蛋白,且大部分是下調的,主要集中在代謝通路——這與肝癌中常見的“代謝重編程”現象一致。
胃腸道間質瘤(GIST)雖然起源于消化道,但其上調的蛋白質竟然富集于突觸信號通路。這是因為 GIST 來源于卡哈爾間質細胞(ICC)——腸道起搏器細胞,具有神經元特性。經典的 GIST 標志物 KIT 和 ANO1 也在該研究中得到確認。
結腸癌的腫瘤與癌旁組織蛋白質組最為相似,提示其惡性轉化過程中蛋白質層面的改變相對較小。
研究團隊還發現了 33 種在超過 20 種癌癥中普遍上調的蛋白質,其中包括NUDT1(也稱為 MTH1)。這些“泛癌”蛋白質可能是未來廣譜抗癌藥物的潛在靶點。
5、為新藥研發和“老藥新用”提供導航
這項研究最直接的應用價值在于藥物靶點的發現和“老藥新用”。
案例一:子宮內膜癌的治療新希望,研究團隊發現,用于三陰性乳腺癌(TNBC)的抗體偶聯藥物 Trodelvy(靶向 TROP2 和 TOP1),其兩個靶點在子宮內膜癌中也同時高表達。事實上,一項二期臨床試驗已經初步驗證了這一猜想。同樣,卵巢癌藥物 Olaparib(PARP 抑制劑)也可能對子宮內膜癌有效。
案例二:精準鎖定“成藥”靶點,通過整合藥物敏感性數據和 CRISPR 基因敲除數據,研究團隊篩選出了一些極具潛力的靶點。例如,MET 蛋白在直腸癌中高表達,且其表達水平越高,癌細胞對 MET 抑制劑越敏感。這為直腸癌的精準治療提供了新靶點。
案例三:找到只在腫瘤中高表達的靶點,理想的抗癌靶點應該只在癌細胞中高表達,而在所有正常組織中低表達,以減少副作用。研究團隊找到了 41 種位于細胞膜上的腫瘤富集蛋白,它們是最有希望的抗體偶聯藥物候選靶點。例如,TYROBP 在 10 種癌癥中均表現為腫瘤富集,而 KIT 則是 GIST 特異性的腫瘤富集蛋白。PAX5 則被確認為彌漫性大 B 細胞淋巴瘤的特異性靶點。
這項研究的意義——從“看見”到“預測”
這是人類第一次如此全面、系統地在蛋白質層面“看清”自己的身體。它不僅是一個數據資源,更是一個數字導航系統——研究人員可以通過在線平臺(https://db.prottalks.com/)查詢任意蛋白質在全身各組織中的分布,也可以比較不同組織之間的差異。
這項研究為我們打開了一扇前所未有的大門。正如論文中所說,這是“創建人體數字導航儀的關鍵第一步”。未來,隨著更多數據的積累和技術的進步,我們或許真的能夠實現——在分子層面精準導航,直達疾病的根源。
論文通訊作者郭天南研究員表示,這些蛋白質組數據為虛擬細胞(AIVC)建模提供了可能——利用人工智能和機器學習,將海量的蛋白質組數據整合成一個可以預測、可以交互的數字細胞模型。團隊近期將在Nature期刊發表一篇關于虛擬酵母的展望文章,與這張人體蛋白質組圖譜一脈相承,把目光從“看見蛋白質在哪里”進一步推進到“預測細胞會如何行動”:以酵母為可驗證的起點,提出構建虛擬細胞的理論框架,希望讓 AI 幫助理解細胞、預測細胞行為,并為藥物研發和生物制造提供新的導航工具。
論文鏈接:
https://www.nature.com/articles/s41586-026-10660-y
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.