新冠病毒自出現以來不斷變異,從Alpha到Omicron,每一次新變異株的崛起都可能引發新一輪感染浪潮,并削弱現有疫苗和抗體藥物的保護效果。如何在海量正在傳播的變異株中,提前準確識別出即將成為主流的那一個,一直是全球公共衛生領域的重大挑戰。傳統的實驗方法如深度突變掃描(DMS)雖能解析單個突變的功能,但成本高、通量低,且無法模擬多個突變間的復雜互作;而基于序列頻率的統計模型在新變異株出現早期、數據稀疏時,預測可靠性會顯著下降。因此,亟需一種能夠整合分子層面功能數據與群體層面流行趨勢的智能預測系統。
2026年5月27日,國際頂級期刊《自然·微生物學》發表了北京大學曹云龍教授與簡繁忠研究員團隊完成的研究論文——“A deep mutational scanning-informed protein language model predicts SARS-CoV-2 evolution dynamics with spatiotemporal resolution”。該研究提出了一種名為DeepCoV的深度學習框架,首次將深度突變掃描(DMS)實驗數據、病毒蛋白序列進化信息以及反映人群免疫壓力的歷史流行病學監測數據相結合,實現了對新冠病毒變異株流行趨勢的高精度、高時空分辨率預測。
![]()
研究團隊首先利用截至2023年10月前的所有新冠病毒RBD(受體結合域)序列、同期各變異株的流行比例以及已有的DMS功能性突變數據(包括抗體逃逸、ACE2結合親和力、蛋白表達水平等),訓練了一個融合Transformer與LSTM架構的深度學習模型。在回顧性模擬預警測試中,DeepCoV表現出卓越的預測能力:它能夠比傳統生長優勢擬合方法和EVEscape、E2VD等現有先進模型更早地識別出即將占據主導地位的變異株。例如,在JN.1、KP.2和KP.3變異株實際流行率超過20%的一個月前,DeepCoV就已經將其排在預測列表的最前列。定量評估顯示,與邏輯回歸方法相比,DeepCoV將假發現率(FDR)降低了90%,其預測的變異株未來流行率與實際觀測值的皮爾遜相關系數高達0.969。通過系統性消融實驗,團隊證實DMS數據、序列進化信息與歷史流行率三部分缺一不可,任何單一模塊的移除都會顯著削弱模型的預警能力。
![]()
進一步的分析揭示,DeepCoV不僅能提前預警,還能精準重構變異株在不同地區和時間的傳播動態。模型成功捕捉了KP.2變異株從歐洲傳播至北美、再擴散到亞洲的順序,并準確預測了NB.1.8.1變異株在亞洲地區的相對高流行率。尤為值得一提的是,研究團隊利用DeepCoV進行了計算機模擬的全單點突變掃描,成功在相關變異株大規模流行前1-2個月,就預測出了JN.1時代的R346T、F456L以及KP.3時代的A435S等真實后續優勢突變熱點。即使在缺乏DMS數據的刺突蛋白N端結構域(NTD),僅基于序列和流行率訓練的DeepCoV擴展模型也能有效識別XEC和KP.3.1.1等新變異株中的關鍵逃逸突變(如S31del)。這些結果表明,DeepCoV為新冠病毒的實時進化監測提供了一個可擴展、可解釋且具備實戰潛力的早期預警平臺,未來有望應用于流感、呼吸道合胞病毒等其他快速進化的病原體,為疫苗株更新和公共衛生決策爭取寶貴的準備時間。
READING
BioPeers
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.