![]()
近日,西北工業大學彭佳杰團隊聯合北京大學戴慧教授、天津大學郝建業教授團隊在Nature Computational Science發表最新研究成果DualGPT-AB: a dual-stage generative optimization framework for therapeutic antibody design,提出DualGPT-AB雙階段條件生成式蛋白質語言模型新框架,專為多屬性協同優化的治療性抗體設計打造。該框架突破傳統抗體設計難以兼顧抗原結合特異性、黏度、免疫原性等多個成藥屬性約束的瓶頸,在靶向HER2的抗體優化任務中實現性能躍升,實驗驗證獲得殺傷活性優于赫賽汀(Herceptin)的候選抗體,為AI驅動的抗體藥物開發提供高效、可擴展的新范式。
![]()
單克隆抗體能夠特異性識別并結合抗原、進而激活機體免疫效應,是當前生物醫藥領域應用最廣泛的藥物類型之一,在癌癥、自身免疫疾病等重大疾病治療中發揮著不可替代的作用。抗體重鏈互補決定區CDRH3是決定抗原結合特異性與親和力的關鍵區域,想要獲得可臨床轉化的優質抗體藥物,不僅需要實現精準的抗原靶向,還必須同時兼顧黏度、清除率、免疫原性等多種可開發性屬性。如何在CDRH3設計中平衡這些約束,是當前計算抗體設計領域的核心挑戰之一。
近年來,人工智能方法在抗體序列設計中快速發展,但現有模型仍存在明顯局限:多數方法僅聚焦提升抗原結合能力,忽略可開發性等關鍵成藥屬性;部分多屬性優化方法依賴多步篩選或線性加權求和,將各屬性視為相互獨立的條件,未能建模屬性與序列之間的潛在關聯,限制了生成序列同時滿足多個目標屬性的能力;同時,滿足多個目標屬性的高質量CDRH3序列在現有數據集中極度稀缺,直接訓練條件生成模型難度極大。面對這些行業痛點,研究團隊開發了DualGPT AB框架,為多屬性協同約束下的治療性抗體設計提供了一種頗具潛力的新途徑。
該框架采用條件GPT架構,將目標屬性編碼為可學習向量并在生成過程中作為條件輸入,使模型在逐token生成時與指定約束保持一致,從而更精準地引導抗體序列生成。不同于現有的訓練與生成策略,DualGPT-AB采用兩階段遞進式優化,并結合強化學習策略,從滿足部分目標屬性逐步擴展至滿足更多關鍵屬性,顯著提升了模型在多約束下生成高質量CDRH3序列的能力。
在第一階段,研究團隊基于從OAS數據庫收集的大規模抗體CDRH3 序列,選取FvNetCharge、FvCSP、HISum三類適合評估的可開發性屬性進行標注,構建帶有部分屬性標簽的訓練數據集。在此數據集上訓練條件GPT得到Prior GPT,將屬性標簽作為條件token與序列一同輸入,讓模型掌握在部分屬性約束下生成CDRH3序列的能力,為后續更復雜的多屬性協同優化提供穩定起點。
在第二階段,團隊以Prior GPT初始化Agent并引入強化學習優化,在每一輪迭代中生成CDRH3序列,同時評估HER2結合特異性、反映免疫原性的MHC II minPR等五項關鍵屬性,將歸一化后的屬性分數加權構建獎勵信號,并通過REINVENT策略迭代更新模型。隨后利用迭代得到的帶擴展屬性分數的CDRH3序列構建高質量標注數據集,訓練得到Enhanced GPT,使模型能夠在擴展屬性約束下高效生成兼具抗原結合特異性與優良可開發性的CDRH3序列。
![]()
圖1. DualGPT-AB框架示意圖
計算實驗結果表明,DualGPT-AB框架在生成滿足多屬性約束的抗體序列方面表現優異,滿足多屬性的成功率顯著優于數種當前主流方法。對兩階段生成序列的屬性值分布進行分析可見,DualGPT AB的雙階段優化策略能夠使生成序列從滿足部分目標屬性的分布,逐步向擴展目標屬性優化。研究團隊利用DualGPT AB構建了滿足多項目標屬性的候選抗體文庫,并鑒定出其中高度保守的氨基酸殘基。隨后,基于親和力計算評估結果選取了9個抗體開展系統性體外實驗驗證。表面等離子體共振 (SPR) 和酶聯免疫吸附試驗 (ELISA) 實驗結果顯示,DualGPT AB設計的抗體(如CDRH3_39與CDRH3_68)對HER2具有良好的結合能力;抗體依賴性細胞介導的細胞毒性 (ADCC) 和補體依賴性細胞毒性 (CDC) 實驗進一步表明,二者均表現出優異的抗腫瘤活性。其中,CDRH3_39的結合親和力雖略低于臨床抗體赫賽汀,但在腫瘤殺傷能力,尤其在CDC功能實驗中,該抗體在AU565和SK BR 3細胞上展現出更強的殺傷效應,體現出良好的臨床治療潛力。
DualGPT-AB依托兩階段遞進優化策略,實現了抗體CDRH3序列在抗原結合特異性、可開發性等多個關鍵屬性上的協同優化,能夠高效設計滿足所需屬性的抗體序列。該框架不僅在計算實驗中展示了卓越的多屬性優化能力,還通過體外實驗驗證了部分候選抗體在具備良好HER2結合親和力的同時,展現出更強的腫瘤殺傷活性和治療潛力。這一成果為“不僅關注親和力,更兼顧抗體藥物成藥性”的設計理念提供了有力支持。未來,隨著更準確高效的屬性預測工具的不斷發展,DualGPT-AB 有望進一步突破現有數據和資源的限制,實現對更多生物學約束的優化,甚至擴展至全長抗體及其他蛋白序列的設計,提供更通用且可靠的技術路徑。
西北工業大學計算機學院研究生謝東娜為本文第一作者,西北工業大學彭佳杰教授、北京大學戴慧副教授、天津大學郝建業教授為共同通訊作者。
文章鏈接:
https://www.nature.com/articles/s43588-026-00976-0
制版人: 十一
學術合作組織
(*排名不分先后)
![]()
戰略合作伙伴
(*排名不分先后)
![]()
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
![]()
點擊主頁推薦活動
關注更多最新活動!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.