藥物-靶標(biāo)親和力(DTA)的精準(zhǔn)、穩(wěn)健預(yù)測,是新藥發(fā)現(xiàn)與藥物重定位過程中的核心環(huán)節(jié),對加速藥物開發(fā)進(jìn)程、降低研發(fā)成本、優(yōu)化候選藥物篩選流程具有至關(guān)重要的意義。盡管傳統(tǒng)實(shí)驗(yàn)方法測定DTA具備一定可靠性,但其固有局限性在一定程度上制約了藥物研發(fā)的整體效率。近年來,深度學(xué)習(xí)技術(shù)的突破性發(fā)展為DTA預(yù)測提供了全新路徑,憑借高效、經(jīng)濟(jì)的突出優(yōu)勢,已逐步成為DTA預(yù)測領(lǐng)域的 有效 工具,為藥物篩選提供了強(qiáng)有力的技術(shù)支撐。
近日,軍事醫(yī)學(xué)研究院、上海大學(xué)的伯曉晨、何松、昝鵬深度合作, 在Nature Communications雜志發(fā)表了研究論文A meta learning and task adaptive approach for drug target affinity prediction,針對現(xiàn)有DTA預(yù)測模型在少樣本、未見過靶標(biāo)場景下的性能短板,研究團(tuán)隊(duì)提出了一種基于元學(xué)習(xí)框架的新型DTA預(yù)測模型AdaMBind,該模型集成了元學(xué)習(xí)模塊、自適應(yīng)任務(wù)模塊和標(biāo)簽噪聲注入策略,通過動態(tài)“由易到難”的任務(wù)調(diào)度機(jī)制,提升模型的訓(xùn)練效率和穩(wěn)健性,實(shí)現(xiàn)對未見過靶標(biāo)的精準(zhǔn)親和力預(yù)測,為少樣本場景下的藥物發(fā)現(xiàn)提供強(qiáng)有力的計(jì)算工具。
![]()
盡管深度學(xué)習(xí)在DTA預(yù)測中已取得諸多突破,但實(shí)際應(yīng)用中仍面臨兩大關(guān)鍵瓶頸:一是多數(shù)模型在樣本有限的情況下難以有效學(xué)習(xí)靶標(biāo)表征,而現(xiàn)實(shí)中大量靶標(biāo)缺乏充分表征,導(dǎo)致藥物-靶標(biāo)相互作用數(shù)據(jù)極度稀疏,嚴(yán)重限制模型的特征提取能力;二是主流方法缺乏靶標(biāo)特異性適應(yīng)和元知識遷移機(jī)制,難以應(yīng)對未見過靶標(biāo)的預(yù)測任務(wù),無法快速利用少量實(shí)驗(yàn)數(shù)據(jù)形成對新靶標(biāo)的特異性理解并實(shí)現(xiàn)可靠預(yù)測。元學(xué)習(xí)作為“學(xué)會學(xué)習(xí)”的有效框架,雖已被應(yīng)用于DTA預(yù)測,但現(xiàn)有元學(xué)習(xí)方法存在任務(wù)采樣不合理、易受噪聲任務(wù)干擾、依賴訓(xùn)練任務(wù)與測試任務(wù)相似性等缺陷,仍需進(jìn)一步優(yōu)化以提升模型在少樣本、跨靶標(biāo)場景下的泛化能力。
為了 緩解 現(xiàn)有DTA預(yù)測模型在少樣本、未見過靶標(biāo)場景下的應(yīng)用瓶頸,研究團(tuán)隊(duì)創(chuàng)新研發(fā)了一種基于元學(xué)習(xí)框架的DTA預(yù)測模型(AdaMBind)。該模型集成三大核心組成部分:元學(xué)習(xí)模塊、自適應(yīng)任務(wù)模塊及標(biāo)簽噪聲注入策略。其中,元學(xué)習(xí)模塊為模型提供“學(xué)會學(xué)習(xí)”的核心能力,助力模型快速利用少量數(shù)據(jù)實(shí)現(xiàn)知識遷移;自適應(yīng)任務(wù)模塊通過“由易到難”的動態(tài)調(diào)度機(jī)制,實(shí)現(xiàn)對高價(jià)值任務(wù)的優(yōu)先學(xué)習(xí);標(biāo)簽噪聲注入策略則進(jìn)一步提升模型的穩(wěn)健性。三者協(xié)同作用,構(gòu)建起高效、穩(wěn)健的DTA預(yù)測架構(gòu),可實(shí)現(xiàn)對未見過靶標(biāo)的精準(zhǔn)親和力預(yù)測。
![]()
圖. 基于元學(xué)習(xí)和任務(wù)自適應(yīng)機(jī)制的的藥靶親和力 預(yù)測的方法框架圖
AdaMBind通過對三個(gè)基準(zhǔn)數(shù)據(jù)集(BindingDB、KIBA、Davis)的測試,并與8種基線模型進(jìn)行比較,展示了其優(yōu)越的性能,無論是在多樣本還是小樣本設(shè)置下,均顯著優(yōu)于各類基線模型。此外,自適應(yīng)任務(wù)機(jī)制的有效性得到驗(yàn)證,其“由易到難”的動態(tài)任務(wù)調(diào)度策略,有效提升了模型的訓(xùn)練效率和泛化能力,與理論預(yù)期高度一致。
為了驗(yàn)證AdaMBind的實(shí)際應(yīng)用價(jià)值,研究團(tuán)隊(duì)開展了虛擬篩選實(shí)驗(yàn)及FLT3潛在抑制劑預(yù)測實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,AdaMBind能夠有效篩選出具有潛在活性的化合物,成功預(yù)測出FLT3潛在抑制劑,充分證明其可加速從理論模型到實(shí)際藥物開發(fā)的轉(zhuǎn)化過程,為藥物研發(fā)提供有力支撐。
綜上,本研究提出的AdaMBind模型通過元學(xué)習(xí)與自適應(yīng)任務(wù)模塊的協(xié)同作用,有效解決了少樣本、未見過靶標(biāo)場景下DTA預(yù)測的核心難題,在三種基準(zhǔn)數(shù)據(jù)集、兩種任務(wù)劃分方式以及不同樣本量場景下,均展現(xiàn)出優(yōu)于現(xiàn)有基線模型的性能,尤其在少樣本和低序列相似性靶標(biāo)預(yù)測中優(yōu)勢顯著。自適應(yīng)任務(wù)模塊的可解釋性分析進(jìn)一步揭示了模型的工作機(jī)制,為后續(xù)元學(xué)習(xí)在DTA預(yù)測中的應(yīng)用提供了重要參考。AdaMBind不僅為少樣本DTA預(yù)測提供了穩(wěn)健的框架,還在虛擬篩選和FLT3抑制劑發(fā)現(xiàn)中展現(xiàn)出良好的實(shí)際應(yīng)用價(jià)值,有望加速早期藥物研發(fā)進(jìn)程,為新興、研究不足靶標(biāo)的藥物開發(fā)提供高效、可靠的計(jì)算工具。
萬夢璇、趙彥彭、張藝馨為該論文共同第一作者,伯曉晨、何松、昝鵬為該論文的共同通訊作者。
原文鏈接:https://www.nature.com/articles/s41467-026-70554-5
伯曉晨研究員/何松研究員/昝鵬教授的人工智能賦能藥物發(fā)現(xiàn)交叉研究團(tuán)隊(duì)一直致力于利用生物醫(yī)學(xué)大數(shù)據(jù)與人工智能技術(shù)探索復(fù)雜疾病的致病機(jī)理和藥物治療方案,在 Nature、Nature Microbiology、Nature Machine Intelligence、Nature Communications、Molecular Cell 、 Nucleic Acids Research、Genome Biology 等雜志發(fā)表多篇論文。交叉研究團(tuán)隊(duì)招收碩士、博士研究生及博士后,接受具備一定基礎(chǔ)的本科生進(jìn)組實(shí)習(xí),歡迎感興趣的同學(xué)加入或來函咨詢。
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.