歡迎星標(biāo) 果殼硬科技
1月8日,清華大學(xué)交叉信息研究院、生命科學(xué)學(xué)院等多個團(tuán)隊聯(lián)合在Science上發(fā)表了一項突破性研究。該研究由閆創(chuàng)業(yè)、張偉、劉磊、蘭艷艷等人共同領(lǐng)導(dǎo),研發(fā)出一套名為 DrugCLIP 的人工智能系統(tǒng),能夠以前所未有的速度和精度,為上萬個蛋白質(zhì)尋找可能與之結(jié)合的小分子藥物候選物。
這項研究意味著什么?簡單來說,人體內(nèi)大約有2萬多種蛋白質(zhì),其中很多與疾病相關(guān),但目前已成功研發(fā)出藥物的靶點不到10%。傳統(tǒng)藥物研發(fā)周期長、成本高,尤其對于結(jié)構(gòu)未知或研究較少的蛋白質(zhì),尋找有效藥物猶如大海撈針。而DrugCLIP的出現(xiàn),相當(dāng)于為整個“蛋白質(zhì)宇宙”繪制了一張“潛在藥物地圖”。
方法革新:不再精打細(xì)算,而是看對眼
AI 如何在一天內(nèi)跑完人類十年的路?想象一下,你手里有一張藏寶圖(人類基因組),上面標(biāo)記了 20,000 個寶箱(蛋白質(zhì))。你的任務(wù)是為每個寶箱找到一把能打開它的鑰匙(藥物分子)。在過去,這就像是一個笨手笨腳的鎖匠,拿著成千上萬把鑰匙,一把接一把地插進(jìn)鎖孔,左右擰動,聽聽聲音,再換下一把。這個過程叫分子對接,既昂貴又慢得令人發(fā)指。
DrugCLIP采用了完全不同的思路:對比學(xué)習(xí),徹底改變了配鑰匙的邏輯。如果說以前的方法是物理試錯,那么 DrugCLIP 就是“人臉識別”。它不需要真的把鑰匙插進(jìn)去試,只需要看一眼鎖孔,看一眼鑰匙,就能瞬間告訴你:這對能成!
研究人員將蛋白質(zhì)口袋和小分子分別用兩個神經(jīng)網(wǎng)絡(luò),轉(zhuǎn)換成高維向量(可理解為一種數(shù)學(xué)特征),通過訓(xùn)練使能夠結(jié)合的“蛋白質(zhì)-分子”對的向量,在空間里靠得更近,不能結(jié)合的則離得更遠(yuǎn)。這就像是教AI辨認(rèn)“哪些鎖和哪些鑰匙是配套的”,而不是精確計算每一把鑰匙的齒形。
![]()
DrugCLIP 框架
這種方法帶來驚人的效率提升:僅用8塊A100 GPU,在24小時內(nèi)就完成了對約1萬個人類蛋白質(zhì)與5億個小分子之間,超過10萬億次配對評估,比傳統(tǒng)分子對接方法快一千萬倍以上。
實驗驗證:從已知靶點到“無中生有”
研究團(tuán)隊不僅在計算機(jī)數(shù)據(jù)集上驗證了DrugCLIP的準(zhǔn)確性,還進(jìn)行了實實在在的濕實驗驗證。
針對經(jīng)典靶點:對于精神疾病相關(guān)的靶點5HT?A受體和去甲腎上腺素轉(zhuǎn)運蛋白(NET),DrugCLIP從化合物庫中篩選出的候選分子,在實驗中表現(xiàn)出高效的結(jié)合或抑制活性。其中兩個NET抑制劑的結(jié)合結(jié)構(gòu),還通過冷凍電鏡技術(shù)得以解析,證實了預(yù)測的可靠性。
挑戰(zhàn)“最難靶點”:研究人員選擇了一個極具挑戰(zhàn)的目標(biāo)——TRIP12。這是一種與癌癥和神經(jīng)退行性疾病相關(guān)的蛋白質(zhì),此前既沒有實驗測定的完整結(jié)構(gòu),也未有報道的小分子抑制劑。團(tuán)隊僅使用AlphaFold2預(yù)測的蛋白質(zhì)結(jié)構(gòu),利用DrugCLIP進(jìn)行篩選。在后續(xù)實驗測試的57個候選分子中,有10個顯示出了結(jié)合活性,命中率高達(dá)17.5%。其中兩個先導(dǎo)化合物更在功能實驗中顯示出對TRIP12酶活的抑制作用。
賦能“暗基因組”:為一半人類蛋白質(zhì)提供潛在藥物線索。這項研究最宏大的成果,是完成了首次真正意義上的“全基因組規(guī)模虛擬篩選”。團(tuán)隊將篩選結(jié)果構(gòu)建成名為 GenomeScreenDB 的開放數(shù)據(jù)庫(訪問地址:https://drugclip.com),向全世界公開。
數(shù)據(jù)庫涵蓋了約1萬個人類蛋白質(zhì),超過2萬個潛在結(jié)合口袋,以及200多萬個預(yù)測具有結(jié)合潛力的分子信息,其覆蓋的蛋白質(zhì)靶點數(shù)量是現(xiàn)有最大生化活性數(shù)據(jù)庫ChEMBL的兩倍多,接近人類蛋白質(zhì)編碼基因的一半。
這意味著,大量此前從未被研究過,或缺乏藥物開發(fā)線索的“暗基因組”靶點,首次有了基于人工智能預(yù)測的化學(xué)起點,為開發(fā)針對罕見病、疑難疾病的新藥提供了前所未有的信息資源。
![]()
DrugCLIP 能夠進(jìn)行全基因組虛擬篩選
AI如何重塑新藥發(fā)現(xiàn)起點
DeepMind的AlphaFold成功預(yù)測了幾乎所有人類蛋白質(zhì)的結(jié)構(gòu)——這意味著我們一夜之間擁有了所有寶箱的 3D 模型。但很快,科學(xué)家們陷入了尷尬的AlphaFold悖論:我們看清了鎖的樣子,卻依然造不出鑰匙。傳統(tǒng)的藥物篩選方法算力消耗太大。要在數(shù)億個化合物中,為人體內(nèi)成千上萬個蛋白質(zhì)尋找匹配對象,用現(xiàn)有的超級計算機(jī)跑,可能需要幾十年甚至更久。
研究團(tuán)隊敏銳地捕捉到了這個痛點,致力于將篩選效率提升至“光速”量級,讓AlphaFold的巨大結(jié)構(gòu)寶庫真正轉(zhuǎn)化為藥物發(fā)現(xiàn)的動能。在蛋白質(zhì)結(jié)構(gòu)預(yù)測革命之后,人工智能正向下一階段邁進(jìn)——將海量結(jié)構(gòu)信息大規(guī)模、高效率地轉(zhuǎn)化為藥物研發(fā)的直接推動力。它不僅極大降低了早期藥物發(fā)現(xiàn)的成本和門檻,使得更多科研機(jī)構(gòu)能夠參與到靶點探索中,更重要的是,它為整個生物醫(yī)學(xué)界提供了一張指向“未知藥物大陸”的航海圖。
當(dāng)然,虛擬篩選的預(yù)測結(jié)果仍需后續(xù)嚴(yán)格的實驗驗證和漫長的臨床開發(fā)。但毋庸置疑,這種能夠為萬種蛋白質(zhì)快速“海選”配體的能力,正在將新藥研發(fā)的起點,從一個一個靶點的“孤島探索”,推向全景式、系統(tǒng)化的“星系測繪”新時代。
論文信息
發(fā)布期刊 Science
發(fā)布時間 2026年1月8日
文章標(biāo)題 Deep contrastive learning enables genome-wide virtual screening
(DOI:10.1126/science.ads9530)
![]()
吳歐、郭郭 | 編輯
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.