![]()
全基因組關(guān)聯(lián)研究( GWAS )已經(jīng)發(fā)現(xiàn)了數(shù)千個(gè)與復(fù)雜疾病相關(guān)的遺傳位點(diǎn),但絕大多數(shù)位于非編碼區(qū)域,其功能機(jī)制仍難以解釋。近年來(lái),基于人工智能( AI )的深度學(xué)習(xí)模型,如 Enformer ,能夠通過(guò) DNA 序列預(yù)測(cè)基因調(diào)控活性,為 解析非 編碼遺傳變異功能提供了新的方向。然而,這類(lèi)基礎(chǔ)模型通常基于廣泛的通用數(shù)據(jù)進(jìn)行訓(xùn)練,缺乏疾病和組織特異性的調(diào)控背景,因此在癌癥等復(fù)雜疾病中的應(yīng)用仍存在局限性。
近日, Vanderbilt University Medical Center 的Qing Li所在的XingyiGuo教授 團(tuán)隊(duì),與 University of Calgary 的QuanLong教授團(tuán)隊(duì)共同開(kāi)發(fā)了一種基于遷移學(xué)習(xí)( transfer learning )的人工智能( AI )框架,并在PLOS Genetics發(fā)表研究成果 ,題目為Tissue-specific transfer learning improves functional variant and therapeutic target discoveries in breast and prostate cancer。該框架用于構(gòu)建乳腺癌和前列腺癌組織特異性的基因調(diào)控模型,通過(guò)將預(yù)訓(xùn)練的Enformer模型進(jìn)一步適配于癌癥相關(guān)組織環(huán)境,顯著提升了癌癥風(fēng)險(xiǎn)基因及功能性遺傳變異的識(shí)別能力。
![]()
該研究首先收集了大量組織特異性的轉(zhuǎn)錄因子 ChIP-seq 數(shù)據(jù)集,包括 275 個(gè)乳腺組織數(shù)據(jù)集和 357 個(gè)前列腺組織數(shù)據(jù)集,并基于這些數(shù)據(jù)對(duì) Enformer 模型進(jìn)行遷移學(xué)習(xí)訓(xùn)練。研究人員隨后利用新模型,對(duì)數(shù)百萬(wàn)個(gè) GWAS 遺傳變異進(jìn)行了組織特異性順式調(diào)控活性( cis-regulatory activity )評(píng)分,識(shí)別出最可能影響癌癥風(fēng)險(xiǎn)的關(guān)鍵調(diào)控變異。
進(jìn)一步分析發(fā)現(xiàn),經(jīng)過(guò)遷移學(xué)習(xí)優(yōu)化后的模型,在富集癌癥相關(guān)增強(qiáng)子、 ClinVar 致病變異以及 GWAS 風(fēng)險(xiǎn)位點(diǎn)方面均明顯優(yōu)于原始 Enformer 模型。隨后,研究團(tuán)隊(duì) 結(jié)合全轉(zhuǎn)錄組關(guān)聯(lián) 分析( TWAS ),系統(tǒng)鑒定了多個(gè)與乳腺癌和前列腺癌相關(guān)的候選風(fēng)險(xiǎn)基因。這些基因不僅在癌細(xì)胞生長(zhǎng)中具有重要功能,還富集于已知癌癥相關(guān)通路,并具有潛在藥物靶點(diǎn)價(jià)值。
研究結(jié)果表明,遷移學(xué)習(xí)模型在識(shí)別具有臨床相關(guān)性的疾病基因方面顯著優(yōu)于基礎(chǔ)模型。其中,多數(shù)優(yōu)先識(shí)別的基因同時(shí)獲得了功能基因組學(xué)( DepMap )、疾病數(shù)據(jù)庫(kù)( DisGeNET )以及藥物數(shù)據(jù)庫(kù)等多維度證據(jù)支持,說(shuō)明該方法能夠更加精準(zhǔn)地解析癌癥相關(guān)遺傳調(diào)控機(jī)制。
該研究展示了如何通過(guò) “ 疾病特異性數(shù)據(jù) ” 對(duì)現(xiàn)有 AI 基礎(chǔ)模型進(jìn)行再訓(xùn)練,從而顯著提升復(fù)雜疾病中功能基因和遺傳變異的發(fā)現(xiàn)能力。該框架不僅適用于乳腺癌和前列腺癌,也為其他復(fù)雜疾病的 AI 調(diào)控建模提供了可推廣的新思路。
原文鏈接:https://doi.org/10.1371/journal.pgen.1012145
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.