亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網易首頁 > 網易號 > 正文 申請入駐

人工智能在罕見病藥物研發(fā)中的應用現狀

0
分享至

摘要

目的:對人工智能(AI)在罕見病藥物研發(fā)領域中的應用研究進行范圍綜述,系統(tǒng)梳理其應用場景、研究現狀及局限性,為后續(xù)研究提供參考。

方法:系統(tǒng)搜索Web of Science、PubMed、IEEE Xplore、中國知網、萬方、維普數據庫自建庫以來至2025年12月31日AI應用于罕見病藥物研發(fā)的相關研究,依據納入和排除標準篩選文獻,提取文獻信息并進行文獻計量分析。

結果:共檢索出565篇文獻,最終納入38篇,涵蓋15個國家33種罕見病,其中罕見遺傳病占比最高(36%);納入文獻中,15項研究關注藥物再利用領域,10項研究使用了隨機森林算法,17項研究以提升分析任務的表現為目的,29項研究模型訓練數據來源于數據庫數據;當前AI應用于罕見病藥物研發(fā)面臨的主要挑戰(zhàn)為可研究的樣本量小(35%)和疾病機制研究有限(15%)。

結論:藥物再利用是AI用于罕見病藥物研發(fā)的主要領域,罕見遺傳病和罕見神經系統(tǒng)疾病或為AI輔助罕見病藥物研發(fā)的突破方向,數據庫數據為模型訓練的主要數據來源,數據量不足和罕見病的相關機制研究有限是AI輔助罕見病藥物研發(fā)的主要障礙。

正文

罕見病指發(fā)病率低于特定閾值的疾病,世界衛(wèi)生組織將其定義為患病人數占總人口0.65‰至1‰的疾病或病變[1]。據Orphanet數據庫顯示,全球目前已識別出7265種罕見病[2],其累計患病率在3.5%至5.9%之間,影響了全球4億多人[3-5]。然而,罕見病藥物研發(fā)卻困難重重。一方面,大多數罕見病的發(fā)病機制尚不明確,難以確定新的治療靶點[6];另一方面,罕見病患者群體較小且分散,導致開展臨床研究以及獲取必要的研究數據難度較大[7]。全球范圍內,僅約5%的罕見病具有有效的治療手段[8],但即便是對于已有治療方法的罕見病,由于市場規(guī)模小、藥物研發(fā)投入成本大,其治療藥物往往價格高昂,給患者帶來沉重的經濟負擔[9]。

解決當前藥物研發(fā)阻礙的一個有效方法是利用人工智能(artificial intelligence, AI)技術。AI是研究使用計算機模擬人的思維過程和智能行為的一門綜合科學[10],隨著醫(yī)療領域數據量激增及數據趨向于結構化的特征,AI已經深度參與到醫(yī)療保健的多個領域中,包括疾病篩查和診斷[11]、預后分析[12]、住院時間預測[13]、死亡率預測[14]和藥物研發(fā)[15]等,但是對于已確診的罕見病患者來說,其治療需求更為迫切[16]。目前,已有若干綜述對AI在罕見病的篩查、診斷和預后的應用進行了歸納和總結[17-19],而針對罕見病治療藥物研發(fā)這一關鍵環(huán)節(jié)仍缺乏系統(tǒng)性總結。本綜述旨在探討AI技術在罕見病的藥物研發(fā)中的應用現狀,包括罕見病類型、藥物研發(fā)的細分領域、所用算法、研究目的、模型訓練所依賴的數據類型,以及未來可能面臨的挑戰(zhàn),為后續(xù)研究與實踐提供參考。

資料與方法

文獻納入與排除標準

本研究遵循《系統(tǒng)綜述和Meta分析優(yōu)先報告項目-分析范圍綜述拓展》(Preferred Reporting Items for Systematic reviews and meta-Analyses extension for scoping reviews,PRISMA-ScR)指南。納入標準:(1)研究主題。涉及使用AI技術應用于罕見病藥物研發(fā)的原創(chuàng)性文章。(2)概念。技術層面:利用機器學習(machine learning,ML)和深度學習等方法,構建用于罕見病藥物研發(fā)的AI模型。應用層面:將罕見病的發(fā)病機制與AI技術相結合,為罕見病的藥物研發(fā)提供潛在的靶點或藥物。

排除標準:(1)非中、英文文獻;(2)未在同行評議的期刊或會議記錄上發(fā)表(如會議論文、預印本、學位論文);(3)非原創(chuàng)性文章(如綜述、社論、立場文件、案例研究);(4)非罕見病領域的文章;(5)非藥物研發(fā)的文章;(6)未利用AI算法;(7)非治療相關文章(如診斷和預后)。

檢索策略

計算機系統(tǒng)檢索Web of Science、PubMed、IEEE Xplore、中國知網、萬方、維普數據庫,以主題詞與自由詞相結合的方法進行檢索,檢索范圍為標題、摘要及關鍵詞等常用字段,檢索時限均為建庫至2025年12月31日。本研究的基本檢索策略:“罕見病”AND“藥物研發(fā)”AND“人工智能”。根據各數據庫的檢索規(guī)則與字段設置,對檢索策略進行了適應性調整。以PubMed數據庫為例,本研究采用該數據庫特有的MeSH詞進行檢索,基本檢索詞為“rare diseases/therapy[Mesh]”“drug therapy[Mesh]”AND“artificial intelligence[Mesh]”,同時為了全面檢索AI領域的文章,本研究添加了AI相關的所有自由詞(Entry terms)。

文獻篩選及資料提取

兩位經過高校系統(tǒng)培訓的研究者獨立進行文獻篩選,首先將檢索出的所有文獻導入NoteExpress3.5進行統(tǒng)計,去重后通過閱讀文獻標題及摘要排除不符合標準的文獻,完成初篩;其次查閱并下載符合標準的文獻進行全文篩查,對意見不一致的文獻交由第三位研究者評價后討論決定,最終確定納入的文獻。文獻提取的信息包括:作者、發(fā)表年份、開展研究的國家(第一作者所在單位的所屬地區(qū))、罕見病(使用Orphanet官網定義的疾病名稱和編碼)、罕見病組、藥物研發(fā)的細分領域、AI算法、使用AI輔助藥物研發(fā)的目的、模型訓練的數據來源和AI在罕見病藥物研發(fā)中的挑戰(zhàn)。

結果

文獻篩選

通過數據庫檢索和追溯的參考文獻,共檢索出了565篇研究,排除重復文獻,通過閱讀文章標題和摘要初步篩選得到219篇文獻,進一步閱讀全文后排除85篇非罕見病領域文獻、38篇非藥物研發(fā)文獻、17篇非AI相關文獻、39篇非治療相關文獻、2篇案例研究,最終納入38篇文獻。文獻篩選流程見圖1。


納入研究的基本特征

納入研究發(fā)表于2019―2025年,結果顯示,2024年發(fā)文數量相比前幾年有較大提高,納入研究的國家分別為美國(n=12)、中國(n=7)、德國(n=3)、日本(n=3)、西班牙(n=2)和意大利(n=2)等,其余國家均為1篇。發(fā)文趨勢見圖2。


對納入的38篇文獻[21-58]進行統(tǒng)計,發(fā)現關注的罕見病包括特發(fā)性肺纖維化、戈謝病、常染色體顯性多囊腎病等33種罕見病(部分文章可能同時研究多個罕見病)。本研究使用Orphanet官網分類中定義的疾病的“優(yōu)先所屬級”將納入的罕見病歸類至罕見病組。涉及最多的罕見病組為罕見遺傳病(n=16),占比36%,此外還包括罕見神經系統(tǒng)疾病(n=4)、罕見血液病(n=5)、罕見呼吸系統(tǒng)疾病(n=3)、罕見全身性疾病或風濕性疾病(n=3)、罕見先天性代謝性缺陷病(n=2)、罕見心臟病(n=1)、罕見腫瘤性疾病(n=1)、罕見骨病(n=1)和罕見內分泌疾病(n=1),還有7篇研究未明確報道具體的罕見病類型。納入研究的基本特征見表1。







藥物研發(fā)領域

按照研究領域對納入的38篇文獻進行統(tǒng)計,共得到藥物再利用、靶點發(fā)現、基因組學等43個研究領域(部分文章可能同時研究多個領域)。經兩位研究人員對其歸納,發(fā)現納入文獻聚焦于藥物發(fā)現、藥品臨床前研究和臨床研究三大藥物研發(fā)階段。其中,藥物發(fā)現階段占比91%(n=39),臨床前研究階段占比7%(n=3),臨床研究階段占比1%(n=1),這一趨勢印證了藥物發(fā)現階段是AI應用于罕見病藥物研發(fā)的重點方向。值得注意的是,在藥物發(fā)現階段,有15篇研究關注藥物再利用(又稱藥物重定位)領域[22, 24-26, 28-31, 36, 37, 42, 45, 49, 52, 58],7篇關注藥物靶點發(fā)現領域[21, 29, 41, 43, 47, 50, 54],6篇關注基因組學領域[23, 34, 35, 44, 51, 57]。此外,還包括與罕見病相關的先導化合物發(fā)現[27, 53, 56],虛擬篩選[27, 33, 42],蛋白組學[30, 41],小分子藥物設計[55],轉錄組學[46],細胞表型[40],吸收、分布、代謝、排泄和毒性(ADMET)預測[39],藥物相互作用[32],藥代動力學[48],藥物臨床有效性預測[38]。見圖3。


使用AI的算法和目的

在納入的38篇文獻中,共識別出36種總計86個算法(一篇研究通常會同時使用多種算法)。使用較多的算法為隨機森林(random forest,RF)(n=10)、支持向量機(support vector machine,SVM)(n=8)、貝葉斯(Bayesian)(n=7)、極端梯度提升(exterme gradient boosting,XGBoost)(n=5)、邏輯回歸(logistic regression,LR)(n=4)和決策樹(decision tree,DT)(n=4)。使用算法類型見圖4A。


納入文章共識別出42個AI在罕見病藥物研發(fā)的目的(部分研究含多個目的),經兩位研究人員歸納后,發(fā)現納入文獻聚焦于提高分析任務的性能(n=17,占比40%)、概念驗證(n=9)、加速藥物再利用(n=9)、解決數據缺乏問題(n=5)、減少人工操作(n=2)5類目的,見圖4B。提高分析任務的性能可解釋為研究者通過利用AI開發(fā)了一個模型或框架來更準確地預測了所研究問題(如靶標與靶點的親和力)的表現。概念驗證可解釋為研究者將已有的深度學習架構應用于自己的分析任務,未根據目標分析任務或數據類型的特性對模型架構進行修改。加速藥物再利用可解釋為通過知識圖譜等方法研究藥物重定位問題。解決數據缺乏問題可解釋為通過如聚類算法和預訓練模型等方法解決研究的樣本量小的問題。減少人工操作可解釋為通過虛擬篩選等方法進行藥物虛擬篩選,以減少人工實驗的時間和成本。

數據來源和挑戰(zhàn)

從納入的38篇研究中共識別出46個模型訓練的數據來源(部分研究可能使用多個數據源),可將其歸納為6類,包括數據庫來源(n=29),使用的數據庫包括NCBI、RCSB PDB、ChEMBL、DrugBank、PubChem、GEO等藥物研發(fā)領域經典的蛋白質和分子數據庫;文獻數據(n=5),文獻數據一般來自PubMed等文獻數據庫;還有實驗獲得的數據(n=5)、組學數據(n=4)、來自醫(yī)院的真實數據(n=2),一般為多模態(tài)數據,如基因檢測結果、磁共振成像、計算機斷層掃描、腦電圖等;人口數據(n=1),如患者的年齡、性別、疾病類型等。模型訓練的數據來源見圖4C。

從納入的38篇文獻中統(tǒng)計發(fā)現48個總計9類AI輔助罕見病藥物研發(fā)的挑戰(zhàn)(一篇文獻可能提出多個挑戰(zhàn))。其中,35%的文獻提到目前該領域存在的挑戰(zhàn)是數據不足或樣本量小(n=17),原因可能是罕見病的相關文獻缺乏,無法形成大規(guī)模的全面的知識體系,可見數據量已經成為AI在罕見病中運用的首要挑戰(zhàn);此外,15%的文獻(n=7)指出,當前罕見病機制研究等基礎研究不足,限制了AI在罕見病的藥物研發(fā)中的應用;其他挑戰(zhàn)還包括AI預測的結果仍需實驗驗證(n=5)、可選擇的算法有限(n=2)、模型缺乏可解釋性(n=2)、算法的準確性有待提高(n=2)、正負樣本數據量不平衡(n=1)、算法的魯棒性有待提高(n=1)、數據質量不高(n=1)等。綜上,數據、算法、罕見病相關機制研究是限制AI在罕見病藥物研發(fā)中應用的三大主要方面。見圖4D。

3

隨著大語言模型的出現與快速迭代,AI已經深入到藥物研發(fā)的全流程[59-64]。相較于其他疾病領域中AI輔助藥物研發(fā)的廣泛應用,AI在罕見病領域的應用相對有限[65, 66]。本研究結果顯示,面向AI用于罕見病藥物研發(fā)的研究直到2019年才出現。國家分布上,美國相關研究數量最多,中國次之,但總體上各國在該領域的研究規(guī)模均處于較低水平。疾病類型方面,罕見遺傳病在納入研究中占比相對較高,這與多數復雜罕見病屬于遺傳性基因疾病的特征相符:據報道,約80%的罕見病由基因缺陷或突變所致[2]。從研究目的來看,約40%的文獻旨在提高分析模型的性能,此類研究多與現有模型進行對比,以提高模型的魯棒性、準確度和精確率等指標;而針對罕見病核心痛點——數據稀缺問題開展算法開發(fā)的研究僅有5篇,從側面反映出將AI技術應用于罕見病藥物研發(fā)的現實挑戰(zhàn)與難度。算法層面,現有模型訓練仍以傳統(tǒng)機器學習算法為主,深度學習應用相對有限,這或許與深度學習對數據量要求高有關,而數據稀缺正是罕見病藥物研發(fā)的關鍵瓶頸。數據來源層面,模型訓練中的數據多來源于數據庫,可能與公開數據庫中數據可獲得性高有關。

在罕見病藥物研發(fā)中,藥物再利用是主要領域。鑒于多數罕見病發(fā)病率低、研究樣本量小、罕見病發(fā)病機制難以確定,以及臨床試驗人數不足和市場預期規(guī)模較小等原因,罕見病的新藥研發(fā)面臨諸多挑戰(zhàn)[67-72]。藥物再利用作為解決上述困境的重要策略,可為已批準或正在研究的藥物發(fā)掘新的治療用途[73]。此外,AI算法尤其是知識圖譜和深度學習網絡可依據藥物靶點的表型特征和小分子化合物的結構特征,從現有藥物中尋找潛在的候選化合物,實現老藥新用,或拓展已有藥物的適應證以及構建聯合用藥方案[74]。AI賦能下的藥物再利用研究可大幅縮短罕見病治療藥物的研發(fā)周期、降低成本,提高罕見病藥物研發(fā)的效率[75]。

盡管AI在罕見病藥物研發(fā)中展現出巨大潛力,但當前仍面臨許多挑戰(zhàn)。第一,高質量數據匱乏。研究結果顯示,35%的研究指出模型訓練的樣本量不足的問題。算法需要依賴大規(guī)模高質量數據進行訓練并做出準確預測,而罕見病因發(fā)病率低、可用于研究和臨床試驗的患者群體規(guī)模有限,以及公開數據庫中缺乏藥物與靶點之間的非活性數據和陰性樣本,導致模型的準確性和魯棒性均有待提高。針對罕見病數據稀缺問題,可采用自監(jiān)督預訓練或遷移學習等策略,圖片樣本可以使用數據增強方法,或利用VGG16、ResNet等預訓練模型。第二,罕見病的病理生理機制研究不足。本研究中15%的研究提出罕見病的機制研究不足。由于罕見病的發(fā)病機制較為復雜,通常情況下,單一疾病也會出現不同的遺傳、分子和臨床表型,這對開發(fā)針對罕見病不同亞型的靶向療法提出了挑戰(zhàn)。同時,疾病機制研究的不明確使得在藥物再利用研究中,知識圖譜等方法能夠利用的文獻數量有限,無法構建大規(guī)模的全面的知識體系,從而限制了罕見病藥物再利用和多重藥理學的發(fā)展。第三,模型預測結果仍需實驗驗證。多數AI模型內部機制呈“黑箱”特征,預測過程缺乏可解釋性,難以明確關鍵特征與決策依據,不利于解析罕見病的分子機制與疾病本質。因此,AI無法替代傳統(tǒng)實驗驗證環(huán)節(jié),經模型預測得到的候選分子與蛋白質活性,仍需通過實驗室研究與臨床試驗進一步確證。

本研究存在一定局限性。首先,研究聚焦于AI在罕見病藥物研發(fā)中的應用,納入的文章局限于罕見病治療領域,由于該主題相關研究數量有限,所以未將期刊影響因子等文獻質量指標納入篩選標準,這可能對綜述結果產生一定影響。其次,檢索過程未將Orphant官網報道的7000余種罕見病全部作為檢索詞,可能限制了相關文獻的篩選范圍。最后,本研究的文獻納入標準僅涵蓋中英文語種,這可能造成部分相關文獻的遺漏。

參考文獻

詳見《中國新藥與臨床雜志》, 2026年2月,第45卷第2期

識別微信二維碼,添加生物制品圈小編,符合條件者即可加入

生物制品微信群!

請注明:姓名+研究方向!

本公眾號所有轉載文章系出于傳遞更多信息之目的,且明確注明來源和作者,不希望被轉載的媒體或個人可與我們聯系(cbplib@163.com),我們將立即進行刪除處理。所有文章僅代表作者觀點,不代表本站立場。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網傳“雷軍被堵車里維權”,小米徐潔云回應

網傳“雷軍被堵車里維權”,小米徐潔云回應

新浪財經
2026-04-20 00:33:19
維斯塔潘:目前還不知道故障的原因,賽車整體狀態(tài)讓我很滿意

維斯塔潘:目前還不知道故障的原因,賽車整體狀態(tài)讓我很滿意

懂球帝
2026-04-20 00:11:10
7年敗光2億!鄒市明冉瑩穎共同發(fā)文:二人最終還是邁出了這一步!

7年敗光2億!鄒市明冉瑩穎共同發(fā)文:二人最終還是邁出了這一步!

拳擊時空
2026-04-16 06:04:48
互聯網是有記憶的,她的黑歷史一大堆啊!

互聯網是有記憶的,她的黑歷史一大堆啊!

BenSir本色說
2026-04-15 22:38:07
3.0T!寶馬新車官宣:4月24日,正式亮相

3.0T!寶馬新車官宣:4月24日,正式亮相

高科技愛好者
2026-04-19 23:11:48
鄭麗文和家人的一張合影,時間是1971年,地點是眷村。

鄭麗文和家人的一張合影,時間是1971年,地點是眷村。

葉老四
2026-04-15 09:44:36
高崗不出事,可以授予元帥嗎?肯定可以,而且排名會比較靠前

高崗不出事,可以授予元帥嗎?肯定可以,而且排名會比較靠前

歷來縱橫
2026-04-14 20:43:24
金像獎2026:梁家輝五封影帝,廖子妤擊敗章子怡奪影后

金像獎2026:梁家輝五封影帝,廖子妤擊敗章子怡奪影后

金風說
2026-04-20 07:26:28
轉告家里所有人:門外一喊這幾句,馬上提高警惕,很多人已上當

轉告家里所有人:門外一喊這幾句,馬上提高警惕,很多人已上當

荷蘭豆愛健康
2026-04-20 06:17:00
英超最新積分戰(zhàn)報 阿森納又悲劇?曼城拿下榜首大戰(zhàn)奪爭冠主動權

英超最新積分戰(zhàn)報 阿森納又悲劇?曼城拿下榜首大戰(zhàn)奪爭冠主動權

狂言體育
2026-04-20 07:40:44
伊朗宣布對所有商船開放霍爾木茲海峽

伊朗宣布對所有商船開放霍爾木茲海峽

環(huán)球網資訊
2026-04-17 21:29:34
現場開炮!波蘭議員當眾嘲諷以色列:看好了,你們國旗長這樣才對

現場開炮!波蘭議員當眾嘲諷以色列:看好了,你們國旗長這樣才對

諦聽骨語本尊
2026-04-15 18:13:09
接父母來城里養(yǎng)老90天,我才明白:沒退休金的老人,孝順也養(yǎng)不起

接父母來城里養(yǎng)老90天,我才明白:沒退休金的老人,孝順也養(yǎng)不起

木子言故事
2026-04-19 10:47:16
《八千里路云和月》大結局,田家泰犧牲,七哥的真正身份曝光

《八千里路云和月》大結局,田家泰犧牲,七哥的真正身份曝光

看盡落塵花q
2026-04-19 23:49:01
女演員千萬別整容《八千里路云和月》看43歲萬茜和24歲王和就知道

女演員千萬別整容《八千里路云和月》看43歲萬茜和24歲王和就知道

亦暖追劇隨筆
2026-04-17 12:28:50
大爆發(fā)!上海,再迎交通利好!

大爆發(fā)!上海,再迎交通利好!

新浪財經
2026-04-19 19:10:24
小米 YU9 要來了,外觀真的猛!

小米 YU9 要來了,外觀真的猛!

花果科技
2026-04-17 13:44:41
欺下媚上的中國人

欺下媚上的中國人

虔青
2026-04-19 17:34:03
金像獎上最耀眼的5位明星,個個拿獎,實至名歸,皆被觀眾喜愛

金像獎上最耀眼的5位明星,個個拿獎,實至名歸,皆被觀眾喜愛

叨嘮
2026-04-20 03:23:05
樹倒猢猻散!峰學未來翻天了, 大鵬高調離職反踩一腳, 張姩菡不忍

樹倒猢猻散!峰學未來翻天了, 大鵬高調離職反踩一腳, 張姩菡不忍

阿鳧愛吐槽
2026-04-16 06:07:04
2026-04-20 08:55:00
藥時空 incentive-icons
藥時空
生物制藥行業(yè)相關資訊
4478文章數 130關注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發(fā)飆了

頭條要聞

牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發(fā)飆了

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內娛隔空掀桌第一人

財經要聞

月之暗面IPO迷局

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

健康
本地
藝術
時尚
公開課

干細胞抗衰4大誤區(qū),90%的人都中招

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

藝術要聞

鄭麗文手稿返臺,書圣時代是否重現?驚人細節(jié)曝光!

今年最流行的衣服竟然是它?高級又氣質!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版