撰文丨王聰
編輯丨王多魚(yú)
排版丨水成文
在蛋白質(zhì)科學(xué)領(lǐng)域,從蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)到蛋白質(zhì)從頭設(shè)計(jì),技術(shù)發(fā)展日新月異,從 AlphaFold 到 RFdiffusion,各種強(qiáng)大的 AI 工具層出不窮。 然而,對(duì)于大多數(shù)實(shí)驗(yàn)室科學(xué)家來(lái)說(shuō),這些工具的使用門(mén)檻卻高得令人望而卻步。 此外,每個(gè) AI 工具都有自己獨(dú)特的安裝要求、運(yùn)行環(huán)境和數(shù)據(jù)格式,將它們整合到一個(gè)連貫的工作流程中,需要深厚的計(jì)算專(zhuān)業(yè)知識(shí)。
值得一提的是,GYDE 免費(fèi)向?qū)W術(shù)界和工業(yè)界的蛋白質(zhì)研究科學(xué)家開(kāi)放,助力構(gòu)建符合個(gè)性化需求的藥物發(fā)現(xiàn)分析平臺(tái)。
2026 年 3 月 27 日,基因泰克(Genentech)公司的研究人員在預(yù)印本平臺(tái) bioRxiv 上發(fā)表了題為:GYDE: A collaborative drug discovery platform for AI-powered protein design and engineering 的研究論文。
基因泰克推出了一個(gè)開(kāi)源、多功能、基于網(wǎng)絡(luò)的協(xié)作平臺(tái)——GYDE(Guide Your Design and Engineering),旨在讓實(shí)驗(yàn)室科學(xué)家只需點(diǎn)擊鼠標(biāo)即可調(diào)動(dòng)前沿 AI 模型,輕松進(jìn)行蛋白質(zhì)和抗體的計(jì)算分析和設(shè)計(jì)。
GYDE 通過(guò)深度整合的可視化界面支持序列-結(jié)構(gòu)-功能關(guān)系的探索,使研究人員能夠通過(guò)真實(shí)實(shí)驗(yàn)數(shù)據(jù)或計(jì)算工具全面解析蛋白質(zhì)功能決定因素。其直觀接口可無(wú)縫對(duì)接用于蛋白質(zhì)/抗體結(jié)構(gòu)預(yù)測(cè)、設(shè)計(jì)與下游分析的前沿 AI 模型。通過(guò)采用 Slivka 計(jì)算 API,平臺(tái)可靈活便捷地集成新工具與模型。該平臺(tái)還支持會(huì)話保存功能,方便研究者與其他用戶(hù)共享研究發(fā)現(xiàn),從而構(gòu)建更具協(xié)作性的科研社區(qū)。
![]()
實(shí)驗(yàn)室科學(xué)家的困境
現(xiàn)代藥物發(fā)現(xiàn)越來(lái)越依賴(lài)計(jì)算工具和 AI 模型,AlphaFold、RosettaFold、OpenFold 等 AI 模型現(xiàn)在已被常規(guī)用于預(yù)測(cè)新型蛋白質(zhì)結(jié)構(gòu)、可能影響蛋白質(zhì)功能的構(gòu)象變化以及蛋白質(zhì)與其他分子之間的相互作用。ProteinMPNN、BindCraft、RFdiffusion 等 AI 模型則能夠?qū)崿F(xiàn)治療性多肽、迷你蛋白和抗體的從頭設(shè)計(jì)。
然而,AI 工具開(kāi)發(fā)的速度之快以及計(jì)算復(fù)雜性的增加,給計(jì)算科學(xué)家和非計(jì)算科學(xué)家都帶來(lái)了巨大挑戰(zhàn)。此外,每個(gè) AI 工具都構(gòu)建方式不同,難以在同一計(jì)算環(huán)境中協(xié)同工作。
要將這些工具連接起來(lái)供實(shí)驗(yàn)室科學(xué)家使用,需要大量的技術(shù)專(zhuān)業(yè)知識(shí)和 IT 投入。即使所有平臺(tái)都安裝好了,第二個(gè)挑戰(zhàn)是每個(gè)工具的學(xué)習(xí)曲線,因?yàn)樗鼈兺ǔJ菫樘囟康脑O(shè)計(jì)的,而不是為了連續(xù)的工作流程。這些問(wèn)題使得協(xié)作或連續(xù)工作流程變得更加困難。商業(yè)解決方案雖然提供端到端的解決方案,但通常伴隨著非技術(shù)限制,例如昂貴的授權(quán)許可、專(zhuān)有代碼庫(kù)以及可能落后于新工具發(fā)布計(jì)劃的有限可定制性。
GYDE 的設(shè)計(jì)原則
該研究中推出的GYDE(Guide Your Design and Engineering),是一個(gè)開(kāi)源、多功能且基于網(wǎng)絡(luò)的協(xié)作平臺(tái),旨在讓實(shí)驗(yàn)室科學(xué)家能夠輕松進(jìn)行蛋白質(zhì)和抗體的計(jì)算分析。
GYDE 平臺(tái)的設(shè)計(jì)遵循四個(gè)核心原則,這些原則直接針對(duì)上述挑戰(zhàn)——
無(wú)代碼用戶(hù)界面是 GYDE 的首要設(shè)計(jì)原則,與依賴(lài)最終用戶(hù)懂編碼的解決方案不同,GYDE 團(tuán)隊(duì)認(rèn)為無(wú)代碼用戶(hù)界面對(duì)于提高用戶(hù)采用率至關(guān)重要。
序列-結(jié)構(gòu)-功能關(guān)系的緊密集成是蛋白質(zhì)科學(xué)家熟悉的思維框架,GYDE 設(shè)計(jì)的界面允許這三者的集成,在單一環(huán)境中實(shí)現(xiàn)穩(wěn)健分析。
訪問(wèn)最新工具和數(shù)據(jù)是應(yīng)對(duì)計(jì)算結(jié)構(gòu)生物學(xué)領(lǐng)域快速發(fā)展的關(guān)鍵。GYDE 需要一個(gè)靈活的后端服務(wù)運(yùn)行器,允許輕松添加新工具,以便高效評(píng)估和及時(shí)使用。
協(xié)作功能解決了結(jié)構(gòu)、序列和功能數(shù)據(jù)共享的障礙,通過(guò)將用戶(hù)會(huì)話存儲(chǔ)在集成數(shù)據(jù)集中,GYDE 實(shí)現(xiàn)了穩(wěn)健的數(shù)據(jù)存儲(chǔ),并通過(guò)直觀的超鏈接共享功能與協(xié)作者共享。
![]()
GYDE 的網(wǎng)頁(yè)界面
GYDE 平臺(tái)的核心功能
GYDE 的網(wǎng)頁(yè)界面組織成不同但集成的組件,為用戶(hù)提供靈活的操作體驗(yàn)。常用組件默認(rèn)更容易訪問(wèn),主要包括以下七個(gè)核心模塊:
多序列比對(duì)查看器(MSA Viewer)是許多工作流程的起點(diǎn),可以查看蛋白質(zhì)序列。序列可以使用 MAFFT 進(jìn)行蛋白質(zhì)對(duì)齊,或通過(guò)抗體特異性對(duì)齊器如 Absolve 進(jìn)行對(duì)齊,后者注釋互補(bǔ)決定區(qū)域。
結(jié)構(gòu)可視化(Structural Visualization)使用 Mol* Viewer,使用戶(hù)能夠探索與 MSA Viewer 中選擇的一個(gè)或多個(gè)序列相關(guān)的分子結(jié)構(gòu)。MSA 和 Mol* Viewer之間的序列-結(jié)構(gòu)集成通過(guò)序列比對(duì)自動(dòng)標(biāo)準(zhǔn)化序列和結(jié)構(gòu)之間的殘基編號(hào)來(lái)實(shí)現(xiàn)。
繪圖組件(Plotting)支持基于上傳到 GYDE 數(shù)據(jù)表中的數(shù)據(jù)值快速創(chuàng)建直方圖或散點(diǎn)圖。這些數(shù)據(jù)值通常代表正在分析的蛋白質(zhì)或突變體的功能特性。
序列到圖像查看器(Sequence-To-Image Viewer),允許查看許多計(jì)算分析產(chǎn)生的靜態(tài)圖像摘要。例如,像 AlphaFold 這樣的結(jié)構(gòu)預(yù)測(cè)工具會(huì)產(chǎn)生 MSA 覆蓋率和置信度指標(biāo)的圖表。
頻率分析(Frequency Analysis),通過(guò)顯示選定位置或具有選定保守水平的氨基酸分布,幫助識(shí)別保守殘基或過(guò)濾具有特定殘基的序列。
熱圖查看器(Heatmap Viewer),為飽和突變數(shù)據(jù)集提供簡(jiǎn)潔和交互式的可視化,幫助導(dǎo)航和提煉這些復(fù)雜、豐富的數(shù)據(jù)矩陣信息。
序列標(biāo)識(shí)(Sequence logo),集成了序列標(biāo)識(shí)查看器,使用戶(hù)無(wú)需尋求其他軟件即可使用這種常見(jiàn)且信息豐富的蛋白質(zhì)位置變異性可視化方法。
技術(shù)架構(gòu)與集成
GYDE 采用模塊化架構(gòu),有助于隔離用戶(hù)界面、計(jì)算和數(shù)據(jù)管理組件的開(kāi)發(fā),同時(shí)仍允許模塊間通信。
GYDE 服務(wù)器作為系統(tǒng)的中央樞紐,協(xié)調(diào)計(jì)算和數(shù)據(jù)管理操作。它處理與 GYDE UI 發(fā)送和接收數(shù)據(jù)的請(qǐng)求。為了運(yùn)行計(jì)算工具,GYDE 集成了 Slivka 計(jì)算 API,為各種高性能計(jì)算資源提供作業(yè)運(yùn)行器。這種與 Slivka 的集成,使 GYDE 能夠利用外部計(jì)算能力進(jìn)行大規(guī)模數(shù)據(jù)處理和分析,從而增強(qiáng) GYDE 的能力和可擴(kuò)展性。
數(shù)據(jù)模型和管理,是 GYDE 數(shù)據(jù)管理系統(tǒng)的核心。數(shù)據(jù)集作為在具有訪問(wèn)控制的集中存儲(chǔ)庫(kù)中存儲(chǔ)和共享信息的核心單元。這種結(jié)構(gòu)支持實(shí)時(shí)協(xié)作,允許多個(gè)研究人員同時(shí)處理共享項(xiàng)目。
GYDE 數(shù)據(jù)集圍繞靈活的列式數(shù)據(jù)框架設(shè)計(jì),集成了關(guān)鍵元數(shù)據(jù)。該模型高度適應(yīng),支持對(duì)藥物發(fā)現(xiàn)至關(guān)重要的專(zhuān)業(yè)領(lǐng)域特定數(shù)據(jù)類(lèi)型,包括蛋白質(zhì)、DNA 和 RNA 序列,以及像 SMILES 這樣的化學(xué)信息學(xué)格式。
![]()
GYDE 系統(tǒng)架構(gòu)
實(shí)際應(yīng)用案例
GYDE 已在多個(gè)案例研究中得到應(yīng)用,展示了其在蛋白質(zhì)工程和設(shè)計(jì)項(xiàng)目中的實(shí)用性。用戶(hù)報(bào)告了顯著的時(shí)間節(jié)省(在某些情況下從數(shù)天減少到幾分鐘或幾小時(shí))和增強(qiáng)的協(xié)作效率。
單次跨膜多聚體研究中,研究人員使用 AlphaFold2-Multimer 生成蛋白質(zhì)復(fù)合物預(yù)測(cè),基于包含 1381 個(gè)提議相互作用的實(shí)驗(yàn)蛋白質(zhì)組學(xué)數(shù)據(jù)集。通過(guò) GYDE 的數(shù)據(jù)上傳機(jī)制,將這些預(yù)測(cè)和計(jì)算指標(biāo)與實(shí)驗(yàn)篩選值以及關(guān)于相關(guān)蛋白質(zhì)的任何現(xiàn)有結(jié)構(gòu)的公共數(shù)據(jù)庫(kù)知識(shí)合并。
抗體工程工作流程是 GYDE 的另一個(gè)重要應(yīng)用領(lǐng)域,GYDE 平臺(tái)支持抗體特異性工具,例如 Absolve 用于抗體 Fv 編號(hào),Therapeutic Antibody Profiler 用于抗體表面特性分析,以及 ABodyBuilder 用于抗體結(jié)構(gòu)預(yù)測(cè)。
這些工具的集成使研究人員能夠在統(tǒng)一環(huán)境中進(jìn)行端到端的蛋白質(zhì)或抗體的設(shè)計(jì)和優(yōu)化。
![]()
在抗 PD-1 抗體重鏈的ProteinMPNN 序列設(shè)計(jì)工作流程中的GYDE平臺(tái)核心界面
![]()
GYDE 平臺(tái)可實(shí)現(xiàn)從頭生成結(jié)合蛋白
行業(yè)意義
當(dāng)前,蛋白質(zhì)科學(xué)領(lǐng)域正經(jīng)歷快速發(fā)展,在這些技術(shù)進(jìn)步中,GYDE 平臺(tái)的獨(dú)特價(jià)值在于其開(kāi)源和協(xié)作特性,與商業(yè)解決方案不同,GYDE 是免費(fèi)提供給學(xué)術(shù)界和工業(yè)界的科學(xué)家使用的,他們可以根據(jù)自己的需求構(gòu)建定制的藥物發(fā)現(xiàn)分析平臺(tái)。這種開(kāi)放性有助于促進(jìn)更廣泛的科學(xué)社區(qū)協(xié)作,加速科學(xué)進(jìn)步的步伐。
GYDE 平臺(tái)已經(jīng)在其內(nèi)部部署中集成了超過(guò) 20 種不同的計(jì)算工具,包括 AlphaFold、Boltz、Chai、ProteinMPNN、RFdiffusion 等主流 AI 模型,用戶(hù)可以通過(guò)簡(jiǎn)單的點(diǎn)擊操作調(diào)用這些工具,無(wú)需擔(dān)心安裝配置和環(huán)境兼容性問(wèn)題。此外,該平臺(tái)的數(shù)據(jù)共享功能尤其值得關(guān)注——研究人員可以通過(guò)一個(gè)簡(jiǎn)單的超鏈接與全球同行分享完整的分析會(huì)話,包括所有數(shù)據(jù)、可視化結(jié)果和計(jì)算參數(shù)。這種級(jí)別的協(xié)作便利性在傳統(tǒng)科研工作流程中是難以實(shí)現(xiàn)的。
隨著 AI 在藥物發(fā)現(xiàn)中的應(yīng)用日益深入,像 GYDE 這樣的平臺(tái)可能會(huì)成為未來(lái)科研基礎(chǔ)設(shè)施的重要組成部分。它不僅降低了技術(shù)門(mén)檻,更重要的是,它改變了科學(xué)家的工作方式——從孤立的工具使用轉(zhuǎn)向集成的、協(xié)作的研究范式。
論文鏈接:
https://www.biorxiv.org/content/10.64898/2026.03.24.714039v1
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.