引言
自然界的蛋白質(zhì)經(jīng)過數(shù)億年的漫長進化,才打磨出支撐生命的復(fù)雜功能。然而,面對癌癥、新發(fā)傳染病以及日益嚴峻的氣候危機,我們已無法再等待下一個百萬年的自然選擇。
4月30日,《Nature》的重磅綜述“The past, present and future of de novo protein design”,系統(tǒng)總結(jié)了基于深度學(xué)習(xí)(Deep Learning)的計算方法如何引發(fā)蛋白質(zhì)工程領(lǐng)域的范式轉(zhuǎn)變。從頭設(shè)計蛋白質(zhì)(De novo protein design)正從隨機篩選走向理性的定制化構(gòu)建。
![]()
告別盲人摸象:生成式大模型重構(gòu)分子設(shè)計法則
設(shè)計一個全新蛋白質(zhì)的難點究竟在哪里?
從上世紀90年代到幾年前,計算蛋白質(zhì)設(shè)計的底層邏輯一直深植于物理化學(xué)模型。研究人員的出發(fā)點是著名的安芬森假說(Anfinsen's hypothesis),即蛋白質(zhì)的折疊狀態(tài)處于其氨基酸序列的全局自由能最低點。為了找到這個“最低點”,像 Rosetta 這樣的軟件試圖通過計算范德華力、氫鍵、靜電相互作用等物理量來評估數(shù)以億計的可能結(jié)構(gòu)。這種方法雖然極其嚴謹,但也極度耗時,且極易陷入局部最優(yōu)解的陷阱。
如今,這場革命性的突破得益于深度學(xué)習(xí)模型的引入。AlphaFold 和 RoseTTAFold 等結(jié)構(gòu)預(yù)測工具的成熟,提供了一種從序列空間到結(jié)構(gòu)空間的全新映射方式。研究人員不再單純追求“能量最低”,而是轉(zhuǎn)向?qū)ふ摇案怕首罡摺钡男蛄?結(jié)構(gòu)對。這種概率計算的底氣,源于全球結(jié)構(gòu)生物學(xué)領(lǐng)域歷經(jīng) 60 年、耗資數(shù)十億美元、由成千上萬名研究人員共同構(gòu)建的蛋白質(zhì)數(shù)據(jù)庫(PDB)。大模型通過學(xué)習(xí)這些已知結(jié)構(gòu)的底層概率分布,掌握了生命的“語法”。
隨后,基于擴散模型(Diffusion models)的生成式人工智能(AI)工具如RFdiffusion 徹底顛覆了設(shè)計流程。在設(shè)計之初,模型面對的只是一團完全隨機的氨基酸殘基“噪聲”,通過逐步去噪,這些殘基最終組織成具有高度互補性和特定功能的蛋白質(zhì)結(jié)構(gòu)。一旦骨架確定,ProteinMPNN 等序列設(shè)計工具就能迅速填補合適的氨基酸序列。這種骨架生成與序列設(shè)計的解耦與協(xié)同,讓蛋白質(zhì)設(shè)計擺脫了天然序列的束縛,真正實現(xiàn)了從功能需求出發(fā)的“逆向工程”。
突破天然界限:定制多維空間結(jié)構(gòu)的組裝模塊
掌握了底層規(guī)律后,研究人員首先挑戰(zhàn)的是設(shè)計全新的蛋白質(zhì)折疊和組裝形式。
早在2003年,世界上第一個具有原子級精度的全新折疊蛋白質(zhì) Top7 問世,證明了計算方法能夠無中生有地創(chuàng)造出穩(wěn)定結(jié)構(gòu)。而如今,這種能力已經(jīng)擴展到了極具挑戰(zhàn)性的跨膜蛋白領(lǐng)域。研究人員成功設(shè)計了包含α-螺旋和 β-折疊的跨膜孔道和通道。例如,定制尺寸和內(nèi)襯屬性的 β-桶狀孔道,為基于納米孔的單分子 DNA 測序技術(shù)及廣譜生物傳感技術(shù)提供了更為理想的物理通道。
在微觀尺度上,設(shè)計技術(shù)已經(jīng)能夠突破傳統(tǒng)20種天然氨基酸的限制。通過引入非天然氨基酸,研究人員設(shè)計出了長度在 7 到 14 個殘基之間的主鏈環(huán)化肽(Macrocyclic peptides),不僅在溶液中具有明確的結(jié)構(gòu),還展現(xiàn)出跨膜穿透和口服生物利用的潛力。甚至更小巧的 4 到 5 個殘基組成的寡酰胺(Oligoamides)大環(huán)化合物也被成功合成,將蛋白質(zhì)設(shè)計的邊界直接拓展到了小分子藥物的范疇。
在宏觀組裝層面,計算設(shè)計賦予了材料前所未有的對稱性和規(guī)模。從最初的簡單二聚體,到如今利用四個相互正交的組分,研究人員能夠設(shè)計出直徑高達 100 nm 的偽對稱(Pseudosymmetric)納米籠結(jié)構(gòu)。這種模塊化的設(shè)計思路,讓蛋白質(zhì)像樂高積木一樣可以無縫拼接。以此技術(shù)為基礎(chǔ)研發(fā)的二十面體納米顆粒,已經(jīng)促成了全球首個從頭設(shè)計并獲批臨床使用的 COVID-19 疫苗(SKYCovione)。可以預(yù)見,通過設(shè)計對 pH 敏感的解離組分或整合具有靶向信號的亞基,未來的納米疫苗和藥物遞送系統(tǒng)將具備極高的組織特異性。
靶向深水區(qū):高親和力結(jié)合蛋白的降維打擊
自然界中,抗體是執(zhí)行識別和結(jié)合任務(wù)的主力軍。但在臨床應(yīng)用中,抗體體積龐大、穩(wěn)定性差且生產(chǎn)成本高昂。那么,能否用更小、更穩(wěn)定的從頭設(shè)計蛋白質(zhì)來替代甚至超越抗體呢?
答案是肯定的。如今,結(jié)合蛋白(Protein binders)的設(shè)計已經(jīng)接近被徹底解決的邊緣。研究人員通過 RFdiffusion 和 Bindcraft 等工具,已成功設(shè)計出針對 200 多個不同蛋白質(zhì)靶點的高親和力結(jié)合蛋白。
在抗病毒領(lǐng)域,設(shè)計的微型蛋白質(zhì)能夠精準結(jié)合 SARS-CoV-2、流感病毒的刺突蛋白,甚至能中和致命的肉毒桿菌毒素和蛇毒。這些結(jié)合蛋白在經(jīng)過部分擴散優(yōu)化后,達到了皮摩爾(Picomolar)級別的結(jié)合親和力。更為關(guān)鍵的是,由于其結(jié)構(gòu)高度緊湊且具有極高的熱穩(wěn)定性,這類蛋白藥物無需冷鏈運輸,甚至可以制成鼻噴霧劑供大眾日常預(yù)防使用。
不僅如此,計算設(shè)計還攻克了傳統(tǒng)制藥領(lǐng)域公認的“不可成藥”靶點——內(nèi)部無序區(qū)(Intrinsically disordered regions, IDRs)。這些區(qū)域缺乏固定的三維結(jié)構(gòu),傳統(tǒng)的鎖鑰模型在此完全失效。研究人員利用誘導(dǎo)契合(Induced fit)的概念,讓設(shè)計的蛋白質(zhì)在結(jié)合過程中迫使 IDRs 采取特定的穩(wěn)定構(gòu)象。利用這一策略,針對致癌基因產(chǎn)物(如 β-連環(huán)蛋白)以及引發(fā)神經(jīng)退行性疾病的 β-淀粉樣蛋白的結(jié)合蛋白已被成功開發(fā)出來。
在免疫調(diào)控方面,通過設(shè)計針對細胞因子受體的高親和力激動劑或拮抗劑(如 IL-2 和 IL-21 的模擬物),研究人員在動物模型中觀察到了極其強效的抗腫瘤活性。不僅如此,通過構(gòu)建 EndoTags 等靶向溶酶體降解的標簽系統(tǒng),結(jié)合蛋白可以精準招募 E3 泛素連接酶,實現(xiàn)對致病膜蛋白或胞外蛋白的靶向清除。
跨越能壘的煉金術(shù):打造極高活性的定制酶引擎
如果說結(jié)合蛋白質(zhì)是在玩“拼圖”,那么設(shè)計具備催化活性的酶(Enzymes)則是在挑戰(zhàn)化學(xué)反應(yīng)的能量極限。
傳統(tǒng)的酶工程主要依賴對天然酶的定向進化,但這往往受限于天然骨架的原始屬性。從頭計算設(shè)計的最終目標,是為一個全新的化學(xué)反應(yīng)從零開始定制完美的催化位點。這就要求設(shè)計的蛋白質(zhì)結(jié)構(gòu)必須能夠在原子級別精確排列催化基團,以極致的精度穩(wěn)定化學(xué)反應(yīng)的過渡態(tài)。
隨著大模型技術(shù)引入,我們看到了令人振奮的突破。研究人員不僅能夠設(shè)計針對特定小分子(如心臟病藥物地高辛 Digoxigenin 或抗癌藥物甲氨蝶呤 Methotrexate)的高親和力傳感器,還能直接針對酶的過渡態(tài)幾何形態(tài)進行骨架生成。
具體的數(shù)據(jù)令人驚嘆:以往針對模型化學(xué)反應(yīng)(如 retro-aldol 反應(yīng))設(shè)計的酶,其催化效率(kcat/KM)僅為 180 M-1s-1。而借助新型生成工具(如 PLACER 深度學(xué)習(xí)方法)對催化位點預(yù)組織的篩選,新設(shè)計的熒光素酶(Luciferase)達到了 1400 M-1s-1,絲氨酸水解酶達到了 3800 M-1s-1。更引人矚目的是,一款從頭設(shè)計的鋅水解酶催化效率飆升至53000 M-1s-1,而在一些高度優(yōu)化的絲氨酸水解酶設(shè)計中,這一數(shù)值甚至突破了 2.2 × 105 M-1s-1。
不僅如此,結(jié)合血紅素(Haem)等多核金屬簇輔助因子的酶也被成功設(shè)計。對于那些需要克服極高能壘的非自然化學(xué)反應(yīng),比如降解難降解塑料,基于全新骨架的金屬水解酶已經(jīng)展現(xiàn)出了強大的應(yīng)用潛力。
邏輯門與動態(tài)齒輪:喚醒未來的智能分子納米機器
掌握了靜態(tài)結(jié)構(gòu)設(shè)計、分子結(jié)合以及化學(xué)催化之后,從頭蛋白質(zhì)設(shè)計正在邁向它的終極形態(tài):構(gòu)建能夠?qū)ν饨绱碳ぷ龀鰟討B(tài)響應(yīng)、具備多穩(wěn)態(tài)和邏輯運算能力的分子納米機器。
生命的底層邏輯往往伴隨著信息處理和能量轉(zhuǎn)換。研究人員設(shè)計出了名為LOCKR 的智能系統(tǒng)。這是一種能夠執(zhí)行布爾邏輯(Boolean logic)運算的蛋白質(zhì)開關(guān)。在嵌合抗原受體 T 細胞(CAR-T)療法中,它可以被設(shè)計成只有當(dāng)靶細胞表面同時存在兩種特定的標志物(即執(zhí)行“與”邏輯,AND logic)時,才會解除一段多肽的隱藏狀態(tài),進而招募效應(yīng)蛋白殺傷癌細胞,從而最大限度地減少對健康組織的誤傷。
在動態(tài)調(diào)控層面,研究人員開發(fā)出了由效應(yīng)物(如特定肽段或鈣離子)驅(qū)動的變構(gòu)組件。通過在一個遠離作用中心的位置結(jié)合效應(yīng)肽,可以誘導(dǎo)整個蛋白質(zhì)復(fù)合體解離或改變其寡聚狀態(tài)。動力學(xué)數(shù)據(jù)顯示,在這種變構(gòu)肽的控制下,細胞因子信號的持續(xù)時間可以從原來的 1 小時精準縮短至 40 分鐘。
更具科幻色彩的,是這種定制能力正延伸向材料科學(xué)與可持續(xù)發(fā)展領(lǐng)域。研究人員設(shè)計出了能夠精確引導(dǎo)無機晶體成核的蛋白質(zhì)模板,例如控制碳酸鈣(CaCO3)的多晶型結(jié)晶過程,以探索一種全新的二氧化碳(CO2)固定方案。在人工光合作用方向,成功設(shè)計出能夠容納且維持葉綠素特殊對(Chlorophyll special pairs)激子耦合的同源二聚體蛋白質(zhì),這為未來利用太陽能驅(qū)動的高效多電子化學(xué)反應(yīng)奠定了物理基礎(chǔ)。
在這個領(lǐng)域,當(dāng)前的核心挑戰(zhàn)已經(jīng)不再是“如何設(shè)計”,而是“應(yīng)該設(shè)計什么”。雖然在免疫原性驗證、大規(guī)模生物制造等方面仍有現(xiàn)實問題需要克服,但從頭蛋白質(zhì)設(shè)計已經(jīng)不可逆轉(zhuǎn)地重構(gòu)了我們與分子世界的交互方式。可以預(yù)見,在接下來的十年中,整合了結(jié)合、催化和動態(tài)構(gòu)象變化的智能生物材料,將帶領(lǐng)我們走向一個全面定制分子的新紀元。
參考文獻
Yang W, Wang S, Lee GR, Zhang JZ, Courbet A, Juergens D, Wang X, Schlichthaerle T, Abedi M, Ragotte R, An L, Kalvet I, Pellock S, Mihaljevic L, Glasscock C, Pillai A, Broerman A, Ennist N, Haefner E, McNamara-Bordewick N, Haydon I, Stewart L, Bhardwaj G, Baker D. The past, present and future of de novo protein design. Nature. 2026 Apr;652(8112):1139-1152. doi: 10.1038/s41586-026-10328-7. Epub 2026 Apr 29. PMID: 42056544.
轉(zhuǎn)載請注明來源于【游離的DNA】
聲明:本文僅用于分享,不代表平臺立場,如涉及版權(quán)等問題,請盡快聯(lián)系我們,我們第一時間更正,謝謝!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.