屏幕上,一個(gè)細(xì)胞正在慢慢變大。它只有幾百納米寬,肉眼完全不可見,但在模擬畫面里被放大到可以看清內(nèi)部的一切:蛋白質(zhì)、RNA、核糖體密密麻麻地?cái)D在一起。一條環(huán)形染色體蜷縮在中央,正在被復(fù)制。
到第 65 分鐘前后,細(xì)胞開始變形,腰部收窄,拉成啞鈴的形狀。第 105 分鐘,兩個(gè)子細(xì)胞徹底分開,各自帶走了一套完整的染色體,以及大約一半的核糖體、蛋白質(zhì)和 RNA。
![]()
(來源:Youtube)
這看起來是不是像一段手搓的虛擬 3D 動(dòng)畫?但它不是,它是兩塊 GPU 跑了 6 天的計(jì)算結(jié)果,里面每一個(gè)分子的每一步移動(dòng),都是計(jì)算機(jī)算出來的。
2026 年 3 月,美國(guó)伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)化學(xué)系教授 Zaida Luthey-Schulten 領(lǐng)銜的團(tuán)隊(duì)在 Cell 期刊上發(fā)表了這項(xiàng)工作。他們構(gòu)建了一個(gè)四維全細(xì)胞模型(4DWCM,即三維空間加時(shí)間維度),完整模擬了已知基因組最小的自由生活細(xì)菌 JCVI-syn3A 從"出生"到一分為二的整個(gè)生命周期——大約 105 分鐘。這是人類第一次在計(jì)算機(jī)中讓一個(gè)細(xì)胞"活"過完整的一生,而且每一步都符合真實(shí)的生物物理規(guī)律。
![]()
圖 | 團(tuán)隊(duì)合影(來源:UIUC)
實(shí)驗(yàn)的天選細(xì)胞——JCVI-syn3A
要在電腦里模擬一個(gè)活細(xì)胞,是一項(xiàng)面臨生物復(fù)雜性挑戰(zhàn)的工作,所以首先要選擇一個(gè)足夠簡(jiǎn)單的對(duì)象。而 JCVI-syn3A 正是這樣的存在。
它的前身可以追溯到 2010 年。那一年,J. Craig Venter 研究所(JCVI)合成了第一個(gè)完全由人工基因組驅(qū)動(dòng)的細(xì)菌細(xì)胞 JCVI-syn1.0,基因組約 108 萬堿基對(duì)、901 個(gè)基因。
2016 年,團(tuán)隊(duì)將基因組精簡(jiǎn)到 47.3 萬堿基對(duì)、473 個(gè)基因,造出了 JCVI-syn3.0。它是已知自主復(fù)制生物中最小的基因組(據(jù) Hutchison 等人 2016 年發(fā)表于《Science》的論文)。
但 syn3.0 有一個(gè)極大的缺陷:它不能正常分裂,細(xì)胞形態(tài)混亂。一直到 2021 年,JCVI 的 Pelletier 等人在 Cell 報(bào)道,通過加回 7 個(gè)基因(其中 5 個(gè)此前功能未知),這才得到了 JCVI-syn3A:493 個(gè)基因,倍增時(shí)間約 105 分鐘,能規(guī)律地球形生長(zhǎng)并對(duì)稱分裂。
493 個(gè)基因是什么概念?大腸桿菌有大約 4,300 個(gè)基因,人類細(xì)胞有大約 2 萬個(gè)蛋白質(zhì)編碼基因。Syn3A 可以說是自然界中能獨(dú)立存活的“最低配置”。正因?yàn)樽銐蚝?jiǎn)單,它成了全細(xì)胞建模的理想試驗(yàn)場(chǎng)。
從“攪拌均勻”到真正的三維空間
Luthey-Schulten 團(tuán)隊(duì)并非第一次做全細(xì)胞模型。2022 年,他們就在 Cell 上發(fā)表了 Syn3A 的“攪拌均勻”(well-stirred)模型,即把細(xì)胞當(dāng)作一個(gè)均勻混合的反應(yīng)器,用隨機(jī)-確定性混合動(dòng)力學(xué)模擬基因表達(dá)、代謝和生長(zhǎng)。那個(gè)模型已經(jīng)能預(yù)測(cè)出與實(shí)驗(yàn)吻合的倍增時(shí)間和蛋白質(zhì)分布。
但問題在于,細(xì)胞不是試管。RNA 聚合酶得在三維空間中擴(kuò)散、找到 DNA 上的啟動(dòng)子才能開始轉(zhuǎn)錄;負(fù)責(zé)降解 mRNA 的降解體(degradosome)被限制在細(xì)胞膜內(nèi)側(cè);核糖體有約 20 納米的體積,會(huì)擠占周圍的空間。這些空間效應(yīng),在均勻攪拌的假設(shè)下全部被忽略了。
這次的 4DWCM 對(duì)這個(gè)局限實(shí)現(xiàn)了全面突破。模型把細(xì)胞的三維空間切成了 10 納米邊長(zhǎng)的立方格點(diǎn),所有蛋白質(zhì)和 RNA 都在格點(diǎn)上擴(kuò)散、碰撞、反應(yīng)……每一個(gè)分子都是獨(dú)立追蹤的粒子。這種空間上的異質(zhì)性,使分子間的相遇與反應(yīng)更貼近真實(shí)細(xì)胞內(nèi)的擁擠環(huán)境,也自然呈現(xiàn)出生命過程固有的隨機(jī)特征。
![]()
(來源:論文)
四種計(jì)算方法結(jié)合
不過要模擬一個(gè)細(xì)胞的全部過程,沒有哪一種計(jì)算方法能獨(dú)自勝任。因此團(tuán)隊(duì)的做法是把四種不同的模擬方法組裝成一個(gè)混合框架:空間中的反應(yīng)和擴(kuò)散用 RDME(Reaction-Diffusion Master Equation,反應(yīng)-擴(kuò)散主方程)處理;全局的轉(zhuǎn)錄和 tRNA 裝載等反應(yīng)用 CME(Chemical Master Equation,化學(xué)主方程)做隨機(jī)模擬;糖酵解、核苷酸合成等代謝網(wǎng)絡(luò)用 ODE(Ordinary Differential Equations,常微分方程)求解;染色體的物理行為:聚合物運(yùn)動(dòng)、DNA 復(fù)制、蛋白驅(qū)動(dòng)的環(huán)擠出,則用布朗動(dòng)力學(xué)(Brownian Dynamics)在第二塊 GPU 上并行模擬。
![]()
(來源:論文)
四種方法通過一個(gè)通信算法每隔 12.5 毫秒同步一次數(shù)據(jù)。模擬一個(gè)完整細(xì)胞周期需要 4 到 6 天的實(shí)際計(jì)算時(shí)間。論文中報(bào)告的 50 個(gè)重復(fù)細(xì)胞模擬,總共消耗約 15,000 GPU 小時(shí),全部運(yùn)行在 NVIDIA A100 上。據(jù) UIUC 新聞稿,團(tuán)隊(duì)使用的是國(guó)家超級(jí)計(jì)算應(yīng)用中心的 Delta 超算系統(tǒng)。
那么通過這樣的方法“焊接”,最后模擬結(jié)果有多準(zhǔn)?
最直接的驗(yàn)證是倍增時(shí)間:模擬細(xì)胞平均 105 分鐘完成膜面積倍增,與實(shí)驗(yàn)值完全一致。DNA 復(fù)制平均耗時(shí) 51 分鐘。
更精細(xì)的驗(yàn)證來自 ori:ter 比,即染色體復(fù)制起點(diǎn)與終點(diǎn)的測(cè)序覆蓋深度之比,反映群體中 DNA 復(fù)制的平均進(jìn)度。模擬預(yù)測(cè)值為 1.28,團(tuán)隊(duì)自己做的全基因組測(cè)序?qū)崪y(cè)值為 1.21,高度吻合。這意味著模型不僅恢復(fù)了正確的總時(shí)間,連 DNA 復(fù)制的節(jié)奏也基本對(duì)了。
模型還預(yù)測(cè)了分裂時(shí)刻細(xì)胞的分子組成:約 881 個(gè)核糖體、176 個(gè) RNA 聚合酶、192 個(gè)降解體。約 55% 的核糖體和 70% 的 RNA 聚合酶在任意時(shí)刻處于活躍狀態(tài)。mRNA 的平均半衰期約 3.6 分鐘,落在已知細(xì)菌的觀測(cè)范圍內(nèi)。這些數(shù)字過去需要分別設(shè)計(jì)不同實(shí)驗(yàn)去測(cè)量,現(xiàn)在從一次模擬中同時(shí)產(chǎn)出。
此外,4D 模型最有價(jià)值的地方,不是重復(fù)已有結(jié)果,而是揭示了空間效應(yīng)對(duì)細(xì)胞行為的實(shí)質(zhì)影響。
一個(gè)典型例子:DNA 復(fù)制的啟動(dòng)蛋白 DnaA 需要在三維空間中擴(kuò)散到染色體的復(fù)制起點(diǎn)上,才能觸發(fā)復(fù)制。團(tuán)隊(duì)最初使用的結(jié)合速率參數(shù)在 well-stirred 模型中工作正常,但在 4D 模型中,12 個(gè)測(cè)試細(xì)胞在 60 分鐘內(nèi)無一啟動(dòng)復(fù)制,因?yàn)?DnaA 必須“真的走過去”才行。換用了結(jié)合力更強(qiáng)的參數(shù)后,復(fù)制才正常啟動(dòng)。在均勻攪拌假設(shè)下好用的參數(shù),放到三維空間中可能就不夠了。
另一個(gè)發(fā)現(xiàn)涉及細(xì)胞分裂后的分子分配。核糖體、膜蛋白等的分配大致隨機(jī),兩個(gè)子細(xì)胞之間沒有系統(tǒng)性偏差。但降解體出現(xiàn)了有趣的偏斜:當(dāng)大塊 DNA 被擠向細(xì)胞一側(cè)時(shí),DNA 占據(jù)的空間會(huì)排斥附近的降解體,導(dǎo)致那一側(cè)降解體偏少。這種空間擁擠導(dǎo)致的不均勻分配,是把細(xì)胞當(dāng)試管的模型永遠(yuǎn)看不到的。
不過,實(shí)驗(yàn)也存在其局限性。最突出的一個(gè):染色體分離靠的是人工施加的排斥力。Syn3A 基因組中找不到已知的染色體分離系統(tǒng),團(tuán)隊(duì)不得不用外力“推開”兩條子代染色體。論文承認(rèn)這是一個(gè)限制,初步探索顯示更精細(xì)的蛋白模型可能有潛力替代,但計(jì)算成本太高,可能把單個(gè)細(xì)胞的模擬時(shí)間從 6 天拉到數(shù)周。
其他局限還包括:沒有處理多個(gè)基因共轉(zhuǎn)錄的情況;缺少多核糖體效應(yīng)(多個(gè)核糖體同時(shí)翻譯一條 mRNA),導(dǎo)致長(zhǎng)蛋白質(zhì)產(chǎn)量偏低;代謝中某些核苷酸的濃度偏低,可能缺少反饋抑制機(jī)制。團(tuán)隊(duì)也列出了下一步最需要的實(shí)驗(yàn)數(shù)據(jù):Syn3A 的定量代謝組學(xué)、全基因組 mRNA 半衰期、蛋白質(zhì)半衰期、以及長(zhǎng)讀長(zhǎng)轉(zhuǎn)錄組學(xué)。
全細(xì)胞建模的一個(gè)臺(tái)階
此次的研究還帶領(lǐng)全細(xì)胞建模走上了一個(gè)新臺(tái)階。
此前最有影響力的全細(xì)胞動(dòng)力學(xué)模型是 2012 年的生殖支原體模型(Karr 等,Cell)和 2020 年的大腸桿菌模型(Macklin 等,Science),將細(xì)胞內(nèi)部視為均勻混合體系,未納入空間維度的影響。
而本次針對(duì) Syn3A 構(gòu)建的 4DWCM 框架,首次實(shí)現(xiàn)了空間分辨率、反應(yīng)隨機(jī)性與完整細(xì)胞周期三者的同步整合,使模型能夠更真實(shí)地反映分子在細(xì)胞內(nèi)的定位、擴(kuò)散與相互作用過程。不過背后的代價(jià)是巨大的算力消耗。
團(tuán)隊(duì)指出,未來兩種模型應(yīng)該形成互補(bǔ):用 4D 模型校準(zhǔn)參數(shù),再用 well-stirred 模型做大規(guī)模采樣。這種分層建模策略,有望在保持物理真實(shí)性的同時(shí),提升全細(xì)胞模擬的實(shí)用性與可擴(kuò)展性。
1.https://www.cell.com/cell/fulltext/S0092-8674(26)00174-1
運(yùn)營(yíng)/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.