无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Science丨TranscriptFormer大模型跨越15億年進(jìn)化史,利用1.12億單細(xì)胞數(shù)據(jù)構(gòu)建通用生成式細(xì)胞圖譜

0
分享至


來源:ScienceAI

編輯&

單細(xì)胞轉(zhuǎn)錄組已經(jīng)把「細(xì)胞有多復(fù)雜」這件事推到了前所未有的尺度。但除開它為人們帶來的理解上的改變,跨物種比較仍卡在一個(gè)問題之上:不同物種往往共享很少的直系同源基因,傳統(tǒng)整合方法越來越難把遠(yuǎn)緣物種放到同一坐標(biāo)系里。

來自美國斯坦福大學(xué)、Biohub 等的研究團(tuán)隊(duì)正是為了補(bǔ)上這一缺口而來。他們把 12 個(gè)物種、最多 1.12 億個(gè)細(xì)胞、覆蓋約 15 億年的進(jìn)化歷史一起送進(jìn)模型里,試圖讓模型自己學(xué)會(huì)「細(xì)胞表達(dá)的語法」。

相關(guān)研究以「TranscriptFormer: A generative cell atlas across 1.5 billion years of evolution」為題,于 2026 年 5 月 7 日發(fā)布在《Science》。


論文鏈接:https://www.science.org/doi/10.1126/science.aec8514

生成式細(xì)胞引擎

TranscriptFormer 的誕生旨在解決跨物種比較轉(zhuǎn)錄程序這一長期挑戰(zhàn)。它不是傳統(tǒng)的單細(xì)胞表征模型,而是一個(gè)自回歸生成模型。

該模型將基因表達(dá)譜視為「細(xì)胞語言」,通過自監(jiān)督學(xué)習(xí)捕捉基因間的復(fù)雜關(guān)聯(lián)與表達(dá)分布。這種大規(guī)模、多物種的數(shù)據(jù)策略,使模型能夠?qū)W習(xí)到跨越物種界限的通用生物學(xué)表征,而非僅局限于單一物種的特征提取。


圖 1:TranscriptFormer概覽。

模型輸入包括來自 ESM-2 的蛋白嵌入和測(cè)序技術(shù)標(biāo)記,并通過 expression-aware multi-head self-attention、causal masking 和 count likelihood 處理轉(zhuǎn)錄本計(jì)數(shù)的變化。團(tuán)隊(duì)訓(xùn)練了三個(gè)版本:TF-Metazoa、TF-Exemplar 和 TF-Sapiens,三者架構(gòu)一致,但訓(xùn)練語料分別覆蓋 12 個(gè)物種、5 個(gè)代表物種以及純?nèi)祟悢?shù)據(jù)。

在性能測(cè)試中,TranscriptFormer 在細(xì)胞類型分類任務(wù)上達(dá)到了領(lǐng)域領(lǐng)先水平。研究中,該模型表現(xiàn)出極強(qiáng)的跨物種遷移能力,即使對(duì)于在進(jìn)化上與人類相隔 6.85 億年的物種(如刺胞動(dòng)物門的珊瑚),它依然能夠?qū)崿F(xiàn)精準(zhǔn)的細(xì)胞分類。


圖 2:未見物種的泛化與跨物種遷移學(xué)習(xí)。

此外,模型在人類細(xì)胞的疾病狀態(tài)識(shí)別中展現(xiàn)了出色的「零樣本(Zero-shot)」能力,即在未接觸特定疾病標(biāo)注數(shù)據(jù)的情況下,仍能通過對(duì)正常生理狀態(tài)的深刻理解來識(shí)別異常的病理表征。

生物學(xué)結(jié)構(gòu)感

TranscriptFormer 的嵌入并不只是能分類,它們還自發(fā)呈現(xiàn)出發(fā)育軌跡、系統(tǒng)發(fā)育關(guān)系和細(xì)胞層級(jí)。

在研究中,團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:contextualized gene embeddings 會(huì)按細(xì)胞種類聚類,而且這種結(jié)構(gòu)在不同組織里都能看到。


圖 3:上下文基因嵌入與跨物種分析。

這種發(fā)育軌跡、系統(tǒng)發(fā)育關(guān)系以及細(xì)胞層級(jí)結(jié)構(gòu)在 TranscriptFormer 的表征空間中自然涌現(xiàn)的現(xiàn)象,代表著該模型無需人工標(biāo)注或元數(shù)據(jù)引導(dǎo)。這意味著模型自發(fā)掌握了生命的組織原則。

TranscriptFormer 還可作為一種「虛擬實(shí)驗(yàn)儀(Virtual Instrument)」,通過模擬轉(zhuǎn)錄因子的擾動(dòng)來預(yù)測(cè)目標(biāo)基因的反應(yīng)。團(tuán)隊(duì)用 TranscriptFormer 的生成接口做了提示式推斷,去預(yù)測(cè)轉(zhuǎn)錄因子與其他蛋白編碼基因的功能關(guān)聯(lián),并用 point-wise conditional mutual information(PMI)找出高置信度配對(duì),再拿 STRING 數(shù)據(jù)庫交叉驗(yàn)證。

除此之外,團(tuán)隊(duì)還用細(xì)胞類型條件化的提示重建了與 Tabula Sapiens 相似的轉(zhuǎn)錄因子熱圖,讓模型自己說出哪些因子更像普遍表達(dá),哪些更偏向細(xì)胞類型特異。

這種生成式模擬能力為研究人員提供了一個(gè)交互式知識(shí)庫,能夠在計(jì)算機(jī)上預(yù)先測(cè)試復(fù)雜的生物實(shí)驗(yàn)方案,從而加速藥物發(fā)現(xiàn)與細(xì)胞工程的研究進(jìn)程。

可調(diào)用的知識(shí)系統(tǒng)

TranscriptFormer 訓(xùn)練時(shí)沒有用細(xì)胞類型標(biāo)簽、發(fā)育階段標(biāo)簽或系統(tǒng)發(fā)育注釋,卻仍然學(xué)出了跨層級(jí)的生物學(xué)結(jié)構(gòu):基因、細(xì)胞、組織、物種都被串進(jìn)了同一套表示里。

它的價(jià)值不只是分類更準(zhǔn),而是把單細(xì)胞數(shù)據(jù)變成一種可以查詢、可以遷移、還可以做虛擬實(shí)驗(yàn)的生成式基礎(chǔ)模型。

團(tuán)隊(duì)表示:多物種預(yù)訓(xùn)練更利于跨物種泛化,單物種訓(xùn)練則可能在純?nèi)祟惣膊∪蝿?wù)上更有優(yōu)勢(shì);未來還將繼續(xù)擴(kuò)展物種、加入更多模態(tài),并改進(jìn)提示策略。

閱讀最新前沿科技趨勢(shì)報(bào)告,請(qǐng)?jiān)L問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識(shí)庫”


未來知識(shí)庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識(shí)庫平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

截止到2月28日 ”未來知識(shí)庫”精選的百部前沿科技趨勢(shì)報(bào)告

(加入未來知識(shí)庫,全部資料免費(fèi)閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
搶七16中5鐵出天際!坎寧安拉胯卻獲超高評(píng)價(jià) 美記:圍繞他補(bǔ)強(qiáng)

搶七16中5鐵出天際!坎寧安拉胯卻獲超高評(píng)價(jià) 美記:圍繞他補(bǔ)強(qiáng)

顏小白的籃球夢(mèng)
2026-05-18 11:02:56
內(nèi)行人預(yù)測(cè):不出意外的話,明后年的房價(jià)將會(huì)出現(xiàn)4大“變化”

內(nèi)行人預(yù)測(cè):不出意外的話,明后年的房價(jià)將會(huì)出現(xiàn)4大“變化”

蜉蝣說
2026-05-18 18:29:54
國乒5.18情報(bào):樊振東退出歐冠,向鵬報(bào)名遭拒,鰻魚終于現(xiàn)身

國乒5.18情報(bào):樊振東退出歐冠,向鵬報(bào)名遭拒,鰻魚終于現(xiàn)身

章民解說體育
2026-05-18 18:12:29
徐冬冬與老公尹子維在路邊吵架崩潰痛哭:去廣州塔忘帶身份證,我就是想上小蠻腰,我恨我自己;尹子維在旁緊張到磕巴,用英文安慰

徐冬冬與老公尹子維在路邊吵架崩潰痛哭:去廣州塔忘帶身份證,我就是想上小蠻腰,我恨我自己;尹子維在旁緊張到磕巴,用英文安慰

臺(tái)州交通廣播
2026-05-18 16:44:08
閑魚等二手平臺(tái)現(xiàn)汽水音樂100年會(huì)員,汽水音樂回應(yīng)稱系黑灰產(chǎn),存在安全風(fēng)險(xiǎn)

閑魚等二手平臺(tái)現(xiàn)汽水音樂100年會(huì)員,汽水音樂回應(yīng)稱系黑灰產(chǎn),存在安全風(fēng)險(xiǎn)

中國能源網(wǎng)
2026-05-18 10:54:09
他接受紀(jì)律審查和監(jiān)察調(diào)查

他接受紀(jì)律審查和監(jiān)察調(diào)查

錫望
2026-05-18 11:57:24
5個(gè)已被證實(shí)卻讓人難以接受的科學(xué)真理,顛覆你對(duì)世界的認(rèn)知

5個(gè)已被證實(shí)卻讓人難以接受的科學(xué)真理,顛覆你對(duì)世界的認(rèn)知

心中的麥田
2026-05-18 19:34:44
中國最好吃的6個(gè)城市,50歲前要去一次

中國最好吃的6個(gè)城市,50歲前要去一次

簡(jiǎn)食記工作號(hào)
2026-05-14 00:06:06
原來他是國宴總廚,大專學(xué)歷卻獲獎(jiǎng)無數(shù),從業(yè)55年如今72歲未退休

原來他是國宴總廚,大專學(xué)歷卻獲獎(jiǎng)無數(shù),從業(yè)55年如今72歲未退休

白面書誏
2026-05-16 15:12:43
原來說話會(huì)拐彎這事是天生的!網(wǎng)友:兒子說怕草莓尖太尖扎到我!

原來說話會(huì)拐彎這事是天生的!網(wǎng)友:兒子說怕草莓尖太尖扎到我!

夜深愛雜談
2026-05-18 07:34:26
嫁法國老頭后癱瘓?42歲李宇春近況曝光,真相背后隱情惹人流淚

嫁法國老頭后癱瘓?42歲李宇春近況曝光,真相背后隱情惹人流淚

借你一生
2026-05-15 19:25:13
馬斯克頭頂這3000根頭發(fā)比他造火箭還讓人好奇

馬斯克頭頂這3000根頭發(fā)比他造火箭還讓人好奇

小邵說劇
2026-05-18 12:08:26
結(jié)束了!曝將交易51分先生!這才是坎寧安最強(qiáng)幫手

結(jié)束了!曝將交易51分先生!這才是坎寧安最強(qiáng)幫手

籃球?qū)崙?zhàn)寶典
2026-05-18 18:48:32
博主“我是大彬同學(xué)”侮辱貶損鴻蒙智行,被判賠150萬元

博主“我是大彬同學(xué)”侮辱貶損鴻蒙智行,被判賠150萬元

大風(fēng)新聞
2026-05-18 19:36:02
792萬!出生人口跌破底線:年輕人為什么連一個(gè)孩子都不想生了?

792萬!出生人口跌破底線:年輕人為什么連一個(gè)孩子都不想生了?

阿芒娛樂說
2026-05-17 11:07:35
4次挑釁中國!烏克蘭名將奪冠獲830萬回應(yīng),烏克蘭人還躲在防空洞

4次挑釁中國!烏克蘭名將奪冠獲830萬回應(yīng),烏克蘭人還躲在防空洞

壹知眠羊
2026-05-18 14:38:19
張藝謀也沒想到,養(yǎng)了27年的陳婷,竟會(huì)親手摘掉張藝謀妻子的認(rèn)證

張藝謀也沒想到,養(yǎng)了27年的陳婷,竟會(huì)親手摘掉張藝謀妻子的認(rèn)證

混沌錄
2026-05-14 15:58:14
從140斤瘦到110斤,我就靠“早上吃夠蛋白質(zhì)”這一個(gè)笨辦法!

從140斤瘦到110斤,我就靠“早上吃夠蛋白質(zhì)”這一個(gè)笨辦法!

健身狂人
2026-05-17 04:28:03
黃仁勛北京行慶云樓:機(jī)會(huì)只給那些“腦子里有貨,膽子也大”的人

黃仁勛北京行慶云樓:機(jī)會(huì)只給那些“腦子里有貨,膽子也大”的人

民間胡扯老哥
2026-05-18 13:30:07
有點(diǎn)懸了!費(fèi)利佩茹薩李揚(yáng)缺訓(xùn) 穆斯卡特:成都簽下約翰非常明智

有點(diǎn)懸了!費(fèi)利佩茹薩李揚(yáng)缺訓(xùn) 穆斯卡特:成都簽下約翰非常明智

刀鋒體育
2026-05-18 19:13:21
2026-05-18 23:56:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4744文章數(shù) 37464關(guān)注度
往期回顧 全部

科技要聞

同一公司,有人獎(jiǎng)金是6年工資,我卻只有半年

頭條要聞

賴清德要求美國繼續(xù)向臺(tái)出售武器 外交部表態(tài)

頭條要聞

賴清德要求美國繼續(xù)向臺(tái)出售武器 外交部表態(tài)

體育要聞

58順位的保羅,最強(qiáng)第三中鋒

娛樂要聞

票房會(huì)破14億!口碑第一電影出現(xiàn)了

財(cái)經(jīng)要聞

中國芯片,怎么突然不便宜了?

汽車要聞

歸元S平臺(tái)首款車型 魏牌V9X上市 34.98萬元起

態(tài)度原創(chuàng)

數(shù)碼
教育
家居
健康
游戲

數(shù)碼要聞

索尼十周年紀(jì)念耳機(jī)The ColleXion曝光 設(shè)計(jì)全面奢華升級(jí)

教育要聞

一所京城學(xué)校,能提供的“天花板資源”,是什么樣的?

家居要聞

觀山隱秀 心靈沉淀

專家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

SCS廣州站落幕:中國格斗選手,正在這里成長

無障礙瀏覽 進(jìn)入關(guān)懷版