无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

2024年諾貝爾化學(xué)獎(jiǎng):又又又雙叒叕是AI?

0
分享至

作者:奶樹

編輯:蝌蚪

當(dāng)昨天的諾貝爾物理學(xué)獎(jiǎng)剛剛頒給了開發(fā)了人工神經(jīng)網(wǎng)絡(luò)的AI之父杰弗里·辛頓和約翰·霍普菲爾德,大家還在暗想: 今年不會(huì)AI來了個(gè)大滿貫吧? 化學(xué)獎(jiǎng)也可能給AI預(yù)測蛋白質(zhì)結(jié)構(gòu)啊!

于是,不出意外地,瑞典皇家科學(xué)院10月9日宣布,2024年諾貝爾化學(xué)獎(jiǎng)一半給了開發(fā)人工智能設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的大衛(wèi)·貝克(David Baker)、另一半則給了開發(fā)了人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)的德米斯·哈薩比斯(Demis Hassabis)和約翰·M·詹珀(John M. Jumper)。

其實(shí)在RostteFoldAlphaFold2在2021年橫空出世的時(shí)候,結(jié)構(gòu)生物學(xué)家、生物化學(xué)家、計(jì)算生物學(xué)家就已經(jīng)知道,這項(xiàng)成果,肯定值得一個(gè)諾貝爾獎(jiǎng)

蛋白質(zhì)結(jié)構(gòu):困擾生物學(xué)家的難題

說起蛋白質(zhì),相信不少人其實(shí)并不陌生,甚至了解蛋白質(zhì)是細(xì)胞里行使各種功能的“元件”。不僅如此,蛋白質(zhì)也是組成我們身體的基本物質(zhì)之一。比如說健身可以鍛煉肌肉,但想要肌肉增強(qiáng)變大,就必須有足夠的蛋白質(zhì)供給才行。

餐桌上的雞蛋、牛奶以及各種肉類都是富含蛋白質(zhì)的食物,對(duì)于人類來說,蛋白質(zhì)唾手可得;但是,想要得到蛋白質(zhì)的結(jié)構(gòu)卻難于上青天

富含蛋白質(zhì)的飲食 | 圖源:iSlide

因?yàn)榈鞍踪|(zhì)的結(jié)構(gòu)非常復(fù)雜:簡單講,氨基酸組成蛋白質(zhì),一個(gè)個(gè)氨基酸會(huì)有叫肽鍵的結(jié)構(gòu)鏈接,它的連接可以形成兩種不同的角度。

那現(xiàn)在給大家出一個(gè)簡單數(shù)學(xué)題:假設(shè)有100個(gè)氨基酸組成蛋白質(zhì),那就需要99個(gè)肽鍵,99個(gè)肽鍵有兩種不同角度的結(jié)構(gòu),同時(shí)不同角度還會(huì)有三種可能的穩(wěn)定結(jié)構(gòu),那就是3的198次方種可能,你要是慢慢窮舉,從宇宙爆炸到現(xiàn)在都數(shù)不完,這就是利文索爾悖論——蛋白質(zhì)結(jié)構(gòu)非常非常多樣,沒辦法用窮舉來算完

氨基酸組合過程中不同的二面角會(huì)產(chǎn)生不同的結(jié)構(gòu),因此才有利文索爾悖論這樣的無窮種結(jié)構(gòu)可能| 圖源:Wikipedia

結(jié)構(gòu)這么復(fù)雜該怎么辦?生物學(xué)家最直接的想法就是觀測,用不同的方法來測量:上世紀(jì)五六十年代,用的是X光衍射——把蛋白質(zhì)結(jié)晶,然后打上X光,通過反射的角度可以推測蛋白質(zhì)長什么樣子,這個(gè)難點(diǎn)就是怎么把蛋白質(zhì)純化結(jié)晶出來。

另一個(gè)現(xiàn)在很熱門的研究方法叫冷凍電鏡,就是利用冷凍切片技術(shù),加上電子顯微鏡直接看蛋白質(zhì)結(jié)構(gòu),但缺點(diǎn)就是非常非常貴,太燒錢了。

冷凍電鏡的基本原理 | 圖源:Wikipedia

那大家猜猜這么些方法,測量了幾十年了,我們分析出來多少個(gè)蛋白質(zhì)結(jié)構(gòu)?其實(shí)已經(jīng)不少了,根據(jù)數(shù)據(jù)庫記載,現(xiàn)在實(shí)驗(yàn)已經(jīng)解析了18萬種蛋白質(zhì)

但是相對(duì)的,我們剛剛說到蛋白質(zhì)是氨基酸組成的,只要測序技術(shù)測得到DNA序列,就能推導(dǎo)出蛋白質(zhì)序列。查找數(shù)據(jù)庫可以發(fā)現(xiàn),現(xiàn)在已知的有十幾億種蛋白質(zhì)序列,這和18萬之間差了將近一萬倍。

所以結(jié)構(gòu)生物學(xué)家就很苦惱——測序太簡單了,導(dǎo)致結(jié)構(gòu)生物學(xué)遠(yuǎn)遠(yuǎn)跟不上測序的速度。

蛋白質(zhì)結(jié)構(gòu)解析數(shù)量變化 | 圖源:Nucleic acids research, 2019.

蛋白質(zhì)序列測序的速度 | 圖源:www.ncbi.nlm.nih.gov/genbank/statistics/

計(jì)算預(yù)測也許可以解決問題?

所以很多開發(fā)算法的計(jì)算生物學(xué)家就想預(yù)測結(jié)構(gòu),通過算法預(yù)測肯定比做實(shí)驗(yàn)快很多。但是剛剛也說了利文索爾悖論,預(yù)測結(jié)構(gòu)非常非常難,你要是窮舉那是天文數(shù)字。

所以有很多的計(jì)算思路,比如我可以類比,實(shí)驗(yàn)解出來的結(jié)構(gòu)我可以類比相似的序列,推測相似的序列會(huì)不會(huì)有相似的結(jié)構(gòu),這個(gè)叫同源建模;也可以拆開來類比,比完再像縫縫補(bǔ)補(bǔ)拼積木一樣把結(jié)構(gòu)拼出來,這個(gè)叫穿線法……但是這么多方法都有個(gè)問題:精度特別差。這就好像我想看1080P的高清視頻,但是怎么調(diào)都只有馬賽克高糊版,看都看不清。

做個(gè)類比的話,比如實(shí)際的蛋白結(jié)構(gòu)是左圖,但是預(yù)測結(jié)果往往只能得到左圖的效果,很多信息都無法得知(僅作示意進(jìn)行處理,實(shí)際并不僅僅是模糊,還會(huì)有很多完全不同的差別) | 圖源:Wikipedia

為了促進(jìn)各國科學(xué)家不斷向前,從1994年開始,每兩年都會(huì)舉辦CASP,叫蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵測試,來評(píng)估大家的算法預(yù)測準(zhǔn)不準(zhǔn),來提高算法的精度。

簡單來說就是從各種蛋白質(zhì)序列里挑幾個(gè)出來,一邊讓結(jié)構(gòu)生物學(xué)家做實(shí)驗(yàn)解出一個(gè)“標(biāo)準(zhǔn)答案”,然后計(jì)算生物學(xué)家就用自己的算法來比,看看誰跟標(biāo)準(zhǔn)答案更接近。

但很遺憾,24年過去了,仍然進(jìn)展很慢。

CASP官網(wǎng)

AI出場,勢不可擋

直到2018年,一個(gè)叫AlphaFold的方法出來,得到了80分的高分,兩年之后2020年AlphaFold二代打分到了90分,基本就和實(shí)驗(yàn)做出來的標(biāo)準(zhǔn)答案一樣了。還是剛剛1080P的比喻的話,別人預(yù)測像個(gè)馬賽克,但AlphaFold2預(yù)測就已經(jīng)差不多1000P,和1080P基本大差不差。

這個(gè)大家也知道了,就是Deepmind公司的德米斯·哈薩比斯約翰·M·詹珀開發(fā)的人工智能方法。

AlphaFold2方法預(yù)測的精度遠(yuǎn)遠(yuǎn)超過其他算法(圖a),同時(shí)預(yù)測的結(jié)果和實(shí)驗(yàn)結(jié)果基本吻合(圖b-d)| 圖源:Nature, 2021.

隨后這個(gè)方法開始廣泛應(yīng)用到了生物學(xué)上,一發(fā)不可收拾。

一是Deepmind開發(fā)的AlphaFold2算法,在短短幾個(gè)月時(shí)間里,就把幾十年結(jié)構(gòu)生物學(xué)家解析的沒解析完的蛋白質(zhì)都解了:人體98%的蛋白質(zhì)都試著預(yù)測了一遍,其中三分之一能準(zhǔn)確預(yù)測,還有一些也能大概預(yù)測一半多。同時(shí)他們聲稱后面幾個(gè)月就把數(shù)據(jù)庫擴(kuò)展到一億個(gè)蛋白質(zhì)。這就比實(shí)驗(yàn)方法快了上萬倍了。

基于AlphaFold2預(yù)測的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫

另一個(gè)生物學(xué)上的應(yīng)用,是同樣基于人工智能算法,由大衛(wèi)·貝克開發(fā)的RoseTTAFold,它挑戰(zhàn)的是更難的領(lǐng)域——怎么預(yù)測蛋白質(zhì)和蛋白質(zhì)相互結(jié)合,也在短時(shí)間預(yù)測了幾千種蛋白質(zhì)的相互結(jié)合。

RoseTTAFold的宣傳圖,最突出的就是對(duì)于蛋白質(zhì)互作的結(jié)構(gòu)預(yù)測

在AlphaFold2正式發(fā)布后只過了半年多,2022年7月,DeepMind公司的CEO,德米斯·哈薩比斯就在新聞發(fā)布會(huì)宣布:我們已經(jīng)掌握了“整個(gè)蛋白質(zhì)世界”(The entire protein universe)——AlphaFold馬不停蹄地運(yùn)轉(zhuǎn),成功完成了現(xiàn)有蛋白質(zhì)數(shù)據(jù)庫中全部2.14億種蛋白質(zhì)的結(jié)構(gòu)預(yù)測。

德米斯·哈薩比斯 | 圖源:Jung Yeon-Je/AFP/Getty

2.14億種蛋白質(zhì)中,有35%被評(píng)估為高度準(zhǔn)確,雖然這個(gè)數(shù)字看起來不高,但是按照目前實(shí)驗(yàn)檢測的水平,全部做完也就差不多這個(gè)水平——更何況,截至目前實(shí)驗(yàn)檢測花了幾十年也只測出了14萬種。

僅在DeepMind公司宣布完成了“整個(gè)蛋白質(zhì)世界”三個(gè)月后,2022年10月,Meta公司(原名Facebook)就拓寬了這個(gè)“蛋白質(zhì)世界”的邊界(‘dark matter’ of the protein universe)——他們利用自己開發(fā)的大型語言模型算法ESMFold,預(yù)測了6.17億種來自宏基因組信息的微生物蛋白質(zhì)結(jié)構(gòu)。

ESMFold算法的準(zhǔn)確度雖然略遜于AlphaFold,但它的優(yōu)勢在于能以60倍于AlphaFold的速度去預(yù)測短序列蛋白質(zhì)的結(jié)構(gòu),這就使得它在預(yù)測結(jié)構(gòu)相對(duì)簡單的微生物蛋白質(zhì)上有了很大的優(yōu)勢。

6.17億種蛋白質(zhì)結(jié)構(gòu)的全覽 | 圖源:ESM Metagenomic Atlas

沒過幾天,AI又開始顛覆生物學(xué)家的認(rèn)知了——?jiǎng)?chuàng)造蛋白質(zhì)。

這其實(shí)是一個(gè)和蛋白質(zhì)結(jié)構(gòu)預(yù)測剛好相反的問題:蛋白質(zhì)結(jié)構(gòu)預(yù)測是從序列到結(jié)構(gòu),而創(chuàng)造蛋白質(zhì)是要求從我們希望得到的結(jié)構(gòu),反推出合適的蛋白質(zhì)序列。過去這是個(gè)計(jì)算量巨大的工作,現(xiàn)在AI也能完成了。

四種目前常用的設(shè)計(jì)蛋白質(zhì)策略 | 圖片翻譯自:Nature

相比于大批量預(yù)測蛋白質(zhì)結(jié)構(gòu),創(chuàng)造蛋白質(zhì)的目的就更加明確——我們希望能創(chuàng)造出自然界不存在,但是對(duì)人類非常有用的蛋白質(zhì)。

設(shè)計(jì)蛋白質(zhì)的嘗試還在不斷進(jìn)步和迭代,已經(jīng)逐漸用到了實(shí)際應(yīng)用當(dāng)中。例如在RoseTTAFold的研究中,利用ProteinMPNN和RoseTTAFold方法設(shè)計(jì)出來的蛋白質(zhì),不僅在自然界完全不存在,并且大大提高了這些蛋白質(zhì)結(jié)構(gòu)的穩(wěn)定性,預(yù)計(jì)在未來會(huì)被用作疾病治療的抗原抗體,或者生物化學(xué)反應(yīng)所需的生物酶。

蛋白質(zhì)設(shè)計(jì)的過程,通過不斷改變序列讓蛋白質(zhì)結(jié)構(gòu)趨于穩(wěn)定(結(jié)構(gòu)的穩(wěn)定基于AlphaFold預(yù)測,越紅代表越不穩(wěn)定,越藍(lán)代表越穩(wěn)定) | 圖源:Nature

不少人可能要問了:預(yù)測蛋白質(zhì)結(jié)構(gòu),到設(shè)計(jì)蛋白質(zhì),有啥用呢?

我們最開始就提到了蛋白質(zhì)在我們生活無處不在,而蛋白質(zhì)要發(fā)揮功能,基礎(chǔ)是要有一定的結(jié)構(gòu)。所以預(yù)測蛋白質(zhì)結(jié)構(gòu),可以幫助我們更好地理解蛋白質(zhì)的功能,進(jìn)而去比如構(gòu)建蛋白質(zhì)分子藥物,或者研究復(fù)雜的生物化學(xué)現(xiàn)象。

一個(gè)最簡單的例子,比如現(xiàn)在我們知道新型冠狀病毒的新變異奧密克戎傳播力特別強(qiáng),而這傳播關(guān)鍵的刺突蛋白結(jié)構(gòu),就可以利用人工智能來預(yù)測,進(jìn)而可以推測什么藥物或者治療方法可以更有效的針對(duì)奧密克戎。

使用AlphaFold預(yù)測的奧密克戎突變體的S蛋白結(jié)構(gòu)

但同時(shí),雖然說人工智能已經(jīng)完成了結(jié)構(gòu)生物學(xué)家很多的工作,但是這個(gè)預(yù)測仍然是不完善的:

比如有些復(fù)雜的結(jié)構(gòu),可能結(jié)構(gòu)生物學(xué)家實(shí)驗(yàn)還沒有解析出來,人工智能也就還沒辦法學(xué)習(xí)到,因此也預(yù)測不出來,所以很多問題仍然需要結(jié)構(gòu)生物學(xué)家的深入探究;

還有很多蛋白在發(fā)揮功能的時(shí)候是一個(gè)動(dòng)態(tài)變化的過程,這種時(shí)候預(yù)測的結(jié)果就不準(zhǔn)確,還是用1080P舉例的話,就是理論上是一個(gè)1080P的視頻,但是人工智能在這幾秒預(yù)測出來是1080P高清,那幾秒預(yù)測出來卻是馬賽克,所以也不準(zhǔn)確。

這些都是人工智能預(yù)測蛋白質(zhì)的瑕疵,但是瑕不掩瑜,人工智能在蛋白質(zhì)結(jié)構(gòu)預(yù)測帶給我們的驚喜實(shí)在太多了,而這項(xiàng)諾貝爾獎(jiǎng),就是計(jì)算科學(xué)在生命科學(xué)上應(yīng)用的最好證明。

參考資料:

Callaway E. 'The entire protein universe': AI predicts shape of nearly every known protein[J]. Nature, 2022, 608(7921): 15-16.

Lin Z, Akin H, Rao R, et al. Evolutionary-scale prediction of atomic-level protein structure with a language model[J]. Science, 2023, 379(6637): 1123-1130.

Callaway E. Scientists are using AI to dream up revolutionary new proteins[J]. Nature, 2022.

Ferruz N, Heinzinger M, Akdel M, et al. From sequence to function through structure: deep learning for protein design[J]. Computational and Structural Biotechnology Journal, 2022.

Wicky B I M, Milles L F, Courbet A, et al. Hallucinating symmetric protein assemblies[J]. Science, 2022, 378(6615): 56-61.

Wang J, Lisanza S, Juergens D, et al. Scaffolding protein functional sites using deep learning[J]. Science, 2022, 377(6604): 387-394.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
益陽市安化縣水利局黨組書記、局長謝智興被查

益陽市安化縣水利局黨組書記、局長謝智興被查

三湘都市報(bào)
2026-06-22 16:25:38
阿根廷VS奧地利:阿根廷本場不必死磕對(duì)手,奧地利有望拿到1分

阿根廷VS奧地利:阿根廷本場不必死磕對(duì)手,奧地利有望拿到1分

體育吐槽
2026-06-22 16:04:02
18歲森碟海邊度假照走紅,放棄娛樂圈專注網(wǎng)球成榜樣

18歲森碟海邊度假照走紅,放棄娛樂圈專注網(wǎng)球成榜樣

調(diào)侃國際觀點(diǎn)
2026-06-22 14:08:53
中紀(jì)委怒批:公務(wù)員也是人,正常生活不應(yīng)問責(zé)處理!

中紀(jì)委怒批:公務(wù)員也是人,正常生活不應(yīng)問責(zé)處理!

職場資深秘書
2026-06-21 13:59:22
當(dāng)年買了泰坦尼克號(hào)票的8位頂級(jí)富豪,為何開船前,卻都沒上船?

當(dāng)年買了泰坦尼克號(hào)票的8位頂級(jí)富豪,為何開船前,卻都沒上船?

云霄紀(jì)史觀
2026-06-21 23:44:07
湖北省武漢市東西湖區(qū)委原書記彭濤被“雙開”

湖北省武漢市東西湖區(qū)委原書記彭濤被“雙開”

界面新聞
2026-06-22 15:00:27
澳門警察街頭執(zhí)行任務(wù)時(shí)突然被搶劫,九名男子一擁而上將其圍堵,勒住脖子扇巴掌搶走手機(jī),最新通報(bào):涉案7人已被抓

澳門警察街頭執(zhí)行任務(wù)時(shí)突然被搶劫,九名男子一擁而上將其圍堵,勒住脖子扇巴掌搶走手機(jī),最新通報(bào):涉案7人已被抓

極目新聞
2026-06-22 16:32:57
兩性關(guān)系:不管你信不信,女性過了45歲后,基本都有這7個(gè)現(xiàn)狀

兩性關(guān)系:不管你信不信,女性過了45歲后,基本都有這7個(gè)現(xiàn)狀

荔子言
2026-06-11 13:28:05
醫(yī)生:希望你的血脂報(bào)告里,永遠(yuǎn)不要出現(xiàn)這3項(xiàng)異常

醫(yī)生:希望你的血脂報(bào)告里,永遠(yuǎn)不要出現(xiàn)這3項(xiàng)異常

垚垚分享健康
2026-06-22 17:05:21
烏克蘭猛烈襲擊克里米亞

烏克蘭猛烈襲擊克里米亞

名人茍或
2026-06-22 15:09:44
“沒義務(wù)給C羅傳球” 孔塞桑社媒被沖:你算哪根蔥 學(xué)學(xué)阿根廷球員

“沒義務(wù)給C羅傳球” 孔塞桑社媒被沖:你算哪根蔥 學(xué)學(xué)阿根廷球員

風(fēng)過鄉(xiāng)
2026-06-22 13:19:35
學(xué)醫(yī)后才知道,腦梗最危險(xiǎn)信號(hào),不是手腳麻,而是頻繁出現(xiàn)5癥狀

學(xué)醫(yī)后才知道,腦梗最危險(xiǎn)信號(hào),不是手腳麻,而是頻繁出現(xiàn)5癥狀

敘說醫(yī)療健康
2026-06-18 08:00:23
小米股價(jià)創(chuàng)年內(nèi)新低 425億港元配售參與機(jī)構(gòu)浮虧55%

小米股價(jià)創(chuàng)年內(nèi)新低 425億港元配售參與機(jī)構(gòu)浮虧55%

YOUNG財(cái)經(jīng)
2026-06-22 20:46:23
豐田第六代THS混合動(dòng)力亮相,綜合續(xù)航一千四百公里,沖擊國產(chǎn)混動(dòng)市場

豐田第六代THS混合動(dòng)力亮相,綜合續(xù)航一千四百公里,沖擊國產(chǎn)混動(dòng)市場

華庭講美食
2026-06-22 18:12:41
2026年,結(jié)婚人數(shù)又破紀(jì)錄了!

2026年,結(jié)婚人數(shù)又破紀(jì)錄了!

巢客HOME
2026-06-21 07:20:07
有退休金的人發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:手里有20、30萬存款的老人,最后過得好的,幾乎都做了同兩個(gè)讓子女意外的決定

有退休金的人發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:手里有20、30萬存款的老人,最后過得好的,幾乎都做了同兩個(gè)讓子女意外的決定

心理觀察局
2026-06-07 06:37:04
沈陽戶外大咖冰峰去世,年僅55歲

沈陽戶外大咖冰峰去世,年僅55歲

極目新聞
2026-06-22 16:04:00
張亮與19歲兒子天天合體拍攝,“張亮天天共用一張臉”登上熱搜

張亮與19歲兒子天天合體拍攝,“張亮天天共用一張臉”登上熱搜

韓小娛
2026-06-22 11:52:50
“牛市旗手”大漲!300085,午后封住“20CM”漲停

“牛市旗手”大漲!300085,午后封住“20CM”漲停

大眾證券報(bào)
2026-06-22 16:03:48
工行、農(nóng)行、中行、建行、交行,集體宣布!

工行、農(nóng)行、中行、建行、交行,集體宣布!

新浪財(cái)經(jīng)
2026-06-22 14:46:31
2026-06-23 01:32:49
biokiwi incentive-icons
biokiwi
用生命科學(xué)的角度看世界!
160文章數(shù) 566關(guān)注度
往期回顧 全部

科技要聞

馬云與阿里巴巴眾高管下田插秧

頭條要聞

媒體:中國"兩箭齊發(fā)"反制美國 不賣了也不買了

頭條要聞

媒體:中國"兩箭齊發(fā)"反制美國 不賣了也不買了

體育要聞

法國球星祝中國隊(duì)下屆世界杯取得好成績

娛樂要聞

陪睡陪玩是皮毛,向佐揭內(nèi)娛暗規(guī)則

財(cái)經(jīng)要聞

前美聯(lián)儲(chǔ)主席格林斯潘去世 享年100歲

汽車要聞

華為智駕ADS限時(shí)優(yōu)惠月底結(jié)束 7月1日前下訂立省3000元

態(tài)度原創(chuàng)

家居
本地
手機(jī)
公開課
軍事航空

家居要聞

綠意盎然 自然之境

本地新聞

吃一次廣東龍舟飯,才懂什么是豪華盛宴

手機(jī)要聞

三星Galaxy S27 Pro再曝,有望配備防窺屏

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

東風(fēng)-17發(fā)射狀態(tài)首次公開 多車齊射場面硬核

無障礙瀏覽 進(jìn)入關(guān)懷版