網易首頁 > 網易號 > 正文 申請入駐

人工智能驅動的科學進步到哪一步了?|附AI摘要與評論

0
分享至

一位科技公司首席執行官解釋了為什么人工智能可能短期內無法治愈疾病,仍然需要人類。

凱文·魯斯、凱西·牛頓和瑞秋·科恩


AI摘要與評論

這段對話以冷靜、務實的技術視角,對人工智能將徹底改變科學和醫學的種種宏大承諾提出了反駁。通過與科學家、技術專家、FutureHouse 和 Edison Scientific 的創始人 Sam Rodriques 的深入對話,主持人探討了一個核心問題:如果人工智能如此強大,為什么它還沒有治愈疾病或以顯而易見的方式改變科學發現?

羅德里格斯的回答既不輕蔑也不理想化。相反,他重新定義了問題。人工智能,例如Kosmos這類工具所體現的人工智能,已經在改變科學——但這種改變是特定且有限的。Kosmos 并不會自主地發明治療方法;它加速了研究的分析階段。通過閱讀數千篇論文、編寫數萬行代碼以及整合龐大的數據集,它可以在數小時內完成相當于人類數月分析工作的任務。至關重要的是,這種加速是通過實證研究來衡量的:Kosmos 重現了人類研究人員花費數月時間才發現的未發表的研究成果。在某些情況下,它甚至提出了真正全新的假設,例如識別出將基因變異與 2 型糖尿病聯系起來的機制。

然而,羅德里格斯反復強調,這只是科學流程的一部分。科學包括決定收集哪些數據、收集數據,然后解釋數據。Kosmos 主要解決的是第三步。更深層次的瓶頸——實驗設計、數據生成、臨床試驗、患者招募、生產制造和監管審批——仍然頑固地依賴于人、材料,而且進展緩慢。這就是為什么羅德里格斯認為人工智能“十年內治愈所有疾病”的說法難以置信。即使假設完美無缺,生物學的發展也遵循著任何計算都無法壓縮的時間尺度。

這段對話的價值尤其在于它駁斥了一個常見的誤解:即智能不足是醫學發展的主要障礙。羅德里格斯認為,真正的限制在于知識的匱乏和實驗中不可避免的不確定性。即使是擁有無限智能的系統,也無法推斷出從未經過實證檢驗的世界事實。人工智能可以幫助設計更完善的實驗,但它無法取代實際操作實驗的必要性。從這個意義上講,這段對話巧妙地抵制了技術決定論的敘事,并重申了科學實踐核心的認知謙遜。

另一個關鍵主題是可靠性。Kosmos 和人類一樣,也會犯錯。它的輸出結果需要仔細解讀和驗證,但羅德里格斯將其重新定義為一種延續性而非危機:科學家們已經花費大量時間互相檢查彼此的工作,而且驗證的速度總是比最初的發現更快。真正的風險并非錯誤本身,而是將速度誤認為確定性。

討論還將 Kosmos 置于更廣闊的“人工智能服務于科學”的背景下。Rodriques 明確區分了科學過程建模(生成假設的智能體)和自然世界建模(例如 AlphaFold 或生成式抗體設計等系統)。后者,尤其是生成式生物模型,代表著一次深刻的變革:從頭設計蛋白質、抗體甚至生物體的能力。這些進展或許比解決數學奧林匹克難題等象征性里程碑更具變革性,盡管它們更難衡量,驗證也更耗時。

或許最具哲學趣味的是關于“意外發現”的討論。科學突破往往源于錯誤、噪聲或天真的實驗——這些特征似乎與以優化為導向的人工智能系統相悖。羅德里格斯認為,人工智能科學家或許需要刻意保留甚至人為地引入隨機性和誤差,這與生物進化本身遙相呼應。這一見解巧妙地挑戰了“進步只能來自效率”的假設。

總的來說,這段對話在不削弱人工智能驅動科學重要性的前提下,揭開了其神秘面紗。它描繪了一個未來:人工智能不會取代科學家,而是重塑他們的認知勞動——將數月的分析壓縮到幾天之內,拓展假設空間,并促使人類扮演更具策展性和解釋性的角色。這場變革即便到來,也會比炒作所暗示的更加悄無聲息、緩慢推進——但其意義卻絲毫不減。

正文


各大人工智能實驗室的負責人認為,人工智能將開啟科學發現的新時代,幫助我們治愈疾病,并加快應對氣候危機的能力。但迄今為止,人工智能究竟為科學做出了哪些貢獻呢?

為了更好地了解情況,我們采訪了薩姆·羅德里格斯,他是一位從科學家轉型為技術專家的學者,目前正通過其非營利組織FutureHouse和一家營利性衍生公司Edison Scientific開發用于科學研究的人工智能工具。Edison Scientific最近發布了Kosmos——一款人工智能代理(或者用該公司的話來說,是一款人工智能科學家),該公司聲稱它只需運行12小時即可完成相當于六個月博士或博士后水平的研究工作。

Sam 向我們詳細介紹了 Kosmos 的工作原理,以及為什么像這樣的工具能夠顯著加快數據分析速度。他還探討了為什么一些關于人工智能治愈疾病的驚人說法并不現實,以及在真正實現人工智能加速的未來道路上仍然存在哪些瓶頸。

以下是我們對話的文字記錄,為了清晰簡潔,略作編輯。

羅斯:所以,我們今天請您來擔任科學專家,為我們介紹近期人工智能在科學領域取得的重大突破。我隱約知道這個領域很重要,也知道它正在發生很多大事,但我們倆都不是科學家,雖然我小學時確實做過一個很棒的小蘇打火山。所以今天我們有很多話題要聊,但在深入探討細節之前,我想先問問您一直在進行的項目。上個月,您非營利組織的商業部門——愛迪生科學公司——推出了一款名為Kosmos的人工智能科學家。您說,Kosmos一次運行就能完成相當于博士或博士后六個月的工作量。請您介紹一下Kosmos的工作原理,以及這個“六個月”的數字是怎么來的。

羅德里格斯:沒錯,正是如此。實際上,我想先說明一下,當我看到六個月的數據時,我的第一反應是“這不可能”,對吧?現在我們已經用多種不同的方法進行了驗證。我可以詳細地向大家解釋一下。但簡單來說,我們花了兩年時間研究如何構建一個人工智能科學家。這里的核心理念是,我們能做的科學研究遠遠超過了我們擁有的科學家數量,對吧?那么,我們該如何擴大科學研究的規模呢?Kosmos 最酷的地方在于,我認為它是我們開發的第一個真正讓人感覺像人工智能科學家的工具,當你使用它時,你會感覺它就像一個真正的人工智能科學家,對吧?也就是說,你輸入一個研究目標,它就會進行研究,然后返回一些非常深刻、有趣的見解,這些見解有時是錯誤的,但大約 80% 的情況下都是正確的。這有點像你讓一個人離開去做某件事,他回來后有差不多的概率做對。而且,使用這種方法是一種全新的體驗,所以非常令人興奮。

具體來說,我們計算六個月這個數字的方法是這樣的:我們找了一群學術合作者,他們都是之前做過很多研究但尚未發表的科學家。我們把同樣的研究目標和數據集交給人工智能系統 Kosmos,讓它去進行新的探索和發現。結果它回來后發現的和研究人員一夜之間發現的完全一樣。然后我們再去問這些研究人員,他們最初花了多長時間才發現這些?他們會說三個月、五個月、六個月等等。這就是六個月這個數字的由來。也就是說,這就是他們得出這個發現所花費的時間。

凱西·牛頓:那我先問幾個問題,好讓我更好地了解情況。這個工具是不是像其他聊天機器人一樣,是一個可以輸入文字的框?如果是的話,它的技術基礎是什么?你們是從零開始構建自己的模型嗎?還是在其他公司的模型基礎上進行了微調?

羅德里格斯:沒錯,就是這樣。它確實是一個輸入框,你可以在上面輸入內容。你可以向它提出一個研究目標。它不是聊天機器人,對吧?它會運行大約12個小時,最終將結果反饋給你。在構建方面,我們基于OpenAI、谷歌和Anthropic等公司提供的多種語言模型。每次運行,我們都會使用來自不同供應商的模型。我們還有一些針對特定任務的內部訓練模型,這些模型比前沿供應商提供的模型更適合我們訓練的特定任務。Kosmos的關鍵在于它使用了我們稱之為“結構化世界模型”的東西。目前人工智能系統的一個主要局限在于,它們能夠執行的任務長度和復雜程度都有限,超過這個限度就會失控。它們會忘記自己正在做什么,不再專注于任務。我們最終找到了一種方法,讓他們能夠為這個隨著時間推移而不斷構建的世界模型做出貢獻,這個模型基本上描述了他們正在執行的任務的全部知識狀態。這意味著我們可以協調數百個不同的智能體并行或串行運行,并讓它們朝著一個共同的目標努力。這才是真正的突破。

羅斯:沒錯。我覺得 Kosmos 還有一點很有意思,就是它的價格。這個型號每個提示要 200 美元。

羅德里格斯:是的。

羅斯:所以每次你給它布置任務,都要支付 200 美元。為什么這么貴?

羅德里格斯:我的意思是,它需要大量的計算資源。我的意思是,最根本的答案就是它需要大量的計算資源,對吧?

羅斯:比如,讓我們大概了解一下有多少。

羅德里格斯:嗯,Kosmos 每次運行平均會編寫 42,000 行代碼,并讀取 1,500 篇研究論文。相比之下,Claude 可能只會編寫幾百行代碼,對吧?所以你應該能體會到其中的差別。這需要大量的計算資源。

牛頓:你有沒有遇到過這樣的科學家:他的貓走過鍵盤,不小心按了回車鍵,結果一下子花了 600 美元?

羅德里格斯:這確實是個問題。這確實是個問題。所以,你必須明白,如果你是一名科學家,你去做一個實驗,收集一些數據,你可能要花費5000美元或10000美元。因此,科學家們想要的是盡可能最佳的性能。像那些使用過Kosmos的科學家,他們通常會回來告訴我,他們簡直不敢相信我們只收200美元,對吧?你知道,我會說,現在的200美元是促銷價。實際上,我們最終還是要漲價的。

羅斯:哦,它正在上漲。所以圣誕節前趕緊把那些提示發過來!

羅德里格斯:沒錯。但說真的,你知道,如果你要花幾千美元收集數據,最終限制因素就不是成本了。我們必須在退款方面非常慷慨,因為人們總是會犯錯。

牛頓:啊,我打錯字了。

羅德里格斯:沒錯,正是如此。

羅斯:所以你剛才提到的那些測試,比如你們為了弄清楚這個系統能運行多久,能為科學家節省多少時間而進行的測試,其實就是對現有研究的重復。但我們從那些運營大型人工智能實驗室的人那里聽到的很多說法是,人工智能很快就能做出全新的科學發現。我們將開始做一些現有科學方法和流程無法完成的事情。我們離那一天還有多遠?

羅德里格斯:實際上,這種情況已經發生了。如果你去閱讀我們發表的關于“宇宙號”探測器的論文,你會發現我們提出了七項結論,其中三項是對現有發現的重復驗證,四項是對科學文獻的全新貢獻,例如新的發現。

牛頓:那么,在這些成就中,哪一項最令人印象深刻?

羅德里格斯:所以,我們非常喜歡的一個例子是,人類基因組包含數百萬個基因變異,對吧?這些是不同個體DNA之間的差異,與疾病相關。大多數情況下,我們知道某個變異與某種疾病相關,但我們不知道為什么,對吧?所以我們向Kosmos提供了大量關于不同遺傳因素的原始數據,比如變異是什么,哪些蛋白質與變異附近結合等等,然后我們讓它針對2型糖尿病,識別與其中一個變異相關的機制。結果它發現,這是一個不在基因中的變異。Kosmos識別出,它實際上與另一種蛋白質結合。它能夠識別出結合的蛋白質以及正在表達的基因,并將這些信息與該基因的實際機制聯系起來,即SSR1基因,該基因參與胰腺分泌胰島素,對吧?

牛頓:好的,所以我的理解是,你的模型能夠對一些現有數據進行非常巧妙的推理,并識別出一些其他人類科學家尚未發現,而且可能在很長一段時間內都無法發現的東西?

羅德里格斯:是的,沒錯。

牛頓:好的。

羅德里格斯:我認為科學研究通常包括決定收集哪些數據、收集數據,然后得出結論。所以,基本上,目前這就像“宇宙號”探測器所針對的第三步。你知道,還有更多的工作要做——

牛頓:你漏掉了第零步,也就是讓特朗普政府解凍你的資金。但其他方面都對。

羅德里格斯:(笑聲)

羅斯:那么,當你從科斯莫斯探測器那里獲得這樣的發現時,接下來會發生什么?你需要去驗證它嗎?你會把它交給一個研究團隊,讓他們確保它有效嗎?接下來會發生什么?

羅德里格斯:是的,當然。你必須去驗證它。實際上,這也是我們在論文中描述如何驗證特定變體的原因之一。一般來說,當人們使用它時,是的,你需要進行一些操作。我的意思是,實際上,當你運行一次 Kosmos 程序時,你首先要做的是理解它告訴你的信息。因為它完成的工作相當于科學家們六個月的工作量,你需要花很長時間閱讀和理解它。一旦你閱讀并理解了它,那么是的,你確實需要進行各種實驗,進行你自己的分析,進行交叉驗證,以說服自己這是真的。然后,根據你的研究目標,你將決定下一步,對吧?你知道,在這種情況下,我認為從這個特定發現中找到新藥靶點的可能性很低,對吧?但是你可以繼續研究其他發現,然后最終,也許你會發現新的藥物靶點,啟動一個藥物研發項目,你知道——

羅斯:我聽到人們對像 Kosmos 這樣的模型表達的一種擔憂是,這似乎并非真正的障礙所在。我們之所以沒有更多人工智能發現的藥物或設計藥物來治愈疾病,并非因為我們缺乏發現這些藥物的研究方法,而是因為藥物研發還需要進行臨床試驗、招募人體受試者并獲得 FDA 批準。所有這些都比實際發現藥物本身花費的時間要長得多。那么,像這樣的模型目前在我們的科學進程中究竟在幫助解決哪些問題呢?

羅德里格斯:沒錯,完全同意。我非常贊同,解決醫學難題的瓶頸最終在于臨床試驗。最簡單的例子就是看看我們能在小鼠身上治愈多少種疾病,對吧?數量驚人,因為顯然我們可以直接進行實驗,但在人體試驗中,進展就非常緩慢。也就是說,如果你認為制藥公司現在進行的每一個實驗,比如每一項臨床試驗,都是基于現有全部知識精心策劃和設計的,那你就太天真了,對吧?根本不可能。而且這些實驗耗資數億美元。所以問題是,我們最終還是要進行臨床試驗。那么,我們如何確保這些實驗是在我們掌握所有知識和數據的情況下所能進行的最佳實驗呢?我們擁有大量數據,其中蘊含著等待被發現的洞見,只是我們缺乏人手去發現它們,而這最終將有助于我們進行更好的實驗和試驗,對吧?

牛頓:那么,我很好奇您認為您的工具將如何融入當今科學家的工作流程。比如,我已經完成了實驗,現在需要一些分析方面的幫助嗎?或者,我有一些以前只做過少量分析的實驗,想知道是否還能從中挖掘出更多價值?或者,您認為人工智能目前還能在哪些方面真正幫助到科研人員?

羅德里格斯:是啊,問得好。讓我回到2019年,也就是我即將完成博士學位的時候。當時我有一個龐大的數據集,而且我當時想畢業,因為我是博士生,這意味著我一年能掙4萬美元左右,有很多機會可以出去工作,不再做博士生了。好吧,所以我花了整整六個月的時間坐在書桌前,試圖分析數據、得出結論、閱讀論文等等。現在,Kosmos 正好可以解決這個問題。你知道,你只需要把數據集交給 Kosmos,它就會得出很多結論。目前,你還需要做很多手動工作來驗證這些結論等等。很快它就能得出結論,而你就會說:“太好了。”

羅斯:薩姆,我想請你幫我們和聽眾介紹一下目前人工智能科學領域的現狀。最近,白宮宣布了一項名為“創世紀計劃”(Genesis Mission)的聯邦項目,旨在收集和利用聯邦政府掌握的所有數據集,并將其用于新的科學探索。我們也有很多類似的項目,包括你自己的項目,以及科技行業、生物技術行業、材料科學領域的人工智能研究等等。請你大致介紹一下目前人工智能科學領域的熱點是什么,以及資金和精力都投入到了哪些方面?

羅德里格斯:沒錯。要理解人工智能和科學的現狀,首先,也是最根本的一點,你必須明白人工智能的本質是構建模型,對吧?比如說,語言模型,那么什么是語言模型呢?語言模型本質上就是人類語言的模型。恰好,當你構建一個人類語言模型時,它會在某種意義上學習像人類一樣思考,因為人類是用語言來編碼他們的思想的。這可以說是最偉大的發現之一,對吧,當然是21世紀最偉大的發現,甚至可能是史上最偉大的發現之一。同樣地,當我們談論人工智能在科學領域的應用時,你必須明白,你是在對事物進行建模。這就是人工智能的本質。這里大致可以分為兩大類:一是模擬自然世界,對吧?二是模擬科學研究過程。這兩者本質上是不同的,之所以要區分它們,是因為,你知道,我們正在做的,對吧,我們正在模擬科學研究的過程。人工智能在科學領域的另一面是構建模型,例如,可以預測蛋白質的結構,可以生成新的抗體,可以從頭開始創造新的生物體,所有這些都是 2025 年即將發生的事情,勢頭非常強勁。

羅斯:是的,這很有道理。我的意思是,在模擬自然世界的過程中,你提到了蛋白質折疊、新型生物體等等,作為一名科學家,你所看到的哪些現象最讓你興奮?

羅德里格斯:所以,我認為目前最令人興奮的,毫無疑問,就是我們所說的生成模型的發展趨勢。這些模型可以從零開始生成具有所需特征的蛋白質、抗體或其他任何東西。這是我們以前從未擁有過的全新能力,意義非凡。

牛頓:我很好奇你做這些實驗時遇到的可靠性問題。你知道,我這周在社交媒體上看到一個說法,我自己也驗證了。如果你問谷歌:“2026年是明年嗎?”它會回答:“不,2026年不是明年,而是后年。”所以,薩姆,在這種情況下,有些人可能會擔心我們現在把所有的數據分析都交給人工智能。那么,科學家們需要花多少時間去重新檢查人工智能的工作?這會給他們的工作帶來多大的影響?

Kevin Roose 和 Casey Newton 是播客節目《Hard Fork》的主持人,該節目旨在解讀瞬息萬變的科技世界。歡迎訂閱收聽。

羅德里格斯:是啊,這太搞笑了。我的意思是,你看,你得花很多時間回頭檢查。但說清楚點,不管是人工智能做的還是你讓朋友做的,情況都是如此。如果你要發表論文,你最好回頭檢查一遍,確保自己有信心。而且永遠不可能百分之百準確,對吧?你所能做的最好的就是達到和你自己做的差不多的水平,但這并非百分之百準確,因為你不可能完美無缺。而且檢查工作總是比一開始就寫出來要快得多。快得多。

羅斯:歷史上許多最偉大的科學突破都源于這類奇特的偶然事件,這類意外發現的時刻。你知道,青霉素在培養皿中開始生長,我們突然意識到,“天哪,這太棒了!”人工智能會保留這種意外發現嗎?還是會通過某種優化手段將其消除?

羅德里格斯:是的,這是一個很好的問題,但事實是我們目前真的還不知道。這將是一個非常重要的核心問題,很多人都在問。

魯斯:你對此有何直覺?

羅德里格斯:我認為他們很可能會這么做,因為——

羅斯:他們大概會把它保存下來吧?

羅德里格斯:他們可能會保存下來,因為青霉素的發現,據我了解,基本上就是把一扇窗戶打開,放在一些沒有添加抗生素的瓊脂上。顯然,當時他們還沒有抗生素,因為這是第一個抗生素的發現,對吧?所以,窗戶打開,上面放著一些瓊脂,一些孢子飛到上面開始生長,他們觀察到細菌受到了抑制,對吧?這是一個錯誤。有人搞砸了,對吧?而這個錯誤卻帶來了驚人的發現,我認為,總會有一些錯誤被保存下來。

牛頓:但與此同時,科學家們應該始終敞開窗戶。你永遠不知道會發生什么。

羅德里格斯:你沒聽錯,說真的,學術界有很多東西值得挖掘,對吧?尤其是研究生,一年級的研究生,他們根本不知道該做什么。他們完全不知道該做什么。而這正是科學進步的巨大源泉,因為他們會做一些最隨機、最古怪的事情,那些真正懂行的人想都想不到,但實際上,這些事情真的非常重要。

Roose:你幾乎希望你的人工智能科學家模型能產生一點幻覺。

羅德里格斯:完全正確。或者說,就是增加噪音,對吧?我們討論過,這就像是為了增加噪音,而這實際上對生物進化也很重要,對吧?比如基因組里有很多噪音,進化就是這樣隨機地產生新的東西的,就像有一種蛋白質,一開始完全隨機,什么也不做,然后有一天,突然之間,哎呀,它開始起作用了,這很棒,對吧?

Roose:你如何看待像 Demis、Dario 和 Sam Altman 這樣的大型人工智能實驗室的領導者,他們說,“人工智能將在未來一二十年內使我們能夠治愈所有疾病或大多數疾病”?

羅德里格斯:這十年真是瘋狂。哦,我很樂意在這件事上表明我堅定的立場,因為如果我錯了,那豈不是好事嗎?如果我錯了,那大家都是贏家。總之,這十年真是瘋狂。

羅斯:為什么說這是瘋狂的?

羅德里格斯:因為,正如我們之前討論的那樣:你必須進行臨床試驗。如果我們現在有一種藥物可以阻止衰老,完全阻止25歲到65歲之間人類的衰老,你也得等上十年才能知道結果,因為在這個年齡段,你至少需要五到十年的時間才能檢測到人類是否在衰老。也就是說,你無法在一年之內檢測到衰老。所以,你無法知道這種藥物是否有效。

牛頓:我不知道。我高中畢業十年同學聚會上,有些人看起來已經很憔悴了。

羅德里格斯:(笑聲)

牛頓:真不想這么說。

羅德里格斯:我的確說過是 25!

牛頓:好吧,有道理。

羅德里格斯:沒錯。我的意思是,我們必須進行實驗。這些實驗需要時間。現在,30年,我認為是完全有可能的。我們不知道未來會發生什么。我們不知道是否有可能阻止衰老。我們不知道是否有可能治愈所有疾病等等,但從現在到未來30年,我認為我們應該會看到我們在知識方面取得巨大的飛躍。

牛頓:讓我再深入探討一下,因為我覺得有些人可能會誤解,認為這本質上是一個監管問題,我們目前還沒有相應的機構,比如FDA,來衡量這方面的情況。不過,我對實驗方面更感興趣。因為據我了解,我們沒有足夠的生物學家來開展所有我們想做的實驗。我們可能也沒有足夠的資金來支持這些實驗。而且您也提到過,有些實驗確實需要很長時間才能完成。那么,您認為有哪些因素會導致疾病防治工作如此困難呢?

羅德里格斯:我的天哪。你得去,你知道,就算你有一個想在人體上測試的分子,也知道你想在哪些人身上測試,你還得去制備它,對吧?人體很大,需要大量的藥物。你必須確保它的純度足夠高,才能真正用于人體。你得找到病人,這意味著要和醫生建立關系,對吧?實際上,你知道,你得等到有足夠多的病人愿意做試驗。很多疾病的病人本來就不多。所以找到病人很難,對吧?然后你還得給他們用藥。你得等著看結果,對吧?即使沒有監管,這個過程也會很慢。

牛頓:是的。幾乎所有這些問題都沒有人工智能的捷徑可走,至少目前還沒有。

羅德里格斯:不,人工智能能讓我們做的是,它能讓我們發現很多我們已經掌握了相關信息的事物。我們只是還沒弄明白而已。人工智能研究人員有時會談到另一點,這可能不太合理,那就是你不應該指望有一天你能得到GPT-7,然后問它如何治療阿爾茨海默病,它就能告訴你答案。我的預期是,我們掌握的知識還不夠。原則上,即使擁有無限的智能,我們也沒有足夠的知識來解決這個問題,對吧?即使擁有無限的智能,仍然會有一些關于世界的未知領域,我們需要通過實驗來探索。你可以根據已知的一切來設計最佳的實驗方案,但你不可能從零開始,完全摸索出答案,對吧?

羅斯:凱西,我學過拉丁語。拉丁語的意思是“來自新的”。

牛頓:哦,謝謝,謝謝。這省去了我上網搜索的步驟。

羅斯:這嚴格來說不算科學,但我很好奇你對此有何看法,薩姆。所有的大型人工智能實驗室都癡迷于數學,癡迷于贏得國際數學奧林匹克競賽,癡迷于獲得金牌,癡迷于破解那些未經證明的數學定理。我對此有個看法,我認為這是因為這些實驗室里的人本身就是高中時期的數學競賽選手,參加過國際數學奧林匹克競賽并且成績斐然。他們中的許多人認為通用人工智能(AGI)只不過是比他們稍微聰明一點的版本。但我很好奇,為什么這些機構如此癡迷于數學,并希望在數學領域取得重大進展?

羅德里格斯:原因有二。我認為其中一個原因正如你剛才所說,大家都很熟悉,對吧?另一個原因是你可以衡量進步,對吧?所以,歸根結底,就像機器學習的進步一樣,很大程度上取決于基準。在數學中,你可以判斷你的證明是否正確。而且,需要證明的東西幾乎是無窮無盡的。因此,很容易判斷你是否在進步。像國際數學奧林匹克競賽(IMO)這樣的項目就提供了絕佳的機會。相比之下,如果你看看最近一些最大的突破,比如今年生物學人工智能領域最大的突破,對吧?像Chai Discovery和Nabla這樣的公司,他們開發出了從頭合成抗體的非常優秀的模型,對吧?這是巨大的突破,但最終,對他們來說真正的勝利要等到它被批準用于人體試驗,而這可能還需要五年左右的時間。Arc Institute則首次實現了從零開始設計生物體,他們設計了一種噬菌體。它是一種能感染細菌的病毒。很神奇,對吧?但它的評估就比較困難。比如,它到底有多好?畢竟,你不可能把它釋放到自然環境中,所以評估起來就比較困難,而免疫分子(IMO)則非常純凈。因此,我認為我們一直在思考的一個問題是,如何才能找到真正清晰的基準,來衡量我們在科學研究方面做得是否出色?

羅斯:我這里有個答案:國際癌癥治愈奧林匹克競賽。

牛頓:我喜歡這個。

魯斯:我們開始吧?

牛頓:我覺得那太好了!

羅斯:我們可以給贏家頒獎。呃,實驗室,咱們趕緊行動起來。所以,當這些公司的CEO或領導人發表諸如“我們將在未來10年或15年內,或者他們給出的任何時間表內,利用人工智能治愈所有疾病”之類的言論時,他們這樣做是因為他們不了解其中的瓶頸嗎?我的意思是,這些人都是非常聰明的人。那么,他們究竟忽略了什么?或者他們只是在進行某種營銷活動?這是不是為了讓那些原本可能對人工智能感到恐懼的人對它產生興趣?他們為什么要做出這些預測?

羅德里格斯:不,你看,我的意思是,我認為他們是——當然,理性的人可能會不同意。有很多理由可以論證,這些模型實際上會變得非常智能,它們會找到方法在進行臨床試驗之前就衡量我們是否取得了進展,這將加快迭代周期,對吧?關于這一點,有很多合理的論點,對吧?比如,你知道,我們可能不再進行完整的臨床試驗,而只使用生物標志物。這并非異想天開,當然,我也可能錯了,也許10年后,我們就能治愈所有疾病。所以,這是其中一部分原因。顯然,還有一部分原因是他們想炒作這件事。還有一部分原因是,你知道,薩姆·奧特曼真的非常了解生產,比如擴大小分子藥物的生產規模,最終將其投入臨床應用需要付出多少努力嗎?可能并不了解,對吧?所以,這里面有很多因素。我覺得這其中沒有任何惡意。只是大家都很興奮而已。當然,現實總會在某個時刻與我們擦肩而過。我們拭目以待,看看究竟會在哪里遇到這種情況,但無論如何,未來一定會很美好,對吧?

牛頓:在 2025 年的今天,您認為人工智能工具在多大程度上改變了科研人員的生活?您預計一年后情況會有多大不同?

羅德里格斯:我認為你會驚訝于他們至今還沒有采用新方法。科學家們普遍非常保守,因為如果你在做實驗,你永遠無法真正完全了解,至少在生物學領域,你通常無法完全理解實驗成功或失敗的原因。有些東西是你從過去運行的實驗方案中繼承下來的,你會覺得“我們一直都是這么做的”。你可以去驗證它,但需要驗證的東西太多了。所以,你基本上被困在現有方法里,因為這些方法有效,你只想做有效的方法。因此,生物學家采用新方法的速度很慢。我認為世界各地的大多數實驗室可能仍然沿用他們以前的方式進行科研,而且可能還會繼續這樣做一段時間,這也沒什么問題。我認為在編程領域,很多人已經開始采用它了,因為在生物學領域,編程歷來是一個很大的瓶頸。現在,生物學家們,尤其是那些不懂編程的人,能夠利用 Claude Code、OpenAI 的模型、Gemini 等工具進行大量的編程工作,這無疑是一項巨大的突破。我認為這將很快得到廣泛應用。文獻檢索也是如此,能夠解析浩瀚的科學文獻,這同樣是一項巨大的突破,也將很快得到普及。我們正在開發的這類工具則更偏向于前沿技術。最終 ,當人們看到其他人使用這些工具并取得顯著成果時,他們自然也會采用它們。

羅斯:薩姆,我們來玩個快問快答的小游戲吧?我們管這叫“被過度炒作/被低估”。我們會告訴你一些事情,你根據你的科學判斷,說說它是被過度炒作還是被低估了。準備好了嗎?接下來是驗證環節。人工智能系統會用數學方法進行證明。

羅德里格斯:如果非要我選,那可能被過譽了。它作為人工智能領域的進步驅動力固然很好,而且擅長這項技術或許會對其他領域產生影響,但它本身真的那么有用嗎?我不太確定。

Roose:用于人工智能實驗室自動化的機器人技術?

Rodriques:機器人技術是用于自動化人工智能實驗室,還是……?

羅斯:是的,或者用于科學實驗室的自動化。

牛頓:比如,濕實驗室。

羅德里格斯:用于自動化科學實驗室的機器人技術。嗯,我覺得被炒作得恰到好處。它將會徹底改變世界。這項技術目前還遠未成熟。我們還有很多工作要做,但總的來說,是的,可能被炒作得恰如其分。

牛頓:AlphaFold 3?

羅德里格斯:這很有意思。我的意思是,我覺得它可能被低估了,因為我覺得所有蛋白質結構模型都備受關注,但它們將會帶來巨大的變革。所以,我覺得它可能被低估了。不過,它確實也備受關注,所以很難做出判斷。

羅斯:虛擬細胞?今年夏天,我們從帕特里克·科利森那里了解到弧形研究所是如何創建虛擬細胞的。

羅德里格斯:這有點被過度炒作了,但也有其原因。Arc 正在構建的模型非常棒。新極限公司(New Limit)和陳·扎克伯格也在做類似的事情。很多優秀的公司和組織都在做類似的事情。我認為把它稱為虛擬細胞有點言過其實,對吧?畢竟,這種模型模擬的是一些非常具體的東西。比如,真正構建一個虛擬細胞,能夠在計算機中模擬一個細胞,這是一個了不起的目標。我們離這個目標還很遠。

牛頓:量子計算?

羅德里格斯:被過分吹捧了。

魯斯:腦機接口?

羅德里格斯:哦,老兄,這個問題真難回答。我覺得是被過度炒作了。我非常相信腦機接口(BCI),但我認為真正有效的腦機接口,或者說我們在科幻作品中想象的那種腦機接口,比人們想象的還要遙遠。即使是Neuralink公司也取得了驚人的進展——

魯斯:是啊,凱西現在腦子里正想著這件事呢。

牛頓和羅德里格斯:(笑聲)

羅斯:它出故障了。

羅德里格斯:那里有很多優秀的人正在取得進步,但我認為,這比人們想象的要困難得多。

牛頓:現在快到年底了。如果可以的話,請您回顧一下,您認為今年人工智能驅動的三大科學進步是什么?

羅德里格斯:是的,我認為,首先——說實話,今年是人工智能代理元年。今年人們發現了人工智能代理,所以我必須真誠地把自己,也把我們列入其中。還有谷歌的合作科學家,我的意思是,我們并不是唯一從事這方面研究的人。谷歌做得非常出色。還有很多其他的人也在做。所以,用于科學的人工智能代理絕對是重點。然后,生成式設計也正處于蓬勃發展的時期,對吧?其他的可能包括Chai和Nabla等人所做的從頭抗體設計方面的工作。

牛頓:順便說一句,我很高興你之前在播客里解釋了“de novo”的含義。這個問題被反復提及。

羅斯:是的。

羅德里格斯:抱歉,我說“從頭生成”的意思就是字面意義上的從零開始生成。你不需要給它任何東西,對吧?你只需要給它一個你想讓它結合的靶標,它就能從零開始生成。這意義重大,因為像Chai、Nabla等公司所追求的,基本上就是創造一個這樣的世界:你可以說,“我們知道要治愈這種疾病,我們必須靶向那個蛋白質。”你只需點擊一個按鈕,就能得到一種抗體,明天就可以把它注射到人體里。這太棒了。它省去了人們以前必須做的大量工作。所以,這是非常重要的一點。第三點,我想說的是Arc研究所的Brian Hee、Patrick Hsu等人所做的從頭生成生物體的工作。

牛頓:我們可以說出來了!我們現在知道它的含義了。這才是最重要的。

羅德里格斯和魯斯:(笑聲)

Roose:這是我們本周的“皮威的游樂場”主題詞。

羅德里格斯:(笑)從頭設計生物體,這有用嗎?我不知道。這很棒嗎?當然棒。這真是一項重大突破。

羅斯:那么,薩姆,明年我們應該關注什么?你對2026年可能即將發生的事情有什么期待?

羅德里格斯:說實話,真正迎來爆發式增長的還是智能體。我們現在正處于S型曲線的初期,而且這種增長勢頭還會持續下去。大概一年前,我會跟人說,我認為到2026年或者2027年,科學界產生的絕大多數高質量假設都會由我們或者像我們正在開發的這類智能體提出。而當我在2024年提出這個預測時,我覺得自己有點夸大其詞了,對吧?我當時的想法是,“我需要一些宣傳”。但現在看來,這或許是真的了。我的意思是,我覺得2026年就實現這個目標有點過于樂觀了。畢竟,大多數優秀的假設都由智能體提出,這確實是一個巨大的飛躍。但是,到了2027年,那才叫真正的爆發。我的意思是,2026年將會是智能體開始滲透到各個領域的元年,對吧?滲透實驗室,滲透人們的日常生活。我的意思是,這種情況已經發生了。

魯斯:酷。

牛頓:是的。

羅斯:嗯,我很期待。山姆,非常感謝你給我們補習了我們在學校里明顯沒學到的科學知識。

牛頓:是的,你確實給我們提出了一些全新的思考方向。我很感激。

羅德里格斯:(笑)好。謝謝大家。


Where Is All the A.I.-Driven Scientific Progress?

A tech C.E.O. explains why A.I. probably won’t cure diseases anytime soon. Hint: You still need humans.

  • Share full article

Dec. 26, 2025


By Kevin RooseCasey Newton and Rachel Cohn

應對AI挑戰的關鍵是你要學得比它更聰明。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
勇士主帥要換人?科爾走后,里弗斯成無奈備選,爭議真的太大了

勇士主帥要換人?科爾走后,里弗斯成無奈備選,爭議真的太大了

體育大朋說
2026-04-20 14:48:27
貴州一地突降冰雹最厚處30厘米,當地使用鏟車清理,部分農作物受損,鄉政府:正統計受災情況

貴州一地突降冰雹最厚處30厘米,當地使用鏟車清理,部分農作物受損,鄉政府:正統計受災情況

極目新聞
2026-04-20 11:15:09
美國在中東受挫,日本更加有恃無恐,中國要主動出擊方可破局

美國在中東受挫,日本更加有恃無恐,中國要主動出擊方可破局

阿芒娛樂說
2026-04-20 18:03:57
四川資中縣8天震了23次!有人說是大地震前兆?官方最新回應來了

四川資中縣8天震了23次!有人說是大地震前兆?官方最新回應來了

據說說娛樂
2026-04-20 18:02:57
女子利用天氣預報頻繁購買飛機延誤險,5年買中900多次,獲賠近300萬,被抓時:我符合保險理賠要求

女子利用天氣預報頻繁購買飛機延誤險,5年買中900多次,獲賠近300萬,被抓時:我符合保險理賠要求

譚老師地理大課堂
2026-04-15 20:11:42
福原愛官宣三胎僅3天,男方被扒底朝天,前夫江宏杰的做法太體面

福原愛官宣三胎僅3天,男方被扒底朝天,前夫江宏杰的做法太體面

阿纂看事
2026-04-20 14:51:18
那個被楊潔導演一眼相中的15歲初中生,后來怎么就“消失”了?

那個被楊潔導演一眼相中的15歲初中生,后來怎么就“消失”了?

小椰的奶奶
2026-04-20 11:39:42
研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

黯泉
2026-04-01 17:28:39
8歲男孩因壓力過大,跟媽媽說"想睡一會",但是卻再也沒有醒來

8歲男孩因壓力過大,跟媽媽說"想睡一會",但是卻再也沒有醒來

大果小果媽媽
2026-03-15 17:14:30
不知道張凌赫好看在哪?看看路人拍的沒有濾鏡的生圖你就知道了!

不知道張凌赫好看在哪?看看路人拍的沒有濾鏡的生圖你就知道了!

草莓解說體育
2026-04-20 18:48:02
俄羅斯已耗盡可翻新的T-72B坦克,現開始拆解上世紀70年代的T-72A

俄羅斯已耗盡可翻新的T-72B坦克,現開始拆解上世紀70年代的T-72A

零度Military
2026-04-20 07:25:49
國產車大敗!3月燃油車銷量榜,9款合資車進前十,哈弗H6第62名

國產車大敗!3月燃油車銷量榜,9款合資車進前十,哈弗H6第62名

購車前線
2026-04-17 21:22:44
天文學家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結的

天文學家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結的

心中的麥田
2026-03-06 19:27:32
越南“以華為師”,蘇林對中國高鐵情有獨鐘,但仍對中方抱有戒心

越南“以華為師”,蘇林對中國高鐵情有獨鐘,但仍對中方抱有戒心

王墨觀察
2026-04-20 18:40:03
官方:愛德華茲右膝傷病管理,對陣掘金G2的比賽出戰成疑

官方:愛德華茲右膝傷病管理,對陣掘金G2的比賽出戰成疑

懂球帝
2026-04-20 11:02:07
難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

秋姐居
2026-04-13 09:58:48
民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

李橑在北漂
2026-04-02 10:22:26
AI算力爆發!算力租賃10大龍頭,業績暴漲、訂單鎖死至2028年

AI算力爆發!算力租賃10大龍頭,業績暴漲、訂單鎖死至2028年

我不叫阿哏
2026-04-19 11:54:29
35+5!18+3!僅三年時間,曾經爭狀元的他倆,早已不是一個級別

35+5!18+3!僅三年時間,曾經爭狀元的他倆,早已不是一個級別

麥子的籃球故事
2026-04-20 17:57:34
徹底撕破臉?《乘風2026》蕭薔當場罷錄,一句身體不適,藏著對節目組的不滿

徹底撕破臉?《乘風2026》蕭薔當場罷錄,一句身體不適,藏著對節目組的不滿

老吳教育課堂
2026-04-19 14:19:36
2026-04-20 19:16:49
科學的歷程 incentive-icons
科學的歷程
吳國盛、田松主編
3189文章數 15015關注度
往期回顧 全部

科技要聞

華為Pura90逆周期定價,4699元起,未漲價

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經要聞

利潤暴跌7成,字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

家居
教育
時尚
房產
手機

家居要聞

自然慢調 慢享時光

教育要聞

志愿填報不踩坑!解讀近5年綠牌專業,找準未來就業風向標

今年最流行的衣服竟然是它?高級又氣質!

房產要聞

大規模商改住!海口西海岸,這波項目要贏麻了!

手機要聞

小米澎湃OS 3超級小愛、CarWith、文件管理等海量功能升級

無障礙瀏覽 進入關懷版