網易首頁 > 網易號 > 正文申請入駐

AI for Science 會有 “ChatGPT 時刻” 嗎？年輕人該如何下注？

2026-05-07 10:20:07　來源: 果殼硬科技

北京舉報

分享至

編者按

當 AI 正在重構科研與產業的底層邏輯，AI for Science 早已不是紙上概念。4月28日，未來光錐聯合北京中關村學院AI商學院，共同推出「AI for Science 創變者說：學界 × 產業先鋒對話系列沙龍」。首期活動邀請了3 位一線嘉賓。北京中關村學院副教授、中關村學院AI商學院聯席院長鄭書新，用扎實的數據和一線洞察，回答了三個所有人都關心的問題：AI4S 的 “ChatGPT 時刻” 會來嗎？創業者的壁壘在哪？年輕人該如何下注？

大模型的本質：壓縮產生智能

這一波大模型的通用智能性，到底從哪來？OpenAI前首席科學家Ilya一句話道破本質：壓縮產生智能——模型的智能性，來自于它用相對小的參數空間，去壓縮了人類語言產生的海量數據。在這個過程中，模型被逼著提煉數據里的共性結構和內在表征，智能就此涌現。

舉個例子，GPT-3 第一個版本 175B（約 1750 億）參數，要把全人類寫下來過的幾乎所有文本都裝進去。如果它純靠記憶，那本質上就是一個硬盤，硬盤是不會產生智能的。但當我們要求它用越來越小的參數量、越來越小的體積去把這些數據“記下來”的時候，它就被逼著去提煉共性的結構和內在的表征——智能就是在這個壓縮過程中涌現出來的。

這背后還有一個更嚴格的理論支點，叫 Kolmogorov 復雜度——一段數據的復雜度可以用最短能描述它的程序長度來衡量。比如一段全是數字 0 的數據，用一行 Python 就能壓縮它，因為它內在結構極其簡單。大語言模型“預測下一個詞”的范式，其實就是對 Kolmogorov 程序的一種很好的近似。

但這也注定了它的天花板：人類已知。你跟人學，終究不可能超過人。而AI for Science，走的是一條完全不同的路。

AI4S的兩條核心路徑

AI4S不碰人類語言，它直接研究物理規律、生物過程、分子構象，它壓縮的是自然界本身的數據，而不是“人類如何描述自然界”。

最有代表性的就是 AlphaFold——它是諾貝爾獎級別的工作。它在做什么？也很簡單：在自然界數據中找相關性。當 PDB（Protein Data Bank）里積累了幾十萬條蛋白結構數據時，模型就能從中找到從序列到三維結構的映射，把蛋白結構這件事“求解”出來。

這里有一個核心分析框架，AI4S的兩條腿：

- Scientist（科學家）：讀文獻、提假設、設計實驗，本質是語言智能+知識整合+邏輯推理。強項是推理與知識，短板是對物理世界沒有“直接理解”。代表是 OpenAI、Anthropic、DeepMind 這些 Frontier Labs 的科研模型。

- Simulator（模擬器）：用AI數據驅動地擬合物理世界規律，強項是對世界本身建模，不是堆參數能堆出來的，短板是沒有顯式的知識鏈條與推理能力。代表是AlphaFold、各類氣象大模型。

大模型的終點是AGI，而AI4S的星辰大海，是突破人類認知的邊界——宇宙是未知的，只有Simulator這條路，理論上能讓AI探索人類還沒發現的東西。

但今天 Simulator 自己解決不了所有問題——它沒有邏輯、沒有推理。單靠任何一條路都走不通。真正的AI4S終局，是兩條路的匯合：既能像頂尖科學家那樣做推理、提假設，又能直接理解物理世界本身。

這也是我反復強調的：AI for Science，不止需要更大的模型。你把GPT再放大100倍，它也不會自動懂得一個蛋白怎么折疊、一團云怎么演化。

今天沒有任何一個團隊同時擁有這兩端，這恰恰是機會。

AI4S不會有統一的“ChatGPT時刻”

我的核心判斷是：AI4S會有持續的突破，但不會是一個全民狂歡的統一瞬間，它的進展更像一張高度不均勻的地圖。

一個領域，滿足「問題結構清晰+數據充足+驗證閉環短」這三個要素越多，AI4S在那里跑得就越快。

- 蛋白折疊：蛋白這一仗，最有意思的地方在于：Scientist 和 Simulator 兩條路都拿出了標志性成果。AlphaFold 回答“蛋白長什么樣”，DiG 和 BioEmu 回答“蛋白怎么運動”，一個是拍照片，一個是拍電影。把電影拍出來，蛋白質的功能機理才真正可解釋。

- AI藥物：已經跨過臨界點。AI藥物臨床管線超200條，I期成功率80%-90%，是傳統方法的2倍；首個AI藥物已在II期臨床顯示療效，2026-2027年將迎來關鍵管線的數據讀出窗口期。

- AI氣象：中國選手全球領跑。華為盤古、復旦伏羲、風烏模型持續突破，其中風烏做到11.25天準確預報，全球首次突破10天精度壁壘。

- 材料科學：材料是另一種狀態：剛剛從“篩選已知化合物”，進化到“從頭設計前所未有的分子”。2025-2026年最核心的信號，是一線做模型的人，開始真正相信自己手里的工具。這個領域雖在早期，元素組合空間近乎無限，但一旦突破，價值也最大。

大模型巨頭全員入局，創業者的壁壘到底在哪？

一個不爭的事實是：OpenAI、Anthropic、Google DeepMind、微軟、NVIDIA、Meta，六大AI巨頭，已經全員下場AI4S。

連OpenAI都要單獨做生命科學專項模型GPT-Rosalind，Anthropic全力布局Claude for Life Sciences，這已經說明：“一個通用模型解決一切”的敘事，正在被這些公司自己悄悄放棄。

巨頭入局后，創業者的壁壘在哪？我的答案很明確：門檻不在prompt和workflow，而在科學能力、數據閉環、行業嵌入深度。

這里一定要先想清楚，你打的是哪一局：

- 產品型：拼快速迭代、用戶粘性，驗證周期天到周，代表是Manus、Cursor;；

- 資源型：拼行業嵌入深度、客戶資源，驗證周期季度到年，代表是代表：傳統 SaaS、行業解決方案；

- 科學故事型：拼科學能力+數據飛輪，代表是Isomorphic Labs，驗證周期年到十年。

AI4S 公司其實可以分兩類：科學公司（科學故事型）和科學服務公司（資源型）。兩種路都能走，但最怕的，是把自己當成“科學公司”，最后做成了“科學服務公司”。

如果你對自己的技術足夠自信，真的能挖到金子，就理所應當去講科學故事；如果還差一些，就要重交付、重客戶資源，老老實實做深行業。

現在就是AI4S的黃金窗口期

為什么我說現在是窗口期？因為錢已經在動。單家AI4S企業年融資額可達5.5億美元，全球VC流向AI的資金里，大量資金正在向AI4S傾斜。美國能源部投入 3.2 億美元啟動了 Genesis 創世紀計劃，中國也在跟進。

資金為什么集中沖 AI4S？因為技術臨界突破+傳統 R&D 效率太低+數據基礎設施剛起步+國家戰略加持，四重共振已經形成。

哪怕過程中會有泡沫破裂，也和五六年前的行業熱潮完全不同——這一次，技術真的到了臨界點。

未來最值得長期關注的兩個趨勢：

1. 自驅動實驗室（Self-Driving Labs）：實現“假設→實驗→數據→模型更新→新假設”的完整閉環，實驗越多，模型越好，實驗越聰明，形成真正的飛輪，代表玩家有Lila Sciences、Recursion、Atinary。

2. 國家級AI4S基礎設施：AI4S正在從“學術研究”，走向“產業基礎設施”，這是國家競爭力的核心布局。

給年輕人的5條硬核建議

選領域比選技術重要。真正的護城河是領域知識，不是模型架構，選一個你愿意沉浸5年的科學問題。

學會跟實驗對話。純計算背景的人，最大的短板是不懂實驗。去實驗室待三個月，比多讀十篇論文有用。

數據能力是核心杠桿。模型的性能上限，終究是訓練數據的信息上限。能搭起數據飛輪的人，遠比會調模型的人有價值，會獲取、清洗、標注科學數據，是硬通貨。

想清楚你打什么局。科學故事局需要長期耐心，資源局需要行業嵌入，產品局拼快迭代，別混著打。

現在就是窗口期。技術、資本、國家戰略三重共振，但窗口不會永遠開著。

三個核心結論

回到開場的三個問題，答案已經非常清晰：

AI4S的突破已經在發生，但不會有統一的“ChatGPT時刻”，各領域進展高度不均，突破速度取決于問題結構、數據基礎與驗證閉環；

2. 創業者的核心壁壘，是“科學能力+數據閉環”，從來不是模型大小；

3. 選對方向，本質就是選一個你愿意深耕五年的科學問題。

最后送給大家一句話——窗口屬于愿意做重活、敢在不確定性里下注的人。

作者簡介

鄭書新，北京中關村學院副教授，中關村學院AI商學院聯席院長，《AI for Science》期刊副主編。前微軟研究院首席研究員，微軟科學基礎模型負責人，多項人工智能世界冠軍，訓練了迄今最大的科學大模型。

想要了解更多AI for Science創業項目？有BP想要投送？或者想來分享你的真知灼見？添加果殼硬科技企業微信，私信溝通。

未來光錐

部分已投項目

華天航空動力

丨天璇新材料

關注話題

閉門活動

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.