編者按
當 AI 正在重構科研與產業的底層邏輯,AI for Science 早已不是紙上概念。4月28日,未來光錐聯合北京中關村學院AI商學院,共同推出「AI for Science 創變者說:學界 × 產業先鋒對話系列沙龍」。首期活動邀請了3 位一線嘉賓。北京中關村學院副教授、中關村學院AI商學院聯席院長鄭書新,用扎實的數據和一線洞察,回答了三個所有人都關心的問題:AI4S 的 “ChatGPT 時刻” 會來嗎?創業者的壁壘在哪?年輕人該如何下注?
大模型的本質:壓縮產生智能
這一波大模型的通用智能性,到底從哪來?OpenAI前首席科學家Ilya一句話道破本質:壓縮產生智能——模型的智能性,來自于它用相對小的參數空間,去壓縮了人類語言產生的海量數據。在這個過程中,模型被逼著提煉數據里的共性結構和內在表征,智能就此涌現。
舉個例子,GPT-3 第一個版本 175B(約 1750 億)參數,要把全人類寫下來過的幾乎所有文本都裝進去。如果它純靠記憶,那本質上就是一個硬盤,硬盤是不會產生智能的。但當我們要求它用越來越小的參數量、越來越小的體積去把這些數據“記下來”的時候,它就被逼著去提煉共性的結構和內在的表征——智能就是在這個壓縮過程中涌現出來的。
這背后還有一個更嚴格的理論支點,叫 Kolmogorov 復雜度——一段數據的復雜度可以用最短能描述它的程序長度來衡量。比如一段全是數字 0 的數據,用一行 Python 就能壓縮它,因為它內在結構極其簡單。大語言模型“預測下一個詞”的范式,其實就是對 Kolmogorov 程序的一種很好的近似。
但這也注定了它的天花板:人類已知。你跟人學,終究不可能超過人。而AI for Science,走的是一條完全不同的路。
AI4S的兩條核心路徑
AI4S不碰人類語言,它直接研究物理規律、生物過程、分子構象,它壓縮的是自然界本身的數據,而不是“人類如何描述自然界”。
最有代表性的就是 AlphaFold——它是諾貝爾獎級別的工作。它在做什么?也很簡單:在自然界數據中找相關性。當 PDB(Protein Data Bank)里積累了幾十萬條蛋白結構數據時,模型就能從中找到從序列到三維結構的映射,把蛋白結構這件事“求解”出來。
這里有一個核心分析框架,AI4S的兩條腿:
- Scientist(科學家):讀文獻、提假設、設計實驗,本質是語言智能+知識整合+邏輯推理。強項是推理與知識,短板是對物理世界沒有“直接理解”。代表是 OpenAI、Anthropic、DeepMind 這些 Frontier Labs 的科研模型。
- Simulator(模擬器):用AI數據驅動地擬合物理世界規律,強項是對世界本身建模,不是堆參數能堆出來的,短板是沒有顯式的知識鏈條與推理能力。代表是AlphaFold、各類氣象大模型。
大模型的終點是AGI,而AI4S的星辰大海,是突破人類認知的邊界——宇宙是未知的,只有Simulator這條路,理論上能讓AI探索人類還沒發現的東西。
![]()
但今天 Simulator 自己解決不了所有問題——它沒有邏輯、沒有推理。單靠任何一條路都走不通。真正的AI4S終局,是兩條路的匯合:既能像頂尖科學家那樣做推理、提假設,又能直接理解物理世界本身。
這也是我反復強調的:AI for Science,不止需要更大的模型。你把GPT再放大100倍,它也不會自動懂得一個蛋白怎么折疊、一團云怎么演化。
今天沒有任何一個團隊同時擁有這兩端,這恰恰是機會。
AI4S不會有統一的“ChatGPT時刻”
我的核心判斷是:AI4S會有持續的突破,但不會是一個全民狂歡的統一瞬間,它的進展更像一張高度不均勻的地圖。
一個領域,滿足「問題結構清晰+數據充足+驗證閉環短」這三個要素越多,AI4S在那里跑得就越快。
- 蛋白折疊:蛋白這一仗,最有意思的地方在于:Scientist 和 Simulator 兩條路都拿出了標志性成果。AlphaFold 回答“蛋白長什么樣”,DiG 和 BioEmu 回答“蛋白怎么運動”,一個是拍照片,一個是拍電影。 把電影拍出來,蛋白質的功能機理才真正可解釋。
- AI藥物:已經跨過臨界點。AI藥物臨床管線超200條,I期成功率80%-90%,是傳統方法的2倍;首個AI藥物已在II期臨床顯示療效,2026-2027年將迎來關鍵管線的數據讀出窗口期。
- AI氣象:中國選手全球領跑。華為盤古、復旦伏羲、風烏模型持續突破,其中風烏做到11.25天準確預報,全球首次突破10天精度壁壘。
- 材料科學:材料是另一種狀態:剛剛從“篩選已知化合物”,進化到“從頭設計前所未有的分子”。2025-2026年最核心的信號,是一線做模型的人,開始真正相信自己手里的工具。這個領域雖在早期,元素組合空間近乎無限,但一旦突破,價值也最大。
![]()
大模型巨頭全員入局,創業者的壁壘到底在哪?
一個不爭的事實是:OpenAI、Anthropic、Google DeepMind、微軟、NVIDIA、Meta,六大AI巨頭,已經全員下場AI4S。
連OpenAI都要單獨做生命科學專項模型GPT-Rosalind,Anthropic全力布局Claude for Life Sciences,這已經說明:“一個通用模型解決一切”的敘事,正在被這些公司自己悄悄放棄。
巨頭入局后,創業者的壁壘在哪?我的答案很明確:門檻不在prompt和workflow,而在科學能力、數據閉環、行業嵌入深度。
這里一定要先想清楚,你打的是哪一局:
- 產品型:拼快速迭代、用戶粘性,驗證周期天到周,代表是Manus、Cursor;;
- 資源型:拼行業嵌入深度、客戶資源,驗證周期季度到年,代表是代表:傳統 SaaS、行業解決方案;
- 科學故事型:拼科學能力+數據飛輪,代表是Isomorphic Labs,驗證周期年到十年。
![]()
AI4S 公司其實可以分兩類:科學公司(科學故事型)和科學服務公司(資源型)。兩種路都能走,但最怕的,是把自己當成“科學公司”,最后做成了“科學服務公司”。
如果你對自己的技術足夠自信,真的能挖到金子,就理所應當去講科學故事;如果還差一些,就要重交付、重客戶資源,老老實實做深行業。
現在就是AI4S的黃金窗口期
為什么我說現在是窗口期?因為錢已經在動。單家AI4S企業年融資額可達5.5億美元,全球VC流向AI的資金里,大量資金正在向AI4S傾斜。美國能源部投入 3.2 億美元啟動了 Genesis 創世紀計劃,中國也在跟進。
資金為什么集中沖 AI4S?因為技術臨界突破+傳統 R&D 效率太低+數據基礎設施剛起步+國家戰略加持,四重共振已經形成。
哪怕過程中會有泡沫破裂,也和五六年前的行業熱潮完全不同——這一次,技術真的到了臨界點。
未來最值得長期關注的兩個趨勢:
1. 自驅動實驗室(Self-Driving Labs):實現“假設→實驗→數據→模型更新→新假設”的完整閉環,實驗越多,模型越好,實驗越聰明,形成真正的飛輪,代表玩家有Lila Sciences、Recursion、Atinary。
2. 國家級AI4S基礎設施:AI4S正在從“學術研究”,走向“產業基礎設施”,這是國家競爭力的核心布局。
給年輕人的5條硬核建議
選領域比選技術重要。真正的護城河是領域知識,不是模型架構,選一個你愿意沉浸5年的科學問題。
學會跟實驗對話。純計算背景的人,最大的短板是不懂實驗。去實驗室待三個月,比多讀十篇論文有用。
數據能力是核心杠桿。模型的性能上限,終究是訓練數據的信息上限。能搭起數據飛輪的人,遠比會調模型的人有價值,會獲取、清洗、標注科學數據,是硬通貨。
想清楚你打什么局。科學故事局需要長期耐心,資源局需要行業嵌入,產品局拼快迭代,別混著打。
現在就是窗口期。技術、資本、國家戰略三重共振,但窗口不會永遠開著。
三個核心結論
回到開場的三個問題,答案已經非常清晰:
AI4S的突破已經在發生,但不會有統一的“ChatGPT時刻”,各領域進展高度不均,突破速度取決于問題結構、數據基礎與驗證閉環;
2. 創業者的核心壁壘,是“科學能力+數據閉環”,從來不是模型大小;
3. 選對方向,本質就是選一個你愿意深耕五年的科學問題。
最后送給大家一句話——窗口屬于愿意做重活、敢在不確定性里下注的人。
作者簡介
鄭書新,北京中關村學院副教授,中關村學院AI商學院聯席院長,《AI for Science》期刊副主編。前微軟研究院首席研究員,微軟科學基礎模型負責人,多項人工智能世界冠軍,訓練了迄今最大的科學大模型。
想要了解更多AI for Science創業項目?有BP想要投送?或者想來分享你的真知灼見?添加果殼硬科技企業微信,私信溝通。
未來光錐
部分已投項目
華天航空動力
丨天璇新材料
關注話題
閉門活動
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.