網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

獨家對話智源學者劉知遠：中國AI要向外卷，而不只是做第二個OpenAI

2026-05-26 16:59:53　來源: 態(tài)℃

北京舉報

分享至

出品 | 網(wǎng)易科技《態(tài)度AGI》

作者 | 袁寧

對話 | 楊霞清

編輯 | 丁廣勝

大模型行業(yè)仍在高速奔跑，也正在進入它真正的分化時刻。

最早，“有卡就能追”；后來變成“有數(shù)據(jù)就能追”；再后來，大家發(fā)現(xiàn)，即使有錢、有卡、有團隊，也未必能做出真正領先的模型。行業(yè)開始收斂，玩家開始減少，路線也逐漸分化。

有人繼續(xù)卷規(guī)模，有人轉向Agent，有人下注世界模型。但劉知遠和他的團隊思考的是另一個問題：AI為什么一定只能發(fā)生在云端？

過去幾年，云端模型代表規(guī)模、資本和速度，也代表一種已經(jīng)被證明過的路徑。但劉知遠想做的，是：端側智能，高密度，小模型。

劉知遠是清華大學計算機系教授，也是北京智源人工智能研究院智源學者，曾參與我國首個超大規(guī)模智能模型“悟道”大模型的研發(fā)，是國內最早進入預訓練模型研究的一批人。

2022年，劉知遠創(chuàng)立面壁智能，并出任首席科學家。2025年11月，他和團隊關于“大模型密度定律（Densing Law）”的研究登上《自然·機器智能》（Nature Machine Intelligence）封面。論文回測了51個主流模型后發(fā)現(xiàn)：過去兩年，大模型的“智能密度”正以每3.5個月翻倍的速度提升。

換句話說，大概每100天，我們就可以用一半?yún)?shù)，實現(xiàn)相同水平的智能。今天只能運行在云端的能力，未來或許會被壓縮進手機、汽車、PC、手表、汽車、冰箱……甚至任何一個普通終端。

在和劉知遠的對話中，他多次提到“向外卷”。他始終警惕著另一種更隱蔽的風險：所有人都在用同樣的方法、同樣的敘事、同樣的終點定義自己。

所謂“外卷”，某種程度上也像面壁智能自己的路線選擇：不是在同一條賽道里，把別人已經(jīng)證明過的事情再重復一遍，而是走進真實產業(yè)、真實場景和真實生活，去尋找那些尚未被充分定義的問題。

他提到：

“模型已經(jīng)不再只是一個純科研問題，而是一個典型的‘產研結合’問題。你既要有一線科研能力，能夠持續(xù)創(chuàng)新；同時還要有非常強的工程能力、系統(tǒng)能力，以及完整的產業(yè)化能力。”

“行業(yè)內有一種觀點，中國模型研發(fā)速度和美國有6到12個月差距，并不意味著原始創(chuàng)新能力只差6到12個月。因為原始創(chuàng)新本身是最難的事情。”

也正因如此，在他的視角里，像北京智源人工智能研究院這樣的機構會變得越來越重要。

它既不同于傳統(tǒng)高校，也不同于國家實驗室，更不像一家純商業(yè)公司，而是處在產業(yè)、學術與研究之間的一層“中間地帶”。因為很多原始創(chuàng)新，本身并不天然適合KPI，也未必能快速對應商業(yè)回報。它需要允許長期探索，允許失敗，也允許一段時間內“不知道答案”。

而這場對話討論的，也早已不只是一家公司如何押注一條更少人走的技術路線，而是中國大模型產業(yè)的分化與選擇；不只是中美模型能力的差距，更是原始創(chuàng)新體系之間的差距，以及一個社會需要怎樣的創(chuàng)新支持系統(tǒng)；也不只是關于未來人才的培養(yǎng)，而是，未來人如何和AI共處。

我們真正好奇的是：在一個被技術迅速改寫的時代，一個人、一家公司，甚至一個行業(yè)，究竟該如何找到自己的位置。

以下是網(wǎng)易科技《態(tài)度AGI》欄目獨家對話智源學者、面壁智能聯(lián)合創(chuàng)始人兼首席科學家劉知遠的內容：

中美大模型差距，不只是落后幾個月，而是原始創(chuàng)新還太少

網(wǎng)易科技：4月下旬，DeepSeek-V4發(fā)布后，相對于V3，行業(yè)的反應相對平淡。你怎么看待V4這個模型？

劉知遠：我覺得這是正常的。V3出現(xiàn)的時候，其實所有人都沒有那么高的預期，它是真正意義上的“橫空出世”。但 V4不一樣。大家半年前就已經(jīng)開始等它了，行業(yè)的期待值已經(jīng)被拉滿了。

在這種情況下，它很難再帶來第一次看到 GPT-4或 DeepSeek-V3時那種震撼感。

但這并不意味著它不重要。它仍然代表中國模型能力的一次關鍵推進。

網(wǎng)易科技：我們看到有國外科技博主給4月集中發(fā)布的大模型打分，GPT-5.5是60分，Claude Opus是57分，V4只有52分。這是否也反映了中國模型跟世界頭部模型還是存在一定的差距？

劉知遠：從 ChatGPT出現(xiàn)開始，我們一直認為，中國和美國之間的差距是在縮小，但差距依然存在。

2023年的時候，我們跟 GPT-4的差距，大概是一年。到 DeepSeek-R1，我們可能用半年就能復現(xiàn) OpenAI o1的能力。

今天我會認為，中國模型仍與世界頂尖模型有一定差距。

所以我覺得，一方面要保持清醒，承認差距；但另一方面，也沒有必要因此過度恐慌。

網(wǎng)易科技：當下世界頭部大模型的幾家輪流坐莊。在2026年這個時間節(jié)點，大模型真正比拼的東西是什么？影響大模型競爭格局的變量會是什么？

劉知遠：這個行業(yè)正在快速收斂。它其實很像當年的集成電路產業(yè)。想要真正具備國際一線水平，需要滿足的條件會越來越多。

在2022、2023年的時候，可能只要在某幾個方面具備優(yōu)勢，就有機會迅速做出一個世界領先模型。因為那個階段，整個行業(yè)還相對粗放。包括 OpenAI當年的 GPT-3，其實很多地方今天回頭看，也還是比較粗糙的。

但科技發(fā)展的規(guī)律就是這樣：隨著技術不斷成熟，各個要素都會迅速迭代、迅速補齊。

發(fā)展到今天，一個模型訓得好不好，已經(jīng)和很多因素有關：模型架構、數(shù)據(jù)治理水平、模型風洞完整程度，以及軟硬協(xié)同能力等。

所以你會發(fā)現(xiàn)，到了今天，能夠持續(xù)在國際一線發(fā)布模型的團隊，其實已經(jīng)逐漸收斂到少數(shù)幾家了。

網(wǎng)易科技：那最后還能留在牌桌上的玩家，需要具備哪些能力？

劉知遠：我覺得可以分兩個層面來看。

第一個層面，是 AI這幾年正在快速從“象牙塔”走向產業(yè)。

大模型已經(jīng)不再只是一個純科研問題，而是一個典型的“產研結合”問題。既要有一線科研能力，能夠持續(xù)創(chuàng)新；同時還要有非常強的工程能力、系統(tǒng)能力，以及完整的產業(yè)化能力。任何一個環(huán)節(jié)出現(xiàn)短板，都會影響模型在全球范圍內的競爭力。所以未來一個非常重要的趨勢，就是“產”和“研”的進一步融合。

第二個層面，是我們雖然已經(jīng)找到了推動 AGI 持續(xù)發(fā)展的基本規(guī)律，也就是所謂的 Scaling Laws（規(guī)模法則），但每一個階段，仍然需要新的技術突破。

過去大家認為：只要有更多數(shù)據(jù)、更多算力，模型能力就會持續(xù)提升。但發(fā)展到今天，你會發(fā)現(xiàn)新的問題開始出現(xiàn)。

比如到了2024年，全球公開可獲取的數(shù)據(jù)其實已經(jīng)接近耗盡了。這就需要新的技術路線，讓模型能夠自己探索、自己合成數(shù)據(jù)，持續(xù)提升能力。

換句話說，如果繼續(xù)沿著傳統(tǒng)規(guī)模法則往前推進，算力成本也會越來越不可持續(xù)。未來不可能真的去用幾百萬張卡訓練一個模型，這個成本沒有任何機構能夠長期承擔。

所以我們團隊提出“密度定律”，希望在規(guī)模法則之外，找到新的效率提升路徑。既提升模型能力，又降低訓練成本，讓 AGI 的發(fā)展變得可持續(xù)。未來真正重要的，仍然是那些既有創(chuàng)新能力、又有工程能力的團隊。它們既是互補關系，也是協(xié)同關系。

過去大家理解的 Scaling Law，就是模型越大，能力越強，它對應的是一條持續(xù)向上的增長曲線。而 Densing Law 是一條“更陡峭”的增長曲線：在相同模型尺寸下，實現(xiàn)更高智能；本質上，它是在提升模型的“智能密度”。

網(wǎng)易科技：國內模型最大的瓶頸之一，還是“缺卡”嗎？

劉知遠：如果是在2023年，很多機構認為限制模型發(fā)展的核心問題是算力，我認為是成立的。

但到了今天，我們應該意識到：真正決定模型能力的因素，已經(jīng)越來越多了。

算力當然非常重要，但如果你沒有架構創(chuàng)新、沒有數(shù)據(jù)治理創(chuàng)新、沒有軟硬件協(xié)同能力，那么即使你有很多卡，最終訓出來的模型也很難真正具備競爭力。

為什么 DeepSeek-V3在2024年底會引起全球關注？因為它告訴大家：我們可以用更低的參數(shù)激活量、更低的訓練成本，達到此前國際頂級模型的效果。

這背后真正重要的，其實是架構創(chuàng)新、細粒度設計，以及軟硬協(xié)同上的突破。讓大家意識到：原來訓練世界級模型，并不一定只能靠“無限堆算力”。

所以未來真正重要的，還是持續(xù)創(chuàng)新。

網(wǎng)易科技：剛才提到中美大模型仍然存在一定差距。但有些人會認為，中國已經(jīng)能用更低成本實現(xiàn)更大的價值。你怎么看中美模型各自的長板和短板？

劉知遠：今年，Anthropic Claude 在全球范圍內的表現(xiàn)，其實是非常強勢的。它去年底到今年初發(fā)布的一系列模型，在代碼能力等方向上都非常領先。

到目前為止，我認為中國還沒有任何一個模型真正超越 Claude。包括 DeepSeek-V4在內，中國模型與國際最先進模型相比，在一些能力上仍然存在差距。我們還是需要非常客觀地分析自己當前所處的位置。

我們說中國模型研發(fā)速度和美國有一定差距，其中最重要的還是原始創(chuàng)新能力。

因為原始創(chuàng)新本身是最難的事情。真正的開創(chuàng)者，需要在完全未知的方向上做大量開放性探索。很多時候要兵分多路、不斷試錯，最后才能找到真正有效的路徑。

但跟隨者不一樣。跟隨者只需要看到開創(chuàng)者已經(jīng)驗證成功的路線，然后沿著這條路繼續(xù)推進。

這兩者在成本、難度，以及對原始創(chuàng)新能力的要求上，其實完全不是一個量級。

所以我認為，美國目前最大的優(yōu)勢，其實是在大模型和 AGI 最前沿方向上的原始創(chuàng)新能力。而這恰恰是中國目前最欠缺的部分。

網(wǎng)易科技：那 DeepSeek-R1算是一次原始創(chuàng)新嗎？

劉知遠：DeepSeek-R1為什么能夠登上《Nature》封面、獲得全球認可？很重要的原因在于，它是在 OpenAI 沒有公開完整技術路線的情況下，做出了真正有價值的創(chuàng)新。

這件事本身非常不容易。但即使如此，我依然會認為，它還不是最原始層面的創(chuàng)新。

因為 OpenAI 的 o1已經(jīng)向全世界證明了一件事：原來模型可以通過這種方式實現(xiàn)深度推理能力。一旦這個方向被驗證成立，后面的人就擁有了一個明確目標。后續(xù)的創(chuàng)新，更多是在這個方向上的技術推進與工程突破。

因為它意味著：這個問題是存在標準答案的。對于后來者來說，這會極大降低探索的不確定性。

所以我覺得，中國需要非常清晰地認識到：我們今天已經(jīng)具備了非常強的跟進能力，但在最頂層的原始創(chuàng)新上，仍然需要繼續(xù)追趕。

網(wǎng)易科技：那中國的優(yōu)勢是什么？

劉知遠：最大的優(yōu)勢，首先是“勢能”。

過去20年，中國經(jīng)歷了從互聯(lián)網(wǎng)、信息化，到今天智能化的快速發(fā)展過程。

我從2006年開始讀博，到現(xiàn)在整整20年。我能非常明顯地感受到，中國已經(jīng)從當年幾乎無人關注AI 領域的狀態(tài)，發(fā)展成今天全世界唯一能夠在人工智能最前沿與美國持續(xù)競爭的國家。這種進步速度，本身就是非常巨大的優(yōu)勢。

我們擁有龐大的人才基礎，也形成了非常強的社會共識。整個國家、整個產業(yè)、包括普通人，都非常認可：這場科技革命必須抓住。

我覺得這種全國性的共識，其實是非常難得的。放眼全球，很少有國家能夠像中國一樣，對一場科技革命形成如此強烈、持續(xù)的投入意愿。

其次，我覺得是中國巨大的應用市場。中國 AI 的技術突破和產業(yè)應用是高度協(xié)同的。從政府到各個行業(yè)，對 AI 的接受度都非常高，也愿意開放大量真實場景。所以中國的應用落地速度會非常快。

而 AGI 最終帶來的，是一場類似工業(yè)革命級別的智能革命。本質上是在用 AI 去替代人的機械腦力勞動和部分體力勞動。所有依賴知識和經(jīng)驗的行業(yè)，未來都需要被 AI 重構。我們在技術應用和結合，在全世界范圍，在應用創(chuàng)新上的能力和愿景其實是非常廣闊的。

智源、悟道與中國AI的“仙童時刻”

網(wǎng)易科技：您最早做通用模型研究。回頭看，智源研究院和“悟道”項目，對您后來判斷大模型與產業(yè)方向產生了怎樣的影響？

劉知遠：這個其實和智源研究院有關系。

2020年，OpenAI 發(fā)布 GPT-3，是一個非常重要的歷史節(jié)點。是全球第一個真正意義上的千億參數(shù)模型，1750億參數(shù)，而且第一次展現(xiàn)出了非常流暢的自然語言生成能力。那個震撼，對當時整個行業(yè)來說都非常大。

在 GPT-3出現(xiàn)之前，我們作為國內最早一批做預訓練模型的團隊，已經(jīng)覺得自己站在了全球前沿。那時候我們訓練的還是單機八卡、上億參數(shù)級別的模型，在國內已經(jīng)算非常先進了。

但 GPT-3一出來，我們突然發(fā)現(xiàn)，人家已經(jīng)在用2000張卡訓練千億模型了。瞬間意識到，雙方已經(jīng)不在同一個數(shù)量級。

當時我正好是智源學者。智源本身又是一個非常年輕、非常有活力的科研機構。我們當時專門向智源決策層匯報了 GPT-3的情況。我們認為，這不僅僅是一次模型升級，而是通用人工智能方向上的重大突破。但它又極度依賴基礎資源，因為你想訓練更大的模型，就需要更多 GPU。

可那時候國內大部分團隊，可能連幾臺機器都沒有。

后來智源很快做了決定，批了幾百萬，采購了10臺 V100。今天看可能不算什么，但在當時已經(jīng)是非常大的投入。我們也正是基于這批算力，訓練出了26億參數(shù)模型。它生成文本的流暢程度，相比我們之前的模型有了非常明顯的躍遷。

我覺得，那其實是中國大模型真正開始起步的一個重要節(jié)點。

到了2021年，智源內部已經(jīng)基本形成了“大模型會成為未來核心方向”的共識。后來有了唐杰老師牽頭的“悟道”項目，我們團隊也是參與者之一。

網(wǎng)易科技：智源學者群體對中國大模型行業(yè)做出了重要的貢獻，您怎么看智源學者這套機制，它的獨特之處是什么？

劉知遠：作為這個智源學者中的一員，智源最特別的一點，是和國內很多傳統(tǒng)人才計劃都不一樣。

并不會要求你每年交多少論文、多少專利、多少 KPI，也不會天天檢查你是不是在“認真干活”。背后其實是一種非常先進的理念：一種基于信任建立起來的學術共同體。

首先智源會找到這個領域最有公信力的專家，再由這些專家去選擇他們真正認可的人。整個過程相對非常公平。而且選出來之后，也不是靠各種行政化管理去驅動創(chuàng)新，而是給予充分信任。

我覺得“信任”是這里面最核心的關鍵詞。因為真正頂尖的研究者，本來就不需要靠外部監(jiān)督來驅動。恰恰是在這種信任之下，很多學者才會真正愿意圍繞智源這個平臺，去做一些“不一樣”的探索。

包括“悟道”項目的推進，也體現(xiàn)了這一點。智源的決策鏈條非常短、非常快。很多大型科研項目，可能光論證就要一年，等真正立項的時候，國外已經(jīng)做完了。但智源當時能夠在非常短時間內完成決策，并快速投入資源。

我覺得這背后，本質上還是一種對人的信任，對方向的信任。

更重要的是，它把很多真正優(yōu)秀的人聚在了一起。很多時候，一群高水平的人長期交流、碰撞，本身就會催生新的思想。所以你會發(fā)現(xiàn)，智源在全國范圍內押注大模型，其實比很多機構至少早了一年。

具體形式不重要，真正重要的是它背后的內核。這需要一代一代傳承下去。

網(wǎng)易科技：當時的“悟道”項目，本質上就是一場“非共識下注”？

劉知遠：對，我覺得它本質上是一場非常重要的“風險投資”。

2021年是什么時間點？那時候 OpenAI 都還不是今天的 OpenAI。GPT-2發(fā)布的時候，很多人甚至還在嘲諷“大模型路線”。整個行業(yè)對大模型是存在巨大爭議的。

但就在那個時候，智源愿意投入幾千萬甚至上億資源，組織大量算力去支持模型研發(fā)。這個事情，本身就非常有前瞻性。

某種程度上，很像硅谷早期的“仙童時刻”。硅谷最早并不存在，后來有了仙童半導體，再后來“八叛逆”離開仙童，成立 Intel、AMD 等一系列公司，最終形成整個硅谷生態(tài)。

今天再回頭看，中國很多大模型公司，其實都和智源有很深關系。

所以我覺得，智源在中國 AI 發(fā)展史里，很可能會成為一個非常關鍵的起點。

網(wǎng)易科技：智源研究院和傳統(tǒng)的高校、科研院所、企業(yè)研究院有什么不一樣？在中國 AI 研究體系里，它扮演的是什么角色？

劉知遠：我覺得智源的位置其實非常特殊。

高校最核心的使命，首先還是培養(yǎng)人，同時做原始創(chuàng)新。尤其是那種最前沿、最原始、甚至很多人一開始覺得“不靠譜”的方向，這些更適合發(fā)生在高校。因為高校相對能夠給老師更大的自由度，去做長期探索。

另外一端，是中科院、國家實驗室這樣的機構。它們更偏向國家戰(zhàn)略科研力量，要完成一些非常明確的大型任務。像“兩彈一星”、曼哈頓計劃、登月工程，本質上都屬于有組織科研，需要幾千個科學家協(xié)同完成。

我覺得智源更像是在這兩者之間。

智源做的事情，不像高校那么“從零開始”，但又沒有進入國家實驗室那種高度確定的大型工程階段。它更像是在一個方向已經(jīng)出現(xiàn)明顯苗頭之后，快速組織資源，做前瞻性的孵化和探索。“悟道”項目就是一個典型案例。

當時整個方向已經(jīng)初步顯現(xiàn)，但行業(yè)里真正做的人還不多。智源能夠敏銳地感知到這個趨勢，然后快速聚集上百號人、組織大規(guī)模算力，推動它形成規(guī)模化發(fā)展。

所以我會更傾向于把智源理解成一種“大型原始創(chuàng)新的孵化器”：處在高校之后、產業(yè)之前，負責把一些前沿方向真正推向社會。

當然，這樣的機構其實對管理者要求非常高。

因為它必須具備非常強的前瞻性和實事求是的精神。你可以想象，我們在2021年發(fā)布悟道1.0的時候，其實爭議非常大。很多人會覺得：為什么要花這么多錢去訓練一個萬億參數(shù)模型？到底有什么用？在那個階段，非議是非常大的。

大模型應該“向外卷”，關注原始創(chuàng)新！

網(wǎng)易科技：現(xiàn)在國內大模型公司路線開始分化。字節(jié)阿里等大廠，智譜、Minimax、月之暗面、階躍、面壁智能、百川、零一等，都在走向不同的發(fā)展方向。你怎么看中國大模型發(fā)展路線的分化？

劉知遠：進入 AGI 時代之后，所有東西都是新的。在這種情況下，中國一定會形成由科技創(chuàng)新驅動的新商業(yè)模式。

回看美國科技史的發(fā)展過程，始終有大量原始創(chuàng)新。從仙童半導體，到后來的英特爾、蘋果、微軟、谷歌，這些公司都曾經(jīng)做出過真正意義上的重大突破。

而中國的企業(yè)過去更擅長的，其實是“Copy to China”。2000年左右，美國有什么模式，我們就把它復制到中國，再進行本地化。

到了2010年之后，我們開始出現(xiàn)模式創(chuàng)新，比如支付寶、微信、抖音。但那個階段，本質上還是商業(yè)模式創(chuàng)新，而不是底層技術突破帶來的創(chuàng)新。

我認為，未來十年的 AGI 時代不一樣。這是一個真正全新的時代。所有行業(yè)都還是藍海，存在各種各樣的可能性。在這種情況下，我們當然要去追求通過技術創(chuàng)新來驅動我們在商業(yè)上的成功。

而且你會發(fā)現(xiàn)中國和美國的競爭也特別有意思。比如說，都是做大模型，OpenAI 出現(xiàn)之后，Anthropic 就不會說“我要做第二個 OpenAI”。它選擇了另一條路，比如大幅強化代碼能力，走出了一條全新的發(fā)展模式。

這是非常健康的。因為 AGI 是一個極其廣闊的領域。既然還有大量未知空間，為什么一定要在同一條路上卷？

面向未來，中國一定要形成類似美國歷史上那種通過原始技術創(chuàng)新取得商業(yè)成功的模式，而且一定會有，因為這是一個非常廣闊的領域。

網(wǎng)易科技：這也是面壁選擇端側模型路線的原因？

劉知遠：是的。我們一直認為，未來的智能不可能只存在于云端。

首先，歷史上，計算本身就一直同時存在：超級計算、云計算、端側計算，人工智能也一定會是這樣。

未來一定會出現(xiàn)一種“距離用戶最近”的智能。它能夠真正理解用戶的長期歷史、個性習慣，成為用戶專屬、最懂用戶的大模型。這件事是非常自然會發(fā)生的。

既然已經(jīng)有人在做云模型，我們?yōu)槭裁催€要重復做同樣的事情？我覺得做這種重復工作是很沒意思的。這是內卷式思路，已經(jīng)是上一個時代的競爭模式了。

其次，選擇端側，既有非常清晰的技術支撐，也有非常清晰的歷史類比。這也是為什么我們堅定選擇端側方向。

很多真正大的創(chuàng)新，是“反共識”的。如果所有人都認可一件事，它往往不會是最大的創(chuàng)新。就像 Anthropic 當初重點做代碼能力的時候，很多人其實也未必看得懂。

網(wǎng)易科技：階躍、阿里千問、字節(jié)豆包，也在講“端側智能”，面壁智能和他們的路線有什么不同嗎？

劉知遠：差別還是很大的。面壁智能從2024年初就開始持續(xù)投入端側大模型，是國內最早系統(tǒng)布局這一方向的團隊之一。

到底什么叫“端側智能”？如果說「在手機上調用云端模型」就叫端側智能的話，那么所有大模型公司都在做端側。但是，單純在終端上調用云的 API 無法實現(xiàn)端側智能的核心價值，包括：斷網(wǎng)也能跑，執(zhí)行任務不消耗云端 token，數(shù)據(jù)存儲在本地保護隱私安全。

端側智能最本質的價值，是：即使斷網(wǎng)、沒有云端 API，模型也能真正運行在端上——模型在本地、數(shù)據(jù)也在本地，同時滿足終端散熱、網(wǎng)絡、內存、功耗、算力等等多因素的約束。這是面壁智能從2024年就開始真正持續(xù)投入的事情。

我們希望把智能放在距離用戶最近的地方，而不是只是在用戶附近去調用一個云端服務。這是我們認為的不同之處。

端、云模型的使命各不相同

網(wǎng)易科技：云端模型和端側模型，本質上會是不同的應用場景？

劉知遠：對，而且我覺得要用動態(tài)的眼光來看這個問題。因為端和云之間的邊界，其實一直在變化。Densing Law 告訴我們一件事情：大概每100天，我們就可以用一半?yún)?shù)，實現(xiàn)相同水平的智能。繼續(xù)沿著這一趨勢看，更多今天只能運行在云端的模型能力，未來都有可能逐步下沉到手機、PC、汽車等終端設備上。

這件事情，我認為一定會發(fā)生。

可以設想：兩年之后，也許我們能在終端設備上運行一個接近今天 GPT-5.5水平的模型。到那時，一個很重要的問題就會出現(xiàn)：我們真的需要一個“愛因斯坦級”的模型，來處理每個人的日常需求嗎？

其實未必。我們每個人的管家，只需要理解我們個人需求就可以。

我們會認為，面向未來，端上模型的使命和云上模型的使命會不同。

端側模型最重要的使命有兩個：第一，理解用戶。第二，理解外部世界有哪些能力可以服務用戶。

比如用戶需要數(shù)學能力，它不一定自己最擅長數(shù)學，但它知道應該調用哪個最強數(shù)學模型；用戶需要醫(yī)療能力，它知道該連接哪個專業(yè)系統(tǒng)。所以未來端側 AI，更像是用戶真正的個人智能代理。

它最核心的價值，不是“無所不能”，而是：它足夠理解你，并且知道如何替你調度整個互聯(lián)網(wǎng)世界里的智能資源。

而云端模型則會越來越專業(yè)化。比如：滴滴會有自己的出行模型；美團會有自己的外賣模型；抖音會有自己的娛樂推薦模型；這些模型會深度結合各自行業(yè)的數(shù)據(jù)和場景，形成專業(yè)化智能服務。

而端側模型，則會成為用戶統(tǒng)一的入口，再由它去連接背后的各種云端能力。這是我們對未來智能體系的一種判斷。

另外，端和云代表未來業(yè)界發(fā)展的模式。過去80年的信息革命，形成了三種計算形態(tài)：超級計算負責高精尖科學計算；云計算負責大眾化服務；端側計算負責用戶最實時、最隱私、最貼身的需求。

而未來智能的發(fā)展，我認為也一定會對應形成：超級智能、云服務智能、端側個人智能，因為智能最終還是依托算力存在。算力在哪里，智能就會在哪里。

網(wǎng)易科技：面壁智能如何在汽車、手機、PC 等行業(yè)落地端側智能？

劉知遠： AGI 時代一定會出現(xiàn)新的智能終端。但不同終端的產業(yè)結構其實不太一樣。

比如手機行業(yè)，是高度寡頭化的市場。看起來競爭激烈，但真正的大廠就那么幾家；海外更集中，基本就是 iPhone 和三星。

面壁不需要親自進入“造手機”這個市場。因為這一定會是傳統(tǒng)手機廠商全力投入的方向。

我們的策略是：要進入手機生態(tài)，但不是自己做手機，而是和產業(yè)伙伴深度合作。比如和股東、合作伙伴，包括像華為這樣的企業(yè)，一起去推動智能時代手機能力的升級。

汽車行業(yè)本身既有新勢力，也有傳統(tǒng)車企，整個產業(yè)更傾向于通過產業(yè)鏈協(xié)同完成升級。所以我們會和車企、Tier 1、Tier 2等合作伙伴一起，盡快以標準化的解決方案來推進模型放到車上，支持智能座艙相關的迭代，并且在這個方面形成產品化。

但我們也不可能造車。我們認為，通用人工智能時代一定會出現(xiàn)新的智能終端形態(tài)，并由此承載端側智能的相關服務。

網(wǎng)易科技：在具身智能方向，端側模型如何落地？

劉知遠：對于具身智能來說，最核心的變化，其實就發(fā)生在輸入端和輸出端。

輸入端的核心是“全模態(tài)”。模型需要真正建立起對物理世界的感知能力。今天的大模型，已經(jīng)有：文本、圖像、語音。但未來還遠遠不夠。

機器人還應該有：觸覺、嗅覺、空間感知、紅外感知、雷達感知、電磁感知。這些東西，其實都屬于未來可能出現(xiàn)的新模態(tài)。甚至很多感知能力，是人類本身不具備的，但機器天然可以擁有。所以未來 AI 對世界的感知，很可能會比人類更加全面。

輸出端的核心是 Action。模型如何驅動機器人在現(xiàn)實世界中完成行動。這件事非常關鍵。也是今天多模態(tài)模型、VLA、世界模型等方向，正在努力邁出的下一步。因為“理解世界”和“改變世界”，中間還存在很大距離。

現(xiàn)在很多人都在談“具身智能的 ChatGPT 時刻”，我覺得還沒有到。很多時候，一個領域是不是迎來了“ChatGPT 時刻”，不是企業(yè)自己宣布的，而是整個行業(yè)自然形成共識。

目前具身智能還處在非常早期階段。真正成熟的產品范式，其實還沒有出現(xiàn)。但有一點是確定的：AI 一定會進入物理世界。

網(wǎng)易科技：AI 進入物理世界是不是得靠世界模型？您怎么看當下最熱的“世界模型”？

劉知遠：世界模型這個方向一定是對的。AI 最終一定要從全模態(tài)、走向物理世界，建立起對世界的建模能力，并能夠預測世界下一步是什么。

今天相關技術路線之所以這么百花齊放，原因在于還沒找到真正的實現(xiàn)路線。

在這種時候不能盲目迷信某一條路線。學者可以有自己的堅持，但對于一家商業(yè)公司來說，更重要的是保持謹慎和開放。因為如果過早重倉某一條技術路線，而最后路線判斷錯了，可能會陷入非常大的困局。

對于這種高度不確定的前沿方向，我們更傾向于采用：企業(yè)有限投入，實驗室開放探索，高校協(xié)同研究這樣的方式進行。其實，智源研究院這樣的科研機構很適合做這樣的工作。

核心目標是：無論最終哪條技術路線成立，我們都能夠第一時間識別這個信號，并且快速進入。

最好的情況當然是這條路線由我們自己率先找到；但即使不是，我們也希望成為全球最早跟進、最早投入的一批團隊。這是我們對于世界模型方向的整體策略。

創(chuàng)業(yè)、教育與AI時代的人

網(wǎng)易科技：您作為教授在清華帶學生，又是面壁智能創(chuàng)始人和首席科學家。您怎么平衡學界和產業(yè)界這兩個身份？

劉知遠：這其實是一個水到渠成的過程。

2018年以前，人工智能還處在“專用智能”階段。那個時候，它距離真正進入社會、產生大規(guī)模價值還很遠，很多探索更適合發(fā)生在高校。

但2018年之后，隨著預訓練技術出現(xiàn)，人工智能正在快速邁向通用智能。在這個階段，它一定會進入產業(yè)、進入社會，并真正創(chuàng)造價值。既然它已經(jīng)開始真正“有用”，那它最前沿的探索，也一定會發(fā)生在產業(yè)一線。

這也是為什么，我覺得必須去參與、甚至創(chuàng)立一家企業(yè)，去做最前沿的大模型研發(fā)。只有站在那個前沿位置，你才有機會繼續(xù)推動真正大的創(chuàng)新。

另一方面，我在高校的使命是培養(yǎng)人。

但如果我的學生從來沒有參與過世界最前沿的大模型研發(fā)，那他們很難成為真正第一流的人才。

所以這件事對我來說，并不是一種割裂，而是一個非常自然的發(fā)展過程。

美國的 Berkeley、MIT、Stanford這些頂尖高校，它們和產業(yè)的結合都非常深。

因為計算機科學既是科學，也是技術。

而技術最終一定要服務社會。如果一個技術沒有人愿意為它付費，那它很難說是真正有價值的技術。

網(wǎng)易科技：從學者轉型創(chuàng)業(yè)者，您覺得最大的挑戰(zhàn)是什么？

劉知遠：管理本身其實不是最大挑戰(zhàn)。真正大的挑戰(zhàn)在于：學術界和創(chuàng)業(yè)世界，對“創(chuàng)新”的容忍度是完全不同的。

在學術界，只要你的東西足夠新、足夠前沿，大家就會認可你、尊重你。你做得越難、越超前，往往評價越高。

但創(chuàng)業(yè)不是這樣。當你開始和投資人、產業(yè)鏈、商業(yè)體系打交道之后，你會發(fā)現(xiàn)，世界一下子復雜了很多。

你既要堅持創(chuàng)新，因為這是未來真正重要的東西；但又必須在當下活下來。很多時候，你做得太新，別人甚至都無法理解你的價值。

比如2021、2022年我們去聊大模型時，很多投資人根本聽不懂我們在講什么。他們最關心的問題是：怎么賺錢？商業(yè)模式是什么？但那個時候，連技術本身都還是新的，更不用說商業(yè)模式。

所以后來我會越來越覺得，創(chuàng)業(yè)其實特別像一種“理想和現(xiàn)實之間”的平衡。既要有遠大的目標，又必須活在當下；既要堅持方向，又要找到穿越周期的方法。

網(wǎng)易科技：AI 的發(fā)展對教育提出了非常大的挑戰(zhàn)。作為老師，您應該會經(jīng)常被問到一個問題：AI 時代的人才如何培養(yǎng)？

劉知遠：這個問題我作為老師確實經(jīng)常會被問到。

清華非常重視 AI 到來之后教育范式的變化。一方面，我們會積極探索怎么用 AI 更好賦能教育；但另一方面，我們也在思考：智能時代真正的高端人才，到底應該具備什么樣的品質。

我自己的理解是，其實和高校過去希望培養(yǎng)的人才是一脈相承的，只是重點發(fā)生了變化。我覺得未來高端人才至少需要具備三個能力。

第一，是把 AI 當成工具的判斷力。未來每個人一定都會大量使用 AI 工具。但關鍵不在于“會不會用”，而在于你有沒有能力判斷 AI 給出的結果到底對不對、好不好、該不該相信。

第二，是組織 AI 的架構能力。我經(jīng)常提 OPC（One-Person Company）。未來很多人不一定是一個人在工作，而是一個人帶著很多 AI Agent 一起工作。

這個人更像一個 CEO，他負責調配這些 AI 員工，讓它們協(xié)同完成任務。未來不一定只是 OPC，也可能是 OPL（One-Person Lab），一個人帶著很多 AI Researcher；甚至可能是 OPD（One-Person Department），一個人就是一個部門。

所以未來非常重要的一件事，不再是“親自干活”，而是如何組織 AI、調度 AI、協(xié)調 AI。

組織能力、架構能力，會變得越來越重要。

第三，是基于 AI 的創(chuàng)新能力。創(chuàng)新仍然會是未來人類最核心的能力。AGI 的終極目標，某種程度上也是讓 AI 獲得越來越強的創(chuàng)新能力。但我始終認為，“人 + AI”的創(chuàng)新，依然會強于純 AI。

網(wǎng)易科技：越來越多的趨勢表示，AI 會替代大量工作。

劉知遠：我覺得這個趨勢一定會發(fā)生。很多職業(yè)會被 AI 替代，短期內一定會帶來陣痛。而從更長的人類歷史來看，這是技術革命的必然結果。

比如“computer”這個詞，最開始其實是一種職業(yè)，專門負責做計算的人。當年這甚至是一個很體面的工作，每天坐辦公室里做計算。后來電子計算機出現(xiàn)，這個職業(yè)就消失了。

今天其實也是一樣。接下來幾年，AI Coding 可能會讓很多初級程序員受到?jīng)_擊。但從更大的視角來看，把人類從機械重復的腦力勞動中解放出來，本身是技術進步的重要意義。

人不應該永遠被困在重復勞動里。不要內卷，要“向外卷”。

總之，從局部來看，它一定會帶來調整，需要社會、政府一起去解決就業(yè)和轉型問題；但是從整個人類社會發(fā)展趨勢來講，把人類從機械重復勞動當中解放出來，這是一件有利于人類幸福的事情。

網(wǎng)易新聞

iOS

Android

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

教育

時尚

健康

藝術

手機 / 數(shù)碼

房產 / 家居

獨家對話智源學者劉知遠：中國AI要向外卷，而不只是做第二個OpenAI

中國AI要向外卷，而不只是做第二個OpenAI

25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

上賽季差點降入英甲，下賽季要踢英超了

臺媒貼臉！S媽被問大S嗑藥當場沉默

中國鋁行業(yè)爆單 下一個“煤炭”大周期？

涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

態(tài)度原創(chuàng)

用云錦的方式，打開江蘇南京

新高考專業(yè)學校到底哪個更重要

全網(wǎng)刷屏，華語樂壇“嫡長女”終于來了！

外泌體抗衰，什么時候能用上？

畫美，文字也美 | 日本著名畫家內田正泰

25歲海歸男戀上32歲離異女因88.8萬彩禮鬧掰追討12萬

25歲海歸男戀上32歲離異女因88.8萬彩禮鬧掰追討12萬

中國鋁行業(yè)爆單下一個“煤炭”大周期？

涉水加強福特烈馬亞馬遜限量版上市售價39.98萬