无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

獨家對話智源學者劉知遠:中國AI要向外卷,而不只是做第二個OpenAI

0
分享至

出品 | 網(wǎng)易科技《態(tài)度AGI》

作者 | 袁寧

對話 | 楊霞清

編輯 | 丁廣勝

大模型行業(yè)仍在高速奔跑,也正在進入它真正的分化時刻。

最早,“有卡就能追”;后來變成“有數(shù)據(jù)就能追”;再后來,大家發(fā)現(xiàn),即使有錢、有卡、有團隊,也未必能做出真正領先的模型。行業(yè)開始收斂,玩家開始減少,路線也逐漸分化。

有人繼續(xù)卷規(guī)模,有人轉向Agent,有人下注世界模型。但劉知遠和他的團隊思考的是另一個問題:AI為什么一定只能發(fā)生在云端?

過去幾年,云端模型代表規(guī)模、資本和速度,也代表一種已經(jīng)被證明過的路徑。但劉知遠想做的,是:端側智能,高密度,小模型。

劉知遠是清華大學計算機系教授,也是北京智源人工智能研究院智源學者,曾參與我國首個超大規(guī)模智能模型“悟道”大模型的研發(fā),是國內最早進入預訓練模型研究的一批人。

2022年,劉知遠創(chuàng)立面壁智能,并出任首席科學家。2025年11月,他和團隊關于“大模型密度定律(Densing Law)”的研究登上《自然·機器智能》(Nature Machine Intelligence)封面。論文回測了51個主流模型后發(fā)現(xiàn):過去兩年,大模型的“智能密度”正以每3.5個月翻倍的速度提升。

換句話說,大概每100天,我們就可以用一半?yún)?shù),實現(xiàn)相同水平的智能。今天只能運行在云端的能力,未來或許會被壓縮進手機、汽車、PC、手表、汽車、冰箱……甚至任何一個普通終端。

在和劉知遠的對話中,他多次提到“向外卷”。他始終警惕著另一種更隱蔽的風險:所有人都在用同樣的方法、同樣的敘事、同樣的終點定義自己。

所謂“外卷”,某種程度上也像面壁智能自己的路線選擇:不是在同一條賽道里,把別人已經(jīng)證明過的事情再重復一遍,而是走進真實產業(yè)、真實場景和真實生活,去尋找那些尚未被充分定義的問題。

他提到:

“模型已經(jīng)不再只是一個純科研問題,而是一個典型的‘產研結合’問題。你既要有一線科研能力,能夠持續(xù)創(chuàng)新;同時還要有非常強的工程能力、系統(tǒng)能力,以及完整的產業(yè)化能力。”

“行業(yè)內有一種觀點,中國模型研發(fā)速度和美國有6到12個月差距,并不意味著原始創(chuàng)新能力只差6到12個月。因為原始創(chuàng)新本身是最難的事情。”

也正因如此,在他的視角里,像北京智源人工智能研究院這樣的機構會變得越來越重要。

它既不同于傳統(tǒng)高校,也不同于國家實驗室,更不像一家純商業(yè)公司,而是處在產業(yè)、學術與研究之間的一層“中間地帶”。因為很多原始創(chuàng)新,本身并不天然適合KPI,也未必能快速對應商業(yè)回報。它需要允許長期探索,允許失敗,也允許一段時間內“不知道答案”。

而這場對話討論的,也早已不只是一家公司如何押注一條更少人走的技術路線,而是中國大模型產業(yè)的分化與選擇;不只是中美模型能力的差距,更是原始創(chuàng)新體系之間的差距,以及一個社會需要怎樣的創(chuàng)新支持系統(tǒng);也不只是關于未來人才的培養(yǎng),而是,未來人如何和AI共處。

我們真正好奇的是:在一個被技術迅速改寫的時代,一個人、一家公司,甚至一個行業(yè),究竟該如何找到自己的位置。

以下是網(wǎng)易科技《態(tài)度AGI》欄目獨家對話智源學者、面壁智能聯(lián)合創(chuàng)始人兼首席科學家劉知遠的內容:

中美大模型差距,不只是落后幾個月,而是原始創(chuàng)新還太少

網(wǎng)易科技:4月下旬,DeepSeek-V4發(fā)布后,相對于V3,行業(yè)的反應相對平淡。你怎么看待V4這個模型?

劉知遠:我覺得這是正常的。V3出現(xiàn)的時候,其實所有人都沒有那么高的預期,它是真正意義上的“橫空出世”。但 V4不一樣。大家半年前就已經(jīng)開始等它了,行業(yè)的期待值已經(jīng)被拉滿了。

在這種情況下,它很難再帶來第一次看到 GPT-4或 DeepSeek-V3時那種震撼感。

但這并不意味著它不重要。它仍然代表中國模型能力的一次關鍵推進。

網(wǎng)易科技:我們看到有國外科技博主給4月集中發(fā)布的大模型打分,GPT-5.5是60分,Claude Opus是57分,V4只有52分。這是否也反映了中國模型跟世界頭部模型還是存在一定的差距?

劉知遠:從 ChatGPT出現(xiàn)開始,我們一直認為,中國和美國之間的差距是在縮小,但差距依然存在。

2023年的時候,我們跟 GPT-4的差距,大概是一年。到 DeepSeek-R1,我們可能用半年就能復現(xiàn) OpenAI o1的能力。

今天我會認為,中國模型仍與世界頂尖模型有一定差距。

所以我覺得,一方面要保持清醒,承認差距;但另一方面,也沒有必要因此過度恐慌。

網(wǎng)易科技:當下世界頭部大模型的幾家輪流坐莊。在2026年這個時間節(jié)點,大模型真正比拼的東西是什么?影響大模型競爭格局的變量會是什么?

劉知遠:這個行業(yè)正在快速收斂。它其實很像當年的集成電路產業(yè)。想要真正具備國際一線水平,需要滿足的條件會越來越多。

在2022、2023年的時候,可能只要在某幾個方面具備優(yōu)勢,就有機會迅速做出一個世界領先模型。因為那個階段,整個行業(yè)還相對粗放。包括 OpenAI當年的 GPT-3,其實很多地方今天回頭看,也還是比較粗糙的。

但科技發(fā)展的規(guī)律就是這樣:隨著技術不斷成熟,各個要素都會迅速迭代、迅速補齊。

發(fā)展到今天,一個模型訓得好不好,已經(jīng)和很多因素有關:模型架構、數(shù)據(jù)治理水平、模型風洞完整程度,以及軟硬協(xié)同能力等。

所以你會發(fā)現(xiàn),到了今天,能夠持續(xù)在國際一線發(fā)布模型的團隊,其實已經(jīng)逐漸收斂到少數(shù)幾家了。

網(wǎng)易科技:那最后還能留在牌桌上的玩家,需要具備哪些能力?

劉知遠:我覺得可以分兩個層面來看。

第一個層面,是 AI這幾年正在快速從“象牙塔”走向產業(yè)。

大模型已經(jīng)不再只是一個純科研問題,而是一個典型的“產研結合”問題。既要有一線科研能力,能夠持續(xù)創(chuàng)新;同時還要有非常強的工程能力、系統(tǒng)能力,以及完整的產業(yè)化能力。任何一個環(huán)節(jié)出現(xiàn)短板,都會影響模型在全球范圍內的競爭力。所以未來一個非常重要的趨勢,就是“產”和“研”的進一步融合。

第二個層面,是我們雖然已經(jīng)找到了推動 AGI 持續(xù)發(fā)展的基本規(guī)律,也就是所謂的 Scaling Laws(規(guī)模法則),但每一個階段,仍然需要新的技術突破。

過去大家認為:只要有更多數(shù)據(jù)、更多算力,模型能力就會持續(xù)提升。但發(fā)展到今天,你會發(fā)現(xiàn)新的問題開始出現(xiàn)。

比如到了2024年,全球公開可獲取的數(shù)據(jù)其實已經(jīng)接近耗盡了。這就需要新的技術路線,讓模型能夠自己探索、自己合成數(shù)據(jù),持續(xù)提升能力。

換句話說,如果繼續(xù)沿著傳統(tǒng)規(guī)模法則往前推進,算力成本也會越來越不可持續(xù)。未來不可能真的去用幾百萬張卡訓練一個模型,這個成本沒有任何機構能夠長期承擔。

所以我們團隊提出“密度定律”,希望在規(guī)模法則之外,找到新的效率提升路徑。既提升模型能力,又降低訓練成本,讓 AGI 的發(fā)展變得可持續(xù)。未來真正重要的,仍然是那些既有創(chuàng)新能力、又有工程能力的團隊。它們既是互補關系,也是協(xié)同關系。

過去大家理解的 Scaling Law,就是模型越大,能力越強,它對應的是一條持續(xù)向上的增長曲線。而 Densing Law 是一條“更陡峭”的增長曲線:在相同模型尺寸下,實現(xiàn)更高智能;本質上,它是在提升模型的“智能密度”。

網(wǎng)易科技:國內模型最大的瓶頸之一,還是“缺卡”嗎?

劉知遠:如果是在2023年,很多機構認為限制模型發(fā)展的核心問題是算力,我認為是成立的。

但到了今天,我們應該意識到:真正決定模型能力的因素,已經(jīng)越來越多了。

算力當然非常重要,但如果你沒有架構創(chuàng)新、沒有數(shù)據(jù)治理創(chuàng)新、沒有軟硬件協(xié)同能力,那么即使你有很多卡,最終訓出來的模型也很難真正具備競爭力。

為什么 DeepSeek-V3在2024年底會引起全球關注?因為它告訴大家:我們可以用更低的參數(shù)激活量、更低的訓練成本,達到此前國際頂級模型的效果。

這背后真正重要的,其實是架構創(chuàng)新、細粒度設計,以及軟硬協(xié)同上的突破。讓大家意識到:原來訓練世界級模型,并不一定只能靠“無限堆算力”。

所以未來真正重要的,還是持續(xù)創(chuàng)新。

網(wǎng)易科技:剛才提到中美大模型仍然存在一定差距。但有些人會認為,中國已經(jīng)能用更低成本實現(xiàn)更大的價值。你怎么看中美模型各自的長板和短板?

劉知遠:今年,Anthropic Claude 在全球范圍內的表現(xiàn),其實是非常強勢的。它去年底到今年初發(fā)布的一系列模型,在代碼能力等方向上都非常領先。

到目前為止,我認為中國還沒有任何一個模型真正超越 Claude。包括 DeepSeek-V4在內,中國模型與國際最先進模型相比,在一些能力上仍然存在差距。我們還是需要非常客觀地分析自己當前所處的位置。

我們說中國模型研發(fā)速度和美國有一定差距,其中最重要的還是原始創(chuàng)新能力。

因為原始創(chuàng)新本身是最難的事情。真正的開創(chuàng)者,需要在完全未知的方向上做大量開放性探索。很多時候要兵分多路、不斷試錯,最后才能找到真正有效的路徑。

但跟隨者不一樣。跟隨者只需要看到開創(chuàng)者已經(jīng)驗證成功的路線,然后沿著這條路繼續(xù)推進。

這兩者在成本、難度,以及對原始創(chuàng)新能力的要求上,其實完全不是一個量級。

所以我認為,美國目前最大的優(yōu)勢,其實是在大模型和 AGI 最前沿方向上的原始創(chuàng)新能力。而這恰恰是中國目前最欠缺的部分。

網(wǎng)易科技:那 DeepSeek-R1算是一次原始創(chuàng)新嗎?

劉知遠:DeepSeek-R1為什么能夠登上《Nature》封面、獲得全球認可?很重要的原因在于,它是在 OpenAI 沒有公開完整技術路線的情況下,做出了真正有價值的創(chuàng)新。

這件事本身非常不容易。但即使如此,我依然會認為,它還不是最原始層面的創(chuàng)新。

因為 OpenAI 的 o1已經(jīng)向全世界證明了一件事:原來模型可以通過這種方式實現(xiàn)深度推理能力。一旦這個方向被驗證成立,后面的人就擁有了一個明確目標。后續(xù)的創(chuàng)新,更多是在這個方向上的技術推進與工程突破。

因為它意味著:這個問題是存在標準答案的。對于后來者來說,這會極大降低探索的不確定性。

所以我覺得,中國需要非常清晰地認識到:我們今天已經(jīng)具備了非常強的跟進能力,但在最頂層的原始創(chuàng)新上,仍然需要繼續(xù)追趕。

網(wǎng)易科技:那中國的優(yōu)勢是什么?

劉知遠:最大的優(yōu)勢,首先是“勢能”。

過去20年,中國經(jīng)歷了從互聯(lián)網(wǎng)、信息化,到今天智能化的快速發(fā)展過程。

我從2006年開始讀博,到現(xiàn)在整整20年。我能非常明顯地感受到,中國已經(jīng)從當年幾乎無人關注AI 領域的狀態(tài),發(fā)展成今天全世界唯一能夠在人工智能最前沿與美國持續(xù)競爭的國家。這種進步速度,本身就是非常巨大的優(yōu)勢。

我們擁有龐大的人才基礎,也形成了非常強的社會共識。整個國家、整個產業(yè)、包括普通人,都非常認可:這場科技革命必須抓住。

我覺得這種全國性的共識,其實是非常難得的。放眼全球,很少有國家能夠像中國一樣,對一場科技革命形成如此強烈、持續(xù)的投入意愿。

其次,我覺得是中國巨大的應用市場。中國 AI 的技術突破和產業(yè)應用是高度協(xié)同的。從政府到各個行業(yè),對 AI 的接受度都非常高,也愿意開放大量真實場景。所以中國的應用落地速度會非常快。

而 AGI 最終帶來的,是一場類似工業(yè)革命級別的智能革命。本質上是在用 AI 去替代人的機械腦力勞動和部分體力勞動。所有依賴知識和經(jīng)驗的行業(yè),未來都需要被 AI 重構。我們在技術應用和結合,在全世界范圍,在應用創(chuàng)新上的能力和愿景其實是非常廣闊的。

智源、悟道與中國AI的“仙童時刻”

網(wǎng)易科技:您最早做通用模型研究。回頭看,智源研究院和“悟道”項目,對您后來判斷大模型與產業(yè)方向產生了怎樣的影響?

劉知遠:這個其實和智源研究院有關系。

2020年,OpenAI 發(fā)布 GPT-3, 是一個非常重要的歷史節(jié)點。是全球第一個真正意義上的千億參數(shù)模型,1750億參數(shù),而且第一次展現(xiàn)出了非常流暢的自然語言生成能力。那個震撼,對當時整個行業(yè)來說都非常大。

在 GPT-3出現(xiàn)之前,我們作為國內最早一批做預訓練模型的團隊,已經(jīng)覺得自己站在了全球前沿。那時候我們訓練的還是單機八卡、上億參數(shù)級別的模型,在國內已經(jīng)算非常先進了。

但 GPT-3一出來,我們突然發(fā)現(xiàn),人家已經(jīng)在用2000張卡訓練千億模型了。瞬間意識到,雙方已經(jīng)不在同一個數(shù)量級。

當時我正好是智源學者。智源本身又是一個非常年輕、非常有活力的科研機構。我們當時專門向智源決策層匯報了 GPT-3的情況。我們認為,這不僅僅是一次模型升級,而是通用人工智能方向上的重大突破。但它又極度依賴基礎資源,因為你想訓練更大的模型,就需要更多 GPU。

可那時候國內大部分團隊,可能連幾臺機器都沒有。

后來智源很快做了決定,批了幾百萬,采購了10臺 V100。今天看可能不算什么,但在當時已經(jīng)是非常大的投入。我們也正是基于這批算力,訓練出了26億參數(shù)模型。它生成文本的流暢程度,相比我們之前的模型有了非常明顯的躍遷。

我覺得,那其實是中國大模型真正開始起步的一個重要節(jié)點。

到了2021年,智源內部已經(jīng)基本形成了“大模型會成為未來核心方向”的共識。后來有了唐杰老師牽頭的“悟道”項目,我們團隊也是參與者之一。

網(wǎng)易科技:智源學者群體對中國大模型行業(yè)做出了重要的貢獻,您怎么看智源學者這套機制,它的獨特之處是什么?

劉知遠:作為這個智源學者中的一員,智源最特別的一點,是和國內很多傳統(tǒng)人才計劃都不一樣。

并不會要求你每年交多少論文、多少專利、多少 KPI,也不會天天檢查你是不是在“認真干活”。背后其實是一種非常先進的理念:一種基于信任建立起來的學術共同體。

首先智源會找到這個領域最有公信力的專家,再由這些專家去選擇他們真正認可的人。整個過程相對非常公平。而且選出來之后,也不是靠各種行政化管理去驅動創(chuàng)新,而是給予充分信任。

我覺得“信任”是這里面最核心的關鍵詞。因為真正頂尖的研究者,本來就不需要靠外部監(jiān)督來驅動。恰恰是在這種信任之下,很多學者才會真正愿意圍繞智源這個平臺,去做一些“不一樣”的探索。

包括“悟道”項目的推進,也體現(xiàn)了這一點。智源的決策鏈條非常短、非常快。很多大型科研項目,可能光論證就要一年,等真正立項的時候,國外已經(jīng)做完了。但智源當時能夠在非常短時間內完成決策,并快速投入資源。

我覺得這背后,本質上還是一種對人的信任,對方向的信任。

更重要的是,它把很多真正優(yōu)秀的人聚在了一起。很多時候,一群高水平的人長期交流、碰撞,本身就會催生新的思想。所以你會發(fā)現(xiàn),智源在全國范圍內押注大模型,其實比很多機構至少早了一年。

具體形式不重要,真正重要的是它背后的內核。這需要一代一代傳承下去。

網(wǎng)易科技:當時的“悟道”項目,本質上就是一場“非共識下注”?

劉知遠:對,我覺得它本質上是一場非常重要的“風險投資”。

2021年是什么時間點?那時候 OpenAI 都還不是今天的 OpenAI。GPT-2發(fā)布的時候,很多人甚至還在嘲諷“大模型路線”。整個行業(yè)對大模型是存在巨大爭議的。

但就在那個時候,智源愿意投入幾千萬甚至上億資源,組織大量算力去支持模型研發(fā)。這個事情,本身就非常有前瞻性。

某種程度上,很像硅谷早期的“仙童時刻”。硅谷最早并不存在,后來有了仙童半導體,再后來“八叛逆”離開仙童,成立 Intel、AMD 等一系列公司,最終形成整個硅谷生態(tài)。

今天再回頭看,中國很多大模型公司,其實都和智源有很深關系。

所以我覺得,智源在中國 AI 發(fā)展史里,很可能會成為一個非常關鍵的起點。

網(wǎng)易科技:智源研究院和傳統(tǒng)的高校、科研院所、企業(yè)研究院有什么不一樣?在中國 AI 研究體系里,它扮演的是什么角色?

劉知遠:我覺得智源的位置其實非常特殊。

高校最核心的使命,首先還是培養(yǎng)人,同時做原始創(chuàng)新。尤其是那種最前沿、最原始、甚至很多人一開始覺得“不靠譜”的方向,這些更適合發(fā)生在高校。因為高校相對能夠給老師更大的自由度,去做長期探索。

另外一端,是中科院、國家實驗室這樣的機構。它們更偏向國家戰(zhàn)略科研力量,要完成一些非常明確的大型任務。像“兩彈一星”、曼哈頓計劃、登月工程,本質上都屬于有組織科研,需要幾千個科學家協(xié)同完成。

我覺得智源更像是在這兩者之間。

智源做的事情,不像高校那么“從零開始”,但又沒有進入國家實驗室那種高度確定的大型工程階段。它更像是在一個方向已經(jīng)出現(xiàn)明顯苗頭之后,快速組織資源,做前瞻性的孵化和探索。“悟道”項目就是一個典型案例。

當時整個方向已經(jīng)初步顯現(xiàn),但行業(yè)里真正做的人還不多。智源能夠敏銳地感知到這個趨勢,然后快速聚集上百號人、組織大規(guī)模算力,推動它形成規(guī)模化發(fā)展。

所以我會更傾向于把智源理解成一種“大型原始創(chuàng)新的孵化器”:處在高校之后、產業(yè)之前,負責把一些前沿方向真正推向社會。

當然,這樣的機構其實對管理者要求非常高。

因為它必須具備非常強的前瞻性和實事求是的精神。你可以想象,我們在2021年發(fā)布悟道1.0的時候,其實爭議非常大。很多人會覺得:為什么要花這么多錢去訓練一個萬億參數(shù)模型?到底有什么用?在那個階段,非議是非常大的。

大模型應該“向外卷”,關注原始創(chuàng)新!

網(wǎng)易科技:現(xiàn)在國內大模型公司路線開始分化。字節(jié)阿里等大廠,智譜、Minimax、月之暗面、階躍、面壁智能、百川、零一等,都在走向不同的發(fā)展方向。你怎么看中國大模型發(fā)展路線的分化?

劉知遠:進入 AGI 時代之后,所有東西都是新的。在這種情況下,中國一定會形成由科技創(chuàng)新驅動的新商業(yè)模式。

回看美國科技史的發(fā)展過程,始終有大量原始創(chuàng)新。從仙童半導體,到后來的英特爾、蘋果、微軟、谷歌,這些公司都曾經(jīng)做出過真正意義上的重大突破。

而中國的企業(yè)過去更擅長的,其實是“Copy to China”。2000年左右,美國有什么模式,我們就把它復制到中國,再進行本地化。

到了2010年之后,我們開始出現(xiàn)模式創(chuàng)新,比如支付寶、微信、抖音。但那個階段,本質上還是商業(yè)模式創(chuàng)新,而不是底層技術突破帶來的創(chuàng)新。

我認為,未來十年的 AGI 時代不一樣。這是一個真正全新的時代。所有行業(yè)都還是藍海,存在各種各樣的可能性。在這種情況下,我們當然要去追求通過技術創(chuàng)新來驅動我們在商業(yè)上的成功。

而且你會發(fā)現(xiàn)中國和美國的競爭也特別有意思。比如說,都是做大模型,OpenAI 出現(xiàn)之后,Anthropic 就不會說“我要做第二個 OpenAI”。它選擇了另一條路,比如大幅強化代碼能力,走出了一條全新的發(fā)展模式。

這是非常健康的。因為 AGI 是一個極其廣闊的領域。既然還有大量未知空間,為什么一定要在同一條路上卷?

面向未來,中國一定要形成類似美國歷史上那種通過原始技術創(chuàng)新取得商業(yè)成功的模式,而且一定會有,因為這是一個非常廣闊的領域。

網(wǎng)易科技:這也是面壁選擇端側模型路線的原因?

劉知遠:是的。我們一直認為,未來的智能不可能只存在于云端。

首先,歷史上,計算本身就一直同時存在:超級計算、云計算、端側計算,人工智能也一定會是這樣。

未來一定會出現(xiàn)一種“距離用戶最近”的智能。它能夠真正理解用戶的長期歷史、個性習慣,成為用戶專屬、最懂用戶的大模型。這件事是非常自然會發(fā)生的。

既然已經(jīng)有人在做云模型,我們?yōu)槭裁催€要重復做同樣的事情?我覺得做這種重復工作是很沒意思的。這是內卷式思路,已經(jīng)是上一個時代的競爭模式了。

其次,選擇端側,既有非常清晰的技術支撐,也有非常清晰的歷史類比。這也是為什么我們堅定選擇端側方向。

很多真正大的創(chuàng)新,是“反共識”的。如果所有人都認可一件事,它往往不會是最大的創(chuàng)新。就像 Anthropic 當初重點做代碼能力的時候,很多人其實也未必看得懂。

網(wǎng)易科技:階躍、阿里千問、字節(jié)豆包,也在講“端側智能”,面壁智能和他們的路線有什么不同嗎?

劉知遠:差別還是很大的。面壁智能從2024年初就開始持續(xù)投入端側大模型,是國內最早系統(tǒng)布局這一方向的團隊之一。

到底什么叫“端側智能”?如果說「在手機上調用云端模型」就叫端側智能的話,那么所有大模型公司都在做端側。但是,單純在終端上調用云的 API 無法實現(xiàn)端側智能的核心價值,包括:斷網(wǎng)也能跑,執(zhí)行任務不消耗云端 token,數(shù)據(jù)存儲在本地保護隱私安全。

端側智能最本質的價值,是:即使斷網(wǎng)、沒有云端 API,模型也能真正運行在端上——模型在本地、數(shù)據(jù)也在本地,同時滿足終端散熱、網(wǎng)絡、內存、功耗、算力等等多因素的約束。這是面壁智能從2024年就開始真正持續(xù)投入的事情。

我們希望把智能放在距離用戶最近的地方,而不是只是在用戶附近去調用一個云端服務。這是我們認為的不同之處。

端、云模型的使命各不相同

網(wǎng)易科技:云端模型和端側模型,本質上會是不同的應用場景?

劉知遠:對,而且我覺得要用動態(tài)的眼光來看這個問題。因為端和云之間的邊界,其實一直在變化。Densing Law 告訴我們一件事情:大概每100天,我們就可以用一半?yún)?shù),實現(xiàn)相同水平的智能。繼續(xù)沿著這一趨勢看,更多今天只能運行在云端的模型能力,未來都有可能逐步下沉到手機、PC、汽車等終端設備上。

這件事情,我認為一定會發(fā)生。

可以設想:兩年之后,也許我們能在終端設備上運行一個接近今天 GPT-5.5水平的模型。到那時,一個很重要的問題就會出現(xiàn):我們真的需要一個“愛因斯坦級”的模型,來處理每個人的日常需求嗎?

其實未必。我們每個人的管家,只需要理解我們個人需求就可以。

我們會認為,面向未來,端上模型的使命和云上模型的使命會不同。

端側模型最重要的使命有兩個:第一,理解用戶。第二,理解外部世界有哪些能力可以服務用戶。

比如用戶需要數(shù)學能力,它不一定自己最擅長數(shù)學,但它知道應該調用哪個最強數(shù)學模型;用戶需要醫(yī)療能力,它知道該連接哪個專業(yè)系統(tǒng)。所以未來端側 AI,更像是用戶真正的個人智能代理。

它最核心的價值,不是“無所不能”,而是:它足夠理解你,并且知道如何替你調度整個互聯(lián)網(wǎng)世界里的智能資源。

而云端模型則會越來越專業(yè)化。比如:滴滴會有自己的出行模型;美團會有自己的外賣模型;抖音會有自己的娛樂推薦模型;這些模型會深度結合各自行業(yè)的數(shù)據(jù)和場景,形成專業(yè)化智能服務。

而端側模型,則會成為用戶統(tǒng)一的入口,再由它去連接背后的各種云端能力。這是我們對未來智能體系的一種判斷。

另外,端和云代表未來業(yè)界發(fā)展的模式。過去80年的信息革命,形成了三種計算形態(tài):超級計算負責高精尖科學計算;云計算負責大眾化服務;端側計算負責用戶最實時、最隱私、最貼身的需求。

而未來智能的發(fā)展,我認為也一定會對應形成:超級智能、云服務智能、端側個人智能,因為智能最終還是依托算力存在。算力在哪里,智能就會在哪里。

網(wǎng)易科技:面壁智能如何在汽車、手機、PC 等行業(yè)落地端側智能?

劉知遠: AGI 時代一定會出現(xiàn)新的智能終端。但不同終端的產業(yè)結構其實不太一樣。

比如手機行業(yè),是高度寡頭化的市場。看起來競爭激烈,但真正的大廠就那么幾家;海外更集中,基本就是 iPhone 和三星。

面壁不需要親自進入“造手機”這個市場。因為這一定會是傳統(tǒng)手機廠商全力投入的方向。

我們的策略是:要進入手機生態(tài),但不是自己做手機,而是和產業(yè)伙伴深度合作。比如和股東、合作伙伴,包括像華為這樣的企業(yè),一起去推動智能時代手機能力的升級。

汽車行業(yè)本身既有新勢力,也有傳統(tǒng)車企,整個產業(yè)更傾向于通過產業(yè)鏈協(xié)同完成升級。所以我們會和車企、Tier 1、Tier 2等合作伙伴一起,盡快以標準化的解決方案來推進模型放到車上,支持智能座艙相關的迭代,并且在這個方面形成產品化。

但我們也不可能造車。我們認為,通用人工智能時代一定會出現(xiàn)新的智能終端形態(tài),并由此承載端側智能的相關服務。

網(wǎng)易科技:在具身智能方向,端側模型如何落地?

劉知遠:對于具身智能來說,最核心的變化,其實就發(fā)生在輸入端和輸出端。

輸入端的核心是“全模態(tài)”。模型需要真正建立起對物理世界的感知能力。今天的大模型,已經(jīng)有:文本、圖像、語音。但未來還遠遠不夠。

機器人還應該有:觸覺、嗅覺、空間感知、紅外感知、雷達感知、電磁感知。這些東西,其實都屬于未來可能出現(xiàn)的新模態(tài)。甚至很多感知能力,是人類本身不具備的,但機器天然可以擁有。所以未來 AI 對世界的感知,很可能會比人類更加全面。

輸出端的核心是 Action。模型如何驅動機器人在現(xiàn)實世界中完成行動。這件事非常關鍵。也是今天多模態(tài)模型、VLA、世界模型等方向,正在努力邁出的下一步。因為“理解世界”和“改變世界”,中間還存在很大距離。

現(xiàn)在很多人都在談“具身智能的 ChatGPT 時刻”,我覺得還沒有到。很多時候,一個領域是不是迎來了“ChatGPT 時刻”,不是企業(yè)自己宣布的,而是整個行業(yè)自然形成共識。

目前具身智能還處在非常早期階段。真正成熟的產品范式,其實還沒有出現(xiàn)。但有一點是確定的:AI 一定會進入物理世界。

網(wǎng)易科技:AI 進入物理世界是不是得靠世界模型?您怎么看當下最熱的“世界模型”?

劉知遠:世界模型這個方向一定是對的。AI 最終一定要從全模態(tài)、走向物理世界,建立起對世界的建模能力,并能夠預測世界下一步是什么。

今天相關技術路線之所以這么百花齊放,原因在于還沒找到真正的實現(xiàn)路線。

在這種時候不能盲目迷信某一條路線。學者可以有自己的堅持,但對于一家商業(yè)公司來說,更重要的是保持謹慎和開放。因為如果過早重倉某一條技術路線,而最后路線判斷錯了,可能會陷入非常大的困局。

對于這種高度不確定的前沿方向,我們更傾向于采用:企業(yè)有限投入,實驗室開放探索,高校協(xié)同研究這樣的方式進行。其實,智源研究院這樣的科研機構很適合做這樣的工作。

核心目標是:無論最終哪條技術路線成立,我們都能夠第一時間識別這個信號,并且快速進入。

最好的情況當然是這條路線由我們自己率先找到;但即使不是,我們也希望成為全球最早跟進、最早投入的一批團隊。這是我們對于世界模型方向的整體策略。

創(chuàng)業(yè)、教育與AI時代的人

網(wǎng)易科技:您作為教授在清華帶學生,又是面壁智能創(chuàng)始人和首席科學家。您怎么平衡學界和產業(yè)界這兩個身份?

劉知遠:這其實是一個水到渠成的過程。

2018年以前,人工智能還處在“專用智能”階段。那個時候,它距離真正進入社會、產生大規(guī)模價值還很遠,很多探索更適合發(fā)生在高校。

但2018年之后,隨著預訓練技術出現(xiàn),人工智能正在快速邁向通用智能。在這個階段,它一定會進入產業(yè)、進入社會,并真正創(chuàng)造價值。既然它已經(jīng)開始真正“有用”,那它最前沿的探索,也一定會發(fā)生在產業(yè)一線。

這也是為什么,我覺得必須去參與、甚至創(chuàng)立一家企業(yè),去做最前沿的大模型研發(fā)。只有站在那個前沿位置,你才有機會繼續(xù)推動真正大的創(chuàng)新。

另一方面,我在高校的使命是培養(yǎng)人。

但如果我的學生從來沒有參與過世界最前沿的大模型研發(fā),那他們很難成為真正第一流的人才。

所以這件事對我來說,并不是一種割裂,而是一個非常自然的發(fā)展過程。

美國的 Berkeley、MIT、Stanford這些頂尖高校,它們和產業(yè)的結合都非常深。

因為計算機科學既是科學,也是技術。

而技術最終一定要服務社會。如果一個技術沒有人愿意為它付費,那它很難說是真正有價值的技術。

網(wǎng)易科技:從學者轉型創(chuàng)業(yè)者,您覺得最大的挑戰(zhàn)是什么?

劉知遠:管理本身其實不是最大挑戰(zhàn)。真正大的挑戰(zhàn)在于:學術界和創(chuàng)業(yè)世界,對“創(chuàng)新”的容忍度是完全不同的。

在學術界,只要你的東西足夠新、足夠前沿,大家就會認可你、尊重你。你做得越難、越超前,往往評價越高。

但創(chuàng)業(yè)不是這樣。當你開始和投資人、產業(yè)鏈、商業(yè)體系打交道之后,你會發(fā)現(xiàn),世界一下子復雜了很多。

你既要堅持創(chuàng)新,因為這是未來真正重要的東西;但又必須在當下活下來。很多時候,你做得太新,別人甚至都無法理解你的價值。

比如2021、2022年我們去聊大模型時,很多投資人根本聽不懂我們在講什么。他們最關心的問題是:怎么賺錢?商業(yè)模式是什么?但那個時候,連技術本身都還是新的,更不用說商業(yè)模式。

所以后來我會越來越覺得,創(chuàng)業(yè)其實特別像一種“理想和現(xiàn)實之間”的平衡。既要有遠大的目標,又必須活在當下;既要堅持方向,又要找到穿越周期的方法。

網(wǎng)易科技:AI 的發(fā)展對教育提出了非常大的挑戰(zhàn)。作為老師,您應該會經(jīng)常被問到一個問題:AI 時代的人才如何培養(yǎng)?

劉知遠:這個問題我作為老師確實經(jīng)常會被問到。

清華非常重視 AI 到來之后教育范式的變化。一方面,我們會積極探索怎么用 AI 更好賦能教育;但另一方面,我們也在思考:智能時代真正的高端人才,到底應該具備什么樣的品質。

我自己的理解是,其實和高校過去希望培養(yǎng)的人才是一脈相承的,只是重點發(fā)生了變化。我覺得未來高端人才至少需要具備三個能力。

第一,是把 AI 當成工具的判斷力。未來每個人一定都會大量使用 AI 工具。但關鍵不在于“會不會用”,而在于你有沒有能力判斷 AI 給出的結果到底對不對、好不好、該不該相信。

第二,是組織 AI 的架構能力。我經(jīng)常提 OPC(One-Person Company)。未來很多人不一定是一個人在工作,而是一個人帶著很多 AI Agent 一起工作。

這個人更像一個 CEO,他負責調配這些 AI 員工,讓它們協(xié)同完成任務。未來不一定只是 OPC,也可能是 OPL(One-Person Lab),一個人帶著很多 AI Researcher;甚至可能是 OPD(One-Person Department),一個人就是一個部門。

所以未來非常重要的一件事,不再是“親自干活”,而是如何組織 AI、調度 AI、協(xié)調 AI。

組織能力、架構能力,會變得越來越重要。

第三,是基于 AI 的創(chuàng)新能力。創(chuàng)新仍然會是未來人類最核心的能力。AGI 的終極目標,某種程度上也是讓 AI 獲得越來越強的創(chuàng)新能力。但我始終認為,“人 + AI”的創(chuàng)新,依然會強于純 AI。

網(wǎng)易科技:越來越多的趨勢表示,AI 會替代大量工作。

劉知遠:我覺得這個趨勢一定會發(fā)生。很多職業(yè)會被 AI 替代,短期內一定會帶來陣痛。而從更長的人類歷史來看,這是技術革命的必然結果。

比如“computer”這個詞,最開始其實是一種職業(yè),專門負責做計算的人。當年這甚至是一個很體面的工作,每天坐辦公室里做計算。后來電子計算機出現(xiàn),這個職業(yè)就消失了。

今天其實也是一樣。接下來幾年,AI Coding 可能會讓很多初級程序員受到?jīng)_擊。但從更大的視角來看,把人類從機械重復的腦力勞動中解放出來,本身是技術進步的重要意義。

人不應該永遠被困在重復勞動里。不要內卷,要“向外卷”。

總之,從局部來看,它一定會帶來調整,需要社會、政府一起去解決就業(yè)和轉型問題;但是從整個人類社會發(fā)展趨勢來講,把人類從機械重復勞動當中解放出來,這是一件有利于人類幸福的事情。

延伸閱讀
相關推薦
熱點推薦
逼自己看了孫楊X易立競的采訪,我一人血書孫楊出一本《說話之道》...

逼自己看了孫楊X易立競的采訪,我一人血書孫楊出一本《說話之道》...

畢導
2026-05-25 17:23:12
布倫森全票獲東決MVP:生涯首次+歷史第5人 率尼克斯沖第3冠

布倫森全票獲東決MVP:生涯首次+歷史第5人 率尼克斯沖第3冠

醉臥浮生
2026-05-26 10:43:25
為什么說印度如今的熱,全是歷史欠下的債?

為什么說印度如今的熱,全是歷史欠下的債?

勇哥讀史
2026-05-25 20:50:07
連云港遭遇強暴雨致嚴重內澇:多車被淹 屋內積水70厘米 有市民街頭游泳

連云港遭遇強暴雨致嚴重內澇:多車被淹 屋內積水70厘米 有市民街頭游泳

閃電新聞
2026-05-26 11:01:42
馬斯克說中了!當今世界搶的不是芯片,而是中國20萬一臺的變壓器

馬斯克說中了!當今世界搶的不是芯片,而是中國20萬一臺的變壓器

潮鹿逐夢
2026-05-20 00:22:42
某央企,曝大規(guī)模裁員!

某央企,曝大規(guī)模裁員!

新浪財經(jīng)
2026-05-25 18:41:57
他是黎家盈丈夫,放棄事業(yè)遷居北京照顧3孩子,難怪妻子能上太空

他是黎家盈丈夫,放棄事業(yè)遷居北京照顧3孩子,難怪妻子能上太空

娛妮啵啵啊
2026-05-25 00:03:18
鄭麗文6月1日就要去美國了,即使不回來了,我也要將鄭麗文說透

鄭麗文6月1日就要去美國了,即使不回來了,我也要將鄭麗文說透

小影的娛樂
2026-05-26 02:40:52
3299元!兩輪車也上智駕?雅迪摩登系列殺瘋了

3299元!兩輪車也上智駕?雅迪摩登系列殺瘋了

雷科技
2026-05-25 10:09:20
嘴硬!哈登談被橫掃:我們實力比尼克斯更強 我季后賽表現(xiàn)相當不錯

嘴硬!哈登談被橫掃:我們實力比尼克斯更強 我季后賽表現(xiàn)相當不錯

818體育
2026-05-26 17:48:50
霍去病啊,這人,說白了就是老天爺臨時下凡一趟

霍去病啊,這人,說白了就是老天爺臨時下凡一趟

老達子
2026-05-25 06:25:03
半導體大佬集體減持后,杭州豪宅被搶瘋了!

半導體大佬集體減持后,杭州豪宅被搶瘋了!

櫻桃大房子
2026-05-25 21:52:46
踢球者:沙爾克想續(xù)約卡里烏斯,并為他漲薪

踢球者:沙爾克想續(xù)約卡里烏斯,并為他漲薪

懂球帝
2026-05-26 14:29:44
美伊或將達成協(xié)議,中方是否發(fā)揮作用?外交部回應

美伊或將達成協(xié)議,中方是否發(fā)揮作用?外交部回應

澎湃新聞
2026-05-25 16:20:04
全國通緝犯藏上海9年,成身價3億大佬,被捕時:放了我,給5000萬

全國通緝犯藏上海9年,成身價3億大佬,被捕時:放了我,給5000萬

鑒史錄
2026-05-23 12:44:00
11歲男孩頂替退伍軍人領國家俸祿15年,被揭穿后:敢告我就弄死你

11歲男孩頂替退伍軍人領國家俸祿15年,被揭穿后:敢告我就弄死你

莫地方
2026-05-25 01:15:03
毛澤東躲入農婦家避敵搜查,她竟大喊:共產黨在此,快來抓!

毛澤東躲入農婦家避敵搜查,她竟大喊:共產黨在此,快來抓!

鑒史錄
2026-05-24 16:35:50
中紀委怒批高校“四宗罪”,每一刀都切在要害上

中紀委怒批高校“四宗罪”,每一刀都切在要害上

細說職場
2026-05-24 15:32:38
大潤發(fā)創(chuàng)始人去世

大潤發(fā)創(chuàng)始人去世

中國能源網(wǎng)
2026-05-26 17:49:25
零容忍!陜西多地正在嚴查 →

零容忍!陜西多地正在嚴查 →

黃河新聞網(wǎng)呂梁
2026-05-26 11:05:45
2026-05-26 18:16:49

科技要聞

中國AI要向外卷,而不只是做第二個OpenAI

頭條要聞

25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

頭條要聞

25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

體育要聞

上賽季差點降入英甲,下賽季要踢英超了

娛樂要聞

臺媒貼臉!S媽被問大S嗑藥當場沉默

財經(jīng)要聞

中國鋁行業(yè)爆單 下一個“煤炭”大周期?

汽車要聞

涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

態(tài)度原創(chuàng)

本地
教育
時尚
健康
藝術

本地新聞

用云錦的方式,打開江蘇南京

教育要聞

新高考專業(yè)學校到底哪個更重要

全網(wǎng)刷屏,華語樂壇“嫡長女”終于來了!

外泌體抗衰,什么時候能用上?

藝術要聞

畫美,文字也美 | 日本著名畫家內田正泰

無障礙瀏覽 進入關懷版
×