无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

去了一趟中國(guó)AI實(shí)驗(yàn)室,Linux基金會(huì)CTO感嘆:西方那兩套偏見全破產(chǎn)了

0
分享至


沒有硅谷的百萬(wàn)年薪,DeepSeek 憑什么干翻美國(guó)大廠?

編譯 | 王啟隆

出品丨AI 科技大本營(yíng)(ID:rgznai100)

剛結(jié)束中國(guó)大陸考察的 Linux 基金會(huì)全球 AI 技術(shù)官 Matt White,最近在一檔海外播客里聊了聊他的真實(shí)見聞。

在美國(guó)大眾想象中,制裁之下的中國(guó) AI 實(shí)驗(yàn)室應(yīng)該是一片死寂。但 Matt 密集走訪了 DeepSeek、零一萬(wàn)物、月之暗面(Moonshot)、MiniMax 和阿里通義千問(Qwen)后,發(fā)現(xiàn)事實(shí)完全相反:中國(guó)實(shí)驗(yàn)室的文化黏性很強(qiáng)、人才流動(dòng)相對(duì)較少,而那些畢業(yè)于斯坦福、伯克利、卡內(nèi)基梅隆的華人頂尖研究者,現(xiàn)在也正成群結(jié)隊(duì)地選擇回國(guó)工作,而不是留在美國(guó)大廠


此外,中國(guó)實(shí)驗(yàn)室倒騰出來的工具,正在反向輸出到美國(guó)本土。因?yàn)?Meta 的 Llama 迭代放緩,通義千問(Qwen)已經(jīng)成為包括美國(guó)企業(yè)在內(nèi)、全球部署和下載最廣泛的開源模型。

Matt 舉了一個(gè)很接地氣的例子:有香港團(tuán)隊(duì)想給產(chǎn)品做粵語(yǔ)語(yǔ)音客服,找美國(guó)某家明星語(yǔ)音 AI 供應(yīng)商,結(jié)果對(duì)方在活動(dòng)中途突然升級(jí)了后臺(tái) API,導(dǎo)致系統(tǒng)直接崩盤,發(fā)消息給創(chuàng)始人也石沉大海。最后他們抱著試試看的心態(tài)在 LinkedIn 上私信了 MiniMax 的創(chuàng)始人,對(duì)方立刻拉了個(gè)微信技術(shù)群,派工程師連夜把問題給解決了

相反,他給另一家美國(guó)公司發(fā)了同樣的需求,結(jié)果就是消息石沉大海。這種“客戶第一、不計(jì)代價(jià)賺市場(chǎng)”的饑渴,是硅谷那些被過剩需求寵壞了的大廠根本無(wú)法理解的。


面對(duì)國(guó)內(nèi)現(xiàn)在同樣火爆的“單人公司”(OPC)和“開除所有員工、用 12 個(gè) Agent 賺錢”的自嗨論調(diào),這位開源老兵也潑了冷水。他說,現(xiàn)在的智能體底色依然是“隨機(jī)鸚鵡”,根本沒有真正的人類邏輯。比如有些企業(yè)用大模型做財(cái)務(wù)退款,結(jié)果模型被用戶兩句話越獄,退了一堆不該退的錢。這也是為什么他堅(jiān)持要把防線用傳統(tǒng)代碼寫死,而不能指望模型每次都聽話。以下的他的觀點(diǎn)總結(jié):

  • 西方的出口管制不僅沒卡死中國(guó),反而把北京逼成了全產(chǎn)業(yè)鏈自研芯片的“卷王”。 此外,中國(guó)算法如今正在被硅谷大廠和開源生態(tài)反過來學(xué)習(xí)和使用。

  • DeepSeek 內(nèi)部沒有硅谷那種拉踩和爭(zhēng)奪論文一作的自私,而是一種極其罕見的集體主義。 所有人聚在一起,唯一的目的就是想辦法用最少的資源、在最受限的環(huán)境里把眼前的硬核問題解決掉。

  • 大廠未來的大模型都要搬到付費(fèi) API 背后,而開源中輕量模型才是開發(fā)者的天下。

  • 隨著中國(guó)開源模型下載量歷史性地超越西方,硅谷巨頭因?yàn)橥顿Y人的盈利壓力,正被迫收縮開源,把萬(wàn)一參數(shù)的模型藏進(jìn) API 里。

  • 企業(yè)和極客們想要的是不被隨時(shí)升級(jí)“暗改”的控制權(quán),這讓高性價(jià)比的開源模型,在全球市場(chǎng)搶下了最大的心智份額。

  • 別輕易相信那些“我開除了 500 個(gè)員工、只靠 12 個(gè) Agent 賺錢”的 OPC 創(chuàng)業(yè)故事。 現(xiàn)在的智能體本質(zhì)上還是 pattern matching(模式匹配),它根本不懂微積分,更沒有人類的邏輯。

  • 用提示詞(prompt)去管智能體是最不靠譜的,你必須在系統(tǒng)層和網(wǎng)絡(luò)層硬核卡死它的權(quán)限。


領(lǐng)取地址:https://boolan.com/enroll/c1049/event/1152?channel=gzh

“在硅谷,我們其實(shí)根本不知道中國(guó) AI 已經(jīng)走到了哪里”

主持人: Matt,歡迎來到 Fiverr 播客。

Matt: 謝謝,感謝邀請(qǐng)。

主持人: 對(duì)還不了解你的人來說,作為 Linux Foundation 的 AI CTO,你的角色具體是什么?能不能帶我們了解一下你的職責(zé)、你的日常工作,以及你現(xiàn)在主要在做什么?

Matt: 可以。我的很多工作都非常偏社區(qū)導(dǎo)向,核心是確保我們擁有一個(gè)健康的開源 AI 生態(tài),確保有很多真正優(yōu)秀的項(xiàng)目能夠成長(zhǎng)起來、被更多人看見。比如我們納入基金會(huì)的一些項(xiàng)目:vLLM、PyTorch、DeepSpeed,還有 Ray 等等。

我的一部分工作也非常聚焦教育。我們現(xiàn)在在做一些培訓(xùn)和認(rèn)證,尤其目前圍繞 PyTorch 展開;同時(shí)也在確保開源 AI 在技術(shù)方向上足夠清晰、足夠強(qiáng)。此前我參與過“模型開放性框架”(Model Openness Framework, MOF)的工作,幾年前我們還為此寫過論文;另外還有 OpenMDW 許可證,這在開放模型領(lǐng)域也非常重要。

此外,我也會(huì)更多地走到社區(qū)中去,和大家交流。我們最近剛成立了 Agentic AI Foundation,所以現(xiàn)在我們也在圍繞 Agentic AI 構(gòu)建一個(gè)非常健康的生態(tài)系統(tǒng)。

我的工作,就是做社區(qū)的一個(gè)好 steward(守護(hù)者/管理者),幫助這個(gè)充滿活力的開源 AI 生態(tài)繼續(xù)成長(zhǎng)。這個(gè)生態(tài)包含很多不同的層面:從開放數(shù)據(jù)集、開放模型,到整條技術(shù)棧上的各種開源軟件,都在其中。

在 Linux Foundation,這些內(nèi)容由很多不同的基金會(huì)共同承載。許多工作負(fù)載依賴 Kubernetes、Linux 以及其他基礎(chǔ)設(shè)施,而這些也分別由其他基金會(huì)來推動(dòng)。我的職責(zé)之一,就是確保我們能夠讓更多人平等地獲得工具、平等地獲得教育資源,并持續(xù)推動(dòng)整個(gè)開源 AI 生態(tài)向前運(yùn)轉(zhuǎn)。

主持人: 所以在加入 Linux 之前,你也曾經(jīng)負(fù)責(zé)過 PyTorch 的技術(shù)方向;再往前,你在企業(yè)技術(shù)領(lǐng)域幾乎干了 25 年,對(duì)吧?是在 IBM 嗎?

Matt: 對(duì)。還有電信行業(yè)。

主持人: 那這些經(jīng)歷現(xiàn)在如何幫助你看待這一輪 AI 熱潮?

Matt: 幫助非常大。我職業(yè)生涯的大部分時(shí)間都在產(chǎn)業(yè)界度過。中間有一小段時(shí)間,我在 CableLabs 做研究,之后又回到產(chǎn)業(yè)界,再后來又到一家非營(yíng)利機(jī)構(gòu)工作。

我覺得這讓我能夠同時(shí)理解兩邊的視角:一邊是企業(yè)和行業(yè)在 AI 上的需求、采用方式以及落地應(yīng)用;另一邊是開源基金會(huì)如何培育生態(tài)、擴(kuò)大工具可及性、推動(dòng)開源 AI 文化繁榮。所以某種程度上,這讓我也能夠同時(shí)擁有這兩種觀察視角。

另外一點(diǎn),從我的角度看也很重要:要理解 AI 研究人員要經(jīng)歷什么、開發(fā)者要經(jīng)歷什么,這樣我們才能真正幫助他們解決問題。

我們等會(huì)兒還會(huì)回到你在 Linux 的工作,不過我很好奇:你剛剛結(jié)束了一趟很長(zhǎng)的中國(guó)大陸之行,幾乎拜訪了所有主要的 AI 實(shí)驗(yàn)室——DeepSeek、Moonshot、智譜,對(duì)吧,還有 Qwen,以及其他團(tuán)隊(duì)。

Matt: 對(duì)。

主持人: 拋開那些大家都知道的事不談,這一趟最讓你驚訝的是什么?

Matt: 我覺得,從這個(gè)角度來說……過去幾年我來過中國(guó)幾次,而這次最讓人驚訝的一點(diǎn),站在一個(gè)美國(guó)人的角度看,就是:我們其實(shí)并不了解中國(guó)正在發(fā)生什么。我們看到很多優(yōu)秀的工作以開放科學(xué)、開源的形式被發(fā)表、被發(fā)布出來,但總體上,我們并不知道他們?cè)谘芯可弦呀?jīng)推進(jìn)到了哪里。

這次非常開眼界的一點(diǎn)是:當(dāng)我來到中國(guó)、開始和這些實(shí)驗(yàn)室接觸時(shí),我發(fā)現(xiàn)他們對(duì)自己正在做的工作是非常開放的。他們?cè)敢夥窒碜约赫谕七M(jìn)的各種創(chuàng)新。當(dāng)然,不是說會(huì)把產(chǎn)品路線圖全告訴你,畢竟大家都有各自的商業(yè)定位;但就他們正在做的研究本身而言,是非常開放的

這趟旅程中最讓人意想不到的一點(diǎn),是看到他們對(duì)自己所做工作的熱情,以及他們對(duì)發(fā)表成果、把模型推向市場(chǎng)、看它在基準(zhǔn)測(cè)試中尤其是和很多封閉 API 模型相比表現(xiàn)如何,所懷抱的那種興奮感。

這對(duì)我來說非常、非常有意思:他們并沒有藏著掖著,而是非常坦率地展示自己正在做的事情。

主持人: 從這些拜訪和觀察來看,這和美國(guó)同行相比有什么不同?

Matt: 在美國(guó),人們私下里會(huì)稍微聊一點(diǎn)他們正在做什么,但一般不會(huì)直接邀請(qǐng)你進(jìn)實(shí)驗(yàn)室,然后進(jìn)行這么大范圍、這么深入的分享。

在美國(guó),實(shí)驗(yàn)室之間的人才流動(dòng)很多,研究人員在不同實(shí)驗(yàn)室之間來回跳動(dòng),因此很多事情也談不上有什么特別大的秘密,尤其是在灣區(qū),流動(dòng)性很強(qiáng)。但在中國(guó),實(shí)驗(yàn)室在地理上分散得更多,對(duì)吧?有的在北京,有的在上海,有的在深圳,也有的在杭州。所以,這里沒有像美國(guó)灣區(qū)那樣高頻的人才流動(dòng)。

我覺得文化上也有些不同。我還想說,中國(guó)實(shí)驗(yàn)室的文化黏性也比較強(qiáng)。比如你在 Moonshot 這樣的公司工作——它的辦公室就是很搖滾、很年輕化的那種風(fēng)格。

主持人: 你是說 Kimi 嗎?

Matt: 對(duì),就是它。那確實(shí)是一種不一樣的文化。

但還有一點(diǎn)是很多人沒有意識(shí)到的:這些研究人員里,很多人——尤其是創(chuàng)始人——其實(shí)受的是西方教育。比如 UC Berkeley、CMU、Stanford。他們?cè)诿绹?guó)完成教育,然后回到中國(guó)。

而現(xiàn)在越來越明顯的一個(gè)趨勢(shì)是:很多創(chuàng)業(yè)者、很多研究人員,正在回到中國(guó)工作,而不是像過去那樣留在美國(guó)。歷史上,大家更希望留在美國(guó)發(fā)展;但我覺得中國(guó)在鼓勵(lì)創(chuàng)新和創(chuàng)業(yè)文化這件事上做得很好。

當(dāng)然,這里也有自己的“灣區(qū)”,對(duì)吧?這個(gè)領(lǐng)域里也聚集了非常多的人。

主持人: 實(shí)際上,很少有人意識(shí)到這一點(diǎn)。但如果你看世界地圖,會(huì)發(fā)現(xiàn)全球有兩個(gè)巨大的 AI 中心:一個(gè)是美國(guó)灣區(qū),另一個(gè)其實(shí)離我們這里只差幾分鐘車程——就在深圳。

Matt: 對(duì)。當(dāng)然還有杭州,和北京。

“硅谷迷戀個(gè)人光環(huán)和百萬(wàn)年薪,但 DeepSeek 團(tuán)隊(duì)身上有一種共同體的謙遜”

主持人: 在你和這么多中國(guó)研究人員交流之后,你怎么看待這樣一個(gè)現(xiàn)象:在西方,人們把它叫作“ChatGPT 時(shí)刻”;而在中國(guó),很多人說是“DeepSeek 時(shí)刻”,甚至“斯普特尼克時(shí)刻”。你怎么看 DeepSeek?它在中國(guó)仍然處于絕對(duì)主導(dǎo)位置嗎?還是說,現(xiàn)在已經(jīng)變得更均衡了?

Matt: 我覺得 DeepSeek 仍然被視作“尖兵”——是最前沿的創(chuàng)新者,是那種“用更少資源做更多事”的代表。他們推出了很多優(yōu)秀的創(chuàng)新,而且這些創(chuàng)新已經(jīng)被許多其他實(shí)驗(yàn)室采用了,包括美國(guó)的一些實(shí)驗(yàn)室。所以我依然認(rèn)為,大家是帶著這樣的視角來看 DeepSeek 的。

中國(guó)的實(shí)驗(yàn)室對(duì) DeepSeek 已經(jīng)做出的事情、以及他們正在做的事情,都懷有很深的敬意。作為一個(gè)有開源背景的人,看著他們把這些成果帶到世界面前,我是非常能欣賞這一點(diǎn)的。

他們的研究論文寫得非常細(xì)致,你可以據(jù)此復(fù)現(xiàn)實(shí)驗(yàn)結(jié)果。這對(duì)于整個(gè) AI 領(lǐng)域的進(jìn)步來說極其重要。我們希望研究公開得足夠充分,這樣別人才能真正去復(fù)現(xiàn)。

但我們也看到一個(gè)趨勢(shì),而我對(duì)此并不是特別樂觀:研究論文越來越短,逐漸變成了 technical report(技術(shù)報(bào)告)。這些技術(shù)報(bào)告里往往沒有足夠多的信息披露,無(wú)法支持別人去真正復(fù)現(xiàn)研究。而這并不能推動(dòng) AI 進(jìn)步;無(wú)論你對(duì)“我們將如何邁向 AGI”持什么立場(chǎng),如果大家的研究都關(guān)起來了,那肯定無(wú)法真正推動(dòng)整個(gè)領(lǐng)域向前。

主持人: 就在你在中國(guó)期間,我記得 MIT 和 Hugging Face 發(fā)布了一份新報(bào)告,說中國(guó)開源模型在中國(guó)本土的下載份額,第一次超過了西方模型,對(duì)吧?這說明了什么?我們能不能說,全球開發(fā)者在心智份額上,已經(jīng)開始更偏向中國(guó)開源模型,甚至這種趨勢(shì)正在西方世界蔓延?

Matt: 我覺得我們現(xiàn)在看到的很多中國(guó)模型,一個(gè)很重要的特點(diǎn)是:它們的小模型和中等規(guī)模模型表現(xiàn)更好,而這正在帶動(dòng)下載量增長(zhǎng)。這些模型的性能真的很強(qiáng)。

Llama 系列目前并沒有新的后續(xù)模型推出。所以 Qwen(千問)現(xiàn)在其實(shí)已經(jīng)成了部署最廣的模型,甚至包括美國(guó)企業(yè)里也是這樣。我覺得我們現(xiàn)在看到的是:大量愛好者、研究者和開發(fā)者,都想把這些模型下載下來,在本地通過 Ollama 之類的工具運(yùn)行。

與此同時(shí),企業(yè)也希望通過成本優(yōu)化獲益,所以相較于調(diào)用 API、按 token 支付更高價(jià)格,使用這些更小或中等規(guī)模的模型顯得更有吸引力。

主持人: 對(duì),我記得 DeepSeek V4 最新的數(shù)據(jù),好像在能力相近的情況下,比某些商業(yè) API 模型便宜了 50 倍,這幾乎引發(fā)了整個(gè)中國(guó)大陸的價(jià)格戰(zhàn)。不過很有意思的是,你也見了 MiniMax 的創(chuàng)始人,而他們第一次發(fā)布了一個(gè)閉源模型。他們有沒有解釋背后的邏輯?

Matt: 他們沒有展開細(xì)講,但我覺得這會(huì)成為中國(guó)接下來的一個(gè)趨勢(shì)。過去人們的看法是:只要模型超過一萬(wàn)億參數(shù),訓(xùn)練成本就高得驚人,你就不得不把它放到 API 背后,因?yàn)樗y部署,同時(shí)也需要商業(yè)化回報(bào)。

美國(guó)那邊經(jīng)歷的是:有一些開源模型,有一些 API,現(xiàn)在整體越來越偏向 API。我確實(shí)覺得,中國(guó)接下來也會(huì)走向類似的模式。我認(rèn)為這些實(shí)驗(yàn)室中,有的今年已經(jīng) IPO 了,有的正在籌備 IPO,他們也面臨著必須證明商業(yè)價(jià)值的壓力。

主持人: 對(duì),他們必須得證明。

Matt: 訓(xùn)練這些模型是要花錢的,對(duì)吧?他們有投資人,也必須實(shí)現(xiàn)某種回報(bào)。所以我覺得他們會(huì)轉(zhuǎn)向 API。很可能到最后,所有人都會(huì)在某個(gè)階段推出商業(yè) API,用來補(bǔ)貼研究和訓(xùn)練的成本。

主持人: 以我個(gè)人和 MiniMax 創(chuàng)始人接觸的經(jīng)歷來看,我們當(dāng)時(shí)在為活動(dòng)開發(fā)一個(gè)內(nèi)部 AI 方案,是個(gè)語(yǔ)音智能體,但一直找不到適合香港受眾的粵語(yǔ)模型。剛好我認(rèn)識(shí)他,就發(fā)消息問能不能有人幫忙對(duì)接 MiniMax。立刻建了個(gè)群,把工程師拉進(jìn)來,很快就幫我們解決了。

這和另一家美國(guó)公司的體驗(yàn)形成了鮮明對(duì)比。我們當(dāng)時(shí)在語(yǔ)音 AI 技術(shù)棧里用了美國(guó)一家公司,結(jié)果活動(dòng)進(jìn)行到一半,他們突然改了 API。我們花了很久才搞清楚問題出在哪兒,而且事先沒有任何通知。我后來還在 LinkedIn 上給那位創(chuàng)始人發(fā)了消息,結(jié)果沒有任何回復(fù),什么都沒有。

我之所以提這個(gè),是因?yàn)槲腋杏X——至少在我的認(rèn)知里——美國(guó)那邊對(duì)所有語(yǔ)音 AI 相關(guān)業(yè)務(wù)的需求實(shí)在太旺盛了;而另一方面,中國(guó)團(tuán)隊(duì)這種“客戶優(yōu)先”、愿意盡最大努力、以最低成本主動(dòng)幫你解決問題的方式,會(huì)讓我覺得,也許只是我舉的這個(gè)例子有偏差,但那確實(shí)是一次讓我開始重新思考的經(jīng)歷。

Matt: 對(duì)。我覺得有些人和組織會(huì)希望自己對(duì)模型及其生命周期擁有更多控制權(quán)。他們可能不希望模型在后臺(tái)被悄悄升級(jí)。畢竟如果你用的是 API,對(duì)方就可以升級(jí)模型,一個(gè)小版本更新可能就會(huì)把某些東西搞壞,或者改動(dòng) API。

但如果你對(duì)系統(tǒng)有更多控制權(quán),運(yùn)行的是自己的開放模型,那你就可以自己決定規(guī)則、自己制定升級(jí)路徑。我覺得這對(duì)很多人來說是很有吸引力的。

“Meta 很久不發(fā)新 Llama 了,連不少美國(guó)企業(yè)都在偷偷下載通義千問”

主持人: 我感覺整體上,中國(guó)團(tuán)隊(duì)面對(duì)客戶時(shí)那種態(tài)度,以及某種積極進(jìn)取、甚至可以說“帶著善意的攻擊性”——“為了客戶我們什么都能做,我們一定能搞定”——本身就在幫助他們搶市場(chǎng)。因?yàn)樗麄儾幌衩绹?guó)公司那樣,被過度需求“慣壞”了。

不過回到你的中國(guó)之行。你在博客里還提到,你曾和一些 DeepSeek 的資深員工一起吃午飯,其中有一位很早就加入了公司,甚至可以追溯到他們還在做量化的時(shí)期。通過和他們的交流,你覺得他們?cè)趦?nèi)部是怎么理解和推進(jìn)工作的?有沒有什么不同之處,或者值得我們學(xué)習(xí)的地方?有沒有什么你可以分享的觀察?

Matt: 可以。我覺得最打動(dòng)我的,是 DeepSeek 團(tuán)隊(duì)身上的謙遜。他們非常謙遜。我不覺得他們像某些組織里那樣,把重點(diǎn)放在“個(gè)人要證明自己有多強(qiáng)”“我要做論文一作”這類事情上。

我從 DeepSeek 得到的印象是:他們很有共同體精神。更像是“我們所有人在一起,努力解決真正的問題”。所以從我的體驗(yàn)來看,那間辦公室里的謙遜氛圍,以及人們真心想解決問題、而不是過多在意個(gè)人發(fā)展、六位數(shù)七位數(shù)薪資之類事情的狀態(tài),都讓我印象很深。

他們更像是在一個(gè)資源受限的環(huán)境里,和同事一起把事情做好、一起解決問題。

主持人: 你的這趟行程還剛好碰上另一件很有意思的事:華盛頓那邊,白宮發(fā)布了一份關(guān)于針對(duì)美國(guó) AI 模型的蒸餾攻擊的備忘錄,對(duì)吧?你在和中國(guó)同行交流時(shí),有沒有感受到什么反應(yīng)?

Matt: 有。我在整個(gè) AI 生態(tài)里看到的一個(gè)普遍現(xiàn)象是:蒸餾其實(shí)是很多實(shí)驗(yàn)室都會(huì)做的事情,對(duì)吧?有一種視角是:大家都在朝著同一個(gè)目標(biāo)前進(jìn),朝著某種 AGI 終點(diǎn)前進(jìn),而每個(gè)人都想利用當(dāng)下最好的東西。

現(xiàn)實(shí)情況是,很多機(jī)構(gòu)的數(shù)據(jù)都受限。他們沒有足夠高質(zhì)量的數(shù)據(jù)來繼續(xù)推進(jìn)和改進(jìn)模型。所以我確實(shí)看到,蒸餾被非常頻繁地使用,而且是被各種不同的組織在使用——無(wú)論中國(guó)還是美國(guó)。它并不是中國(guó)獨(dú)有的現(xiàn)象。

主持人: 我記得你在 Substack 文章里說過,西方有一種敘事是:中國(guó)只是在復(fù)制粘貼西方做過的一切;還有一種敘事是,出口管制減緩了中國(guó)科技和中國(guó) AI 的發(fā)展。你認(rèn)為這兩種說法都不對(duì)。你能具體說說為什么嗎?

Matt: 當(dāng)然。中國(guó)的實(shí)驗(yàn)室是在創(chuàng)新的,對(duì)吧?他們創(chuàng)造了很多非常優(yōu)秀的創(chuàng)新,而這些創(chuàng)新也被用于學(xué)習(xí)、用于實(shí)踐,甚至被應(yīng)用到了美國(guó)的開放模型和 API 產(chǎn)品中。這些創(chuàng)新是跨國(guó)界流動(dòng)的。這本來就是 AI 研究共同推進(jìn)、彼此分享的一部分。我認(rèn)為這對(duì)整個(gè)領(lǐng)域都極其有益。

美國(guó)應(yīng)該這樣做,歐洲、加拿大、中國(guó)也都應(yīng)該這樣做——大家都應(yīng)該產(chǎn)出優(yōu)秀的開放科學(xué)成果。至于出口管制,恐怕并沒有達(dá)到預(yù)期效果。當(dāng)你因?yàn)槟貌坏阶銐蛸Y源而被迫創(chuàng)新時(shí),你就一定會(huì)創(chuàng)新。我覺得中國(guó)發(fā)生的事情就是:這些實(shí)驗(yàn)室意識(shí)到,好的,我們必須創(chuàng)新,我們必須把手頭的資源榨出更多價(jià)值。

而這件事確實(shí)發(fā)生了。我覺得這很好,因?yàn)檫@些相同的原則、相同的發(fā)現(xiàn),也可以被我們應(yīng)用到世界各地的 AI 研究中。

硬件受限這件事,同樣也在倒逼中國(guó)、倒逼北京投資自己的芯片能力。于是我們看到這一領(lǐng)域出現(xiàn)了更多發(fā)展,芯片制造領(lǐng)域也涌現(xiàn)出大量新創(chuàng)企業(yè)。中國(guó)在稀土資源方面有獨(dú)特優(yōu)勢(shì),也有能力構(gòu)建從原材料到生產(chǎn)、制造再到部署的完整垂直鏈條。

主持人: 順著這個(gè)問題繼續(xù)。你還點(diǎn)名提到了四項(xiàng)具體的中國(guó)貢獻(xiàn),說西方實(shí)驗(yàn)室現(xiàn)在也在建立在這些成果之上:DeepSeek 的 GRPO、Moonshot 在 Muon optimizer 上的工作、字節(jié)跳動(dòng)的 Verl,以及 MiniMax 在 scaling、lighting 和 attention 等技術(shù)方面的貢獻(xiàn)。我想知道,如果完全沒有出口管制,這四項(xiàng)里哪一項(xiàng)可能根本不會(huì)發(fā)生?

Matt: 我?guī)缀跤X得,很難明確地說哪些創(chuàng)新一定是由出口管制直接催生的。我很喜歡拿 Muon optimizer 舉例,因?yàn)樗畛醯墓ぷ髌鋵?shí)并不是起源于中國(guó),而是起源于美國(guó)。最早有一篇論文發(fā)表了相關(guān)工作,后來又被后續(xù)實(shí)驗(yàn)室不斷接力推進(jìn)。

正是這種迭代式工作,才讓我們能取得今天這樣的進(jìn)展,對(duì)吧?我非常希望看到更多人擁抱這種開放科學(xué):你創(chuàng)造一個(gè)東西,別人把它改進(jìn),再有人繼續(xù)在此基礎(chǔ)上優(yōu)化。

我們?cè)?LLM 的演化過程中已經(jīng)看到了這一點(diǎn)。Transformer 架構(gòu)被不斷修改,出現(xiàn)了更多優(yōu)化、不同形式的 attention,以及所有這些幫助我們構(gòu)建更高性能系統(tǒng)的創(chuàng)新。

我覺得這非常重要。而且我們也正在看到同樣的事情發(fā)生在技術(shù)棧更高層。不只是模型和 AI 研究層面,也包括更高層的框架、Agentic framework,以及各種 harness、scaffolding 和其他以開放形式發(fā)布出來的組件。

很明顯,OpenClaw 在中國(guó)非常火,而現(xiàn)在 Hermes Agent 也非常火。我覺得我在這次大會(huì)上幾乎和每個(gè)人聊,他們都在跟我談這個(gè)。開放創(chuàng)新、開源創(chuàng)新,往往最容易吸引關(guān)注,也最能吸引社區(qū)參與,邀請(qǐng)開發(fā)者貢獻(xiàn)。所以我認(rèn)為,研究端的這種并行關(guān)系,在開源軟件開發(fā)一側(cè)也同樣成立。

“手頭只有 200 萬(wàn)美元,千萬(wàn)別想著去開一家 AI 實(shí)驗(yàn)室”

主持人: 對(duì),OpenClaw 在中國(guó)確實(shí)太夸張了,體量非常大。但我感覺它現(xiàn)在也開始有點(diǎn)……像是到頂了,然后開始平臺(tái)化甚至下滑。現(xiàn)在甚至已經(jīng)出現(xiàn)一整套“怎么把它從你電腦上卸載掉”的服務(wù)了,畢竟大家之前都裝過,對(duì)吧?

不過很有意思的是,你對(duì)開源 AI 模型的立場(chǎng)是什么?假如今天觀眾里有一位創(chuàng)始人,正在做 AI,拿了 200 萬(wàn)美元融資,賬上 runway 還能撐 18 個(gè)月,你會(huì)建議他基于什么去構(gòu)建?Claude?還是別的什么,DeepSeek、Qwen?你怎么看?

Matt:如果你只有 200 萬(wàn)美元,我會(huì)強(qiáng)烈建議他不要自己開一家 AI 實(shí)驗(yàn)室,因?yàn)槟强隙ú粔颉?/strong>

主持人: 不是訓(xùn)練模型呢?我是單指做 AI 應(yīng)用。

Matt: 我覺得,在做產(chǎn)品這件事上,現(xiàn)在仍然有非常多創(chuàng)新機(jī)會(huì),也非常適合創(chuàng)業(yè)公司。關(guān)鍵是你必須找到自己的 niche(細(xì)分定位)、自己的垂直領(lǐng)域。你是要做金融相關(guān)的東西?還是要做某個(gè)特定行業(yè)?還是你要提供某種通用型專業(yè)服務(wù)?

我不覺得我能給出一個(gè)放之四海而皆準(zhǔn)的答案……當(dāng)然,大家都很喜歡 Claude Code,它是個(gè)非常優(yōu)秀的工具。至于到底是使用本地基礎(chǔ)設(shè)施或自托管基礎(chǔ)設(shè)施上的開放模型,還是使用像 Fireworks、Together 這樣的推理服務(wù)商,或者干脆直接使用付費(fèi) API,我覺得這取決于你作為一個(gè)組織的具體需求。

如果你是一家創(chuàng)業(yè)公司,通常來說,使用開放模型能讓你用更少資源做更多事情,而且可以形成一種很順滑、低摩擦的方式,把 token 成本壓低,從而把更多資金投入到營(yíng)銷、團(tuán)隊(duì)增長(zhǎng)等方面。

但反過來說,如果你用 API,管理上的額外負(fù)擔(dān)會(huì)低很多。所以我覺得這兩條路線都很好,關(guān)鍵還是看你的創(chuàng)業(yè)公司是什么情況、想實(shí)現(xiàn)什么目標(biāo)。

主持人: OpenAI 剛剛停止了他們的模型微調(diào)服務(wù),所以如果你想做一件特別聚焦、重復(fù)性很強(qiáng)、同時(shí)又非常講成本效率的事,實(shí)際上你現(xiàn)在幾乎只能去微調(diào)開源模型了。

Matt: 對(duì)。我也很希望看到更多經(jīng)過微調(diào)的開放模型被分享出來,并形成一個(gè)很好的生態(tài)。Hugging Face 和 ModelScope 上都有很多這樣的模型,但在一片模型海洋里,搞清楚哪個(gè)最適合自己的應(yīng)用,有時(shí)候也確實(shí)很難。

如果能有一個(gè)值得信賴的微調(diào)模型生態(tài)就很好:你知道模型來源,知道它最初基于什么模型構(gòu)建,也知道它是不是把原本受限許可的模型重新?lián)Q了個(gè)寬松許可再發(fā)布出來……這些信息都非常關(guān)鍵。因?yàn)樵谀銍@某個(gè)微調(diào)模型開展商業(yè)化之前,你必須確認(rèn)它的許可證,和你原先理解的是一致的。

主持人: 我想Meta 的 Llama 就是一個(gè)例子,對(duì)吧?它在應(yīng)用層面的許可其實(shí)是相當(dāng)受限的。從你推動(dòng)的開源框架,尤其是和 AI 模型相關(guān)的那套框架來看,你覺得今天誰(shuí)最接近你們所設(shè)立的“真正開源模型”的標(biāo)準(zhǔn)?是 DeepSeek?Llama?Qwen?Mistral?

Matt: 這個(gè)問題我覺得可以分成兩部分來看。

第一部分是:凡是使用寬松許可證的模型——而且今天它們本質(zhì)上都在使用軟件許可證,所以像 Apache 2.0 或 MIT——這些模型就是最“寬松”的,對(duì)吧?因此,任何 DeepSeek 模型、任何 Mistral 模型,以及來自 AI2 或 MBZUAI 下 LM360 計(jì)劃的那些模型,都屬于你可以“用于任何目的”的模型。無(wú)論是研究,還是拿來做應(yīng)用,還是圍繞它創(chuàng)業(yè),都是可以的。

而所謂 community license(社區(qū)許可證)則是附帶限制的。它可能會(huì)有使用量觸發(fā)門檻,等等。所以你需要有辨別力。凡是這種社區(qū)許可證,里面防線都會(huì)有某種條件:一旦觸發(fā),你就得重新談授權(quán),或者只能非商業(yè)使用,或者只能研究用途等等。所以讀許可證非常重要。把許可證丟給你喜歡的 agent,或者直接扔給 ChatGPT,讓它幫你提煉重點(diǎn),也很有幫助。

這是第一部分。第二部分是:開源軟件許可證本來是為軟件設(shè)計(jì)的。幾年前,我們?cè)?Linux Foundation 啟動(dòng)了一項(xiàng)工作,想專門為模型設(shè)計(jì)一套許可證。大概三四年前,或許已經(jīng)四年了,我們開始推進(jìn)“模型開放性框架”,想定義:什么算是開放模型?什么又比它更進(jìn)一步,可以稱為開放科學(xué)?

所謂開放科學(xué),意思是你發(fā)布的不只是模型及其權(quán)重,還要發(fā)布所有數(shù)據(jù)集、所有訓(xùn)練代碼、所有 recipe(訓(xùn)練配方)、各種 benchmark(基準(zhǔn)測(cè)試),以及其他所有幫助你得到最終產(chǎn)品的附屬材料。

我們已經(jīng)看到一些不錯(cuò)的實(shí)踐。AI2 在這類開放科學(xué)路徑上做得很好,他們讓社區(qū)能夠復(fù)現(xiàn)自己的工作。我們所追求的就是這種開放科學(xué),這對(duì)教育、可復(fù)現(xiàn)性、透明度和研究目的都非常有價(jià)值。

但如果只是從“足夠讓你開展業(yè)務(wù)”或者“滿足較低程度研究需求”的最低可行要求來說,通常只要有模型和權(quán)重就夠了,對(duì)吧?我們把這定義為 open model(開放模型)。

當(dāng)時(shí)——其實(shí)現(xiàn)在也還在廣泛使用——大家有個(gè)詞叫 open weights。雖然這個(gè)詞聽起來好像“開放”,但實(shí)際上它通常被用來指那些帶有限制許可證的模型,也就是有附加條件的模型。而我們所說的 open model,是指使用寬松許可證的模型,也就是你對(duì)它的使用沒有限制。

在實(shí)踐中,開放科學(xué)當(dāng)然很棒,但只要牽涉到商業(yè)利益,大家往往還是會(huì)退回到 open model 的層次。畢竟,不是每個(gè)人都能復(fù)現(xiàn)一個(gè)一萬(wàn)億參數(shù)模型,也不是每個(gè)人都有那個(gè)資源。所以我覺得,至少我們要確保這些使用寬松許可證的開放模型存在,而且整個(gè)社區(qū)都能訪問。這樣大家才能學(xué)會(huì)如何與這項(xiàng)技術(shù)打交道,才能在這項(xiàng)技術(shù)之上繼續(xù)構(gòu)建。我覺得這極其重要。

主持人: 在 Linux Foundation 當(dāng)前的項(xiàng)目里,哪些最受社區(qū)和貢獻(xiàn)者關(guān)注?你覺得現(xiàn)在最熱的是哪些?

Matt: 肯定有很多關(guān)注集中在 Agentic AI Foundation、MCP 上。很多人都在構(gòu)建 MCP server,也在自己的組織里集成 MCP。

Linux Foundation 有一個(gè)很獨(dú)特的優(yōu)勢(shì),就是我們擁有這些分布在不同技術(shù)棧層級(jí)的基金會(huì)。在應(yīng)用層這一側(cè),我們有 Agentic AI Foundation 和它推動(dòng)的一系列項(xiàng)目。對(duì)我們來說,這還是非常早期的階段,對(duì)吧?這個(gè)基金會(huì)成立也就五六個(gè)月左右。現(xiàn)在參與其中的成員已經(jīng)快到 200 個(gè)了。所以大家對(duì) Agentic AI 的熱情非常高。

當(dāng)然,也有一些更成熟的項(xiàng)目,比如 Kubernetes。它對(duì)所有 AI 工作負(fù)載以及云工作負(fù)載都絕對(duì)至關(guān)重要。顯然,Linux kernel 也非常重要,而且部署極其廣泛。再往上我們還有 PyTorch Foundation,它旗下有很多處于 AI 基礎(chǔ)設(shè)施層的項(xiàng)目,比如如何構(gòu)建模型、如何訓(xùn)練和微調(diào)模型,以及如何在生產(chǎn)環(huán)境部署模型并提供推理服務(wù)。可以說,這些基金會(huì)都在這條技術(shù)棧中扮演著各自的角色。

主持人: 當(dāng)我告訴我的工程團(tuán)隊(duì),我今天要見 Linux 的 AI CTO時(shí),他們第一個(gè)問題就是:AI 會(huì)不會(huì)被引入到 Linux 內(nèi)核層面?你們有沒有這方面的設(shè)想,或者某種計(jì)劃?你覺得 AI 在這里能扮演什么角色?

Matt: 從根本上說,我沒法代表 Linux kernel 開發(fā)那一側(cè)發(fā)言,因?yàn)槲也⒉粎⑴c Linux 內(nèi)核本身的開發(fā)。但我會(huì)說,AI 作為一種工具,已經(jīng)在很多地方被廣泛使用了,對(duì)吧?比如幫助優(yōu)化代碼。

對(duì)我們合作的一些項(xiàng)目來說,現(xiàn)在很多人都在問:如果他們想使用 Claude Code 或其他 agent,要怎么貢獻(xiàn)代碼?很多項(xiàng)目現(xiàn)在都已經(jīng)制定了關(guān)于 agent 是否可以參與貢獻(xiàn)的政策。

我們看到不少項(xiàng)目開始有點(diǎn)PR 的數(shù)量壓垮了。因?yàn)楝F(xiàn)在很多幾乎沒有編程基礎(chǔ)或項(xiàng)目知識(shí)的人,也能提 PR,這多少會(huì)讓維護(hù)者有點(diǎn)應(yīng)接不暇。與此同時(shí),我們也看到 AI 被用來緩解這個(gè)問題,對(duì)吧?比如審查 PR、做歸并整理。

我覺得我們現(xiàn)在正處于一個(gè)比較“混亂探索”的階段,等大家把這些問題慢慢摸清楚以后,可能會(huì)進(jìn)入一個(gè)更規(guī)范的階段。但可以確定的是,coding agents 現(xiàn)在真的非常普及,尤其是在開源領(lǐng)域。看不同項(xiàng)目的核心維護(hù)者是如何處理這件事、如何面對(duì)不斷涌入的 PR,其實(shí)還挺有意思的。

主持人: 從未來趨勢(shì)來看,如果 AI 最終會(huì)成為主要交互界面,甚至是對(duì)話式 AI,那么我們現(xiàn)在習(xí)慣的操作系統(tǒng)界面——按鈕、設(shè)置、命令行這些東西——還真的有必要存在嗎?如果 AI 已經(jīng)被嵌進(jìn)系統(tǒng)底層,你只需要直接和它說話不就好了?

Matt: 雖然我們現(xiàn)在已經(jīng)具備了 voice-to-voice 這類語(yǔ)音模型能力,但總體上你并沒有看到人們像使用手機(jī)鍵盤那樣頻繁地使用語(yǔ)音,對(duì)吧?QWERTY 鍵盤依然是主流。所以我覺得 UI 仍然有存在空間。

主持人: 可能大家都被 Siri 創(chuàng)傷過。

Matt: 對(duì),也許吧。但確實(shí)還是有很多人根本不喜歡語(yǔ)音界面。而且如果你身處公共場(chǎng)所,你真的想……

主持人: 也不一定非得是語(yǔ)音,也可以是對(duì)話式。核心問題是:現(xiàn)在出現(xiàn)了一層新的交互層,正在重新定義我們看待軟件的方式。

Matt: 對(duì)。我覺得人們與系統(tǒng)交互的方式,確實(shí)正在隨著 AI 出現(xiàn)轉(zhuǎn)變。但這也和使用者是誰(shuí)有關(guān),對(duì)吧?消費(fèi)者、工程師、研究者、開發(fā)者,他們不一樣。

顯然,更技術(shù)向的人會(huì)希望獲得更深層的訪問能力。我們已經(jīng)看到越來越多 agent 通過 CLI 運(yùn)行,或者直接集成 API。隨著模型變得更有 agent 能力、更強(qiáng)大,我覺得我們未來可能會(huì)看到一套面向 agent 的接口,以及另一套面向人的接口。但至少目前,我們還是在同時(shí)訓(xùn)練模型去理解程序接口和人類界面。

“AI 永遠(yuǎn)只是個(gè)工具,出了事它連坐牢和承擔(dān)法律責(zé)任的資格都沒有”

主持人: 你剛才提到了 agentic AI、MCP,以及如今對(duì) API 的訪問方式……你也談到過安全問題,尤其是關(guān)注點(diǎn)正從 LLM 本身的安全,轉(zhuǎn)向 agent 的安全。你能不能多講講你是怎么思考這個(gè)問題的?

Matt: 安全顯然對(duì)所有人都重要。對(duì)下游用戶重要,對(duì)消費(fèi)者重要,對(duì)構(gòu)建系統(tǒng)的人也同樣重要。

其中一個(gè)非常關(guān)鍵的點(diǎn)是:模型安全只是一部分。但當(dāng)我們?cè)谀P椭蠘?gòu)建系統(tǒng)——無(wú)論是 agentic system,還是未來其他形式的系統(tǒng)——就必須把安全性納入其中。我一直鼓勵(lì)“安全優(yōu)先”的工程方式,以及“by design”的安全設(shè)計(jì),因?yàn)槟惚仨毺崆八伎既藗儠?huì)如何使用你構(gòu)建的技術(shù),所以我們希望這些技術(shù)從一開始就是以負(fù)責(zé)任的方式被設(shè)計(jì)出來的。

與此同時(shí),這也給創(chuàng)業(yè)者帶來了很好的機(jī)會(huì):去創(chuàng)建那些圍繞安全與安保而構(gòu)建的公司,去提供 guardrails(護(hù)欄)和 harness(控制框架),從而約束系統(tǒng)的安全行為。

在 agentic system 中,你從模型那里繼承了很多東西,很大一部分都繼承自模型;但你同時(shí)也在構(gòu)建程序化腳手架。agent 本身是被代碼化的,對(duì)吧?所以在這一層面上施加安全約束,同樣也非常重要。

主持人: 如果你面對(duì)的是 agent swarm 或多智能體系統(tǒng),安全性該怎么落實(shí)?畢竟和單一模型相比,你對(duì)它的控制其實(shí)沒那么強(qiáng)。

Matt: 對(duì)于多智能體系統(tǒng)來說,安全必須內(nèi)建在 framework(框架)里,對(duì)吧?框架和 harness 的作用,就是把它約束住、裝進(jìn)邊界里。

多智能體系統(tǒng)在架構(gòu)上有很多不同形態(tài),比如生成子 agent、做多 agent 協(xié)調(diào)等等。對(duì)這類系統(tǒng)來說,安全必須體現(xiàn)在協(xié)議層,也就是說要在 protocol layer 上強(qiáng)制執(zhí)行安全和安保要求,同時(shí)也要落實(shí)在真正運(yùn)行 agent 的框架內(nèi)部。安全必須在每一層都被考慮進(jìn)去。

這和我們?cè)?Web 世界里做的事情是一樣,對(duì)吧?比如操作系統(tǒng)里有一層約束,程序本身里有一層約束,網(wǎng)絡(luò)層和接口層也有約束。

很多時(shí)候,當(dāng)你全力追求創(chuàng)新、不斷試驗(yàn)、站在技術(shù)尖端的時(shí)候,安全和安保往往會(huì)變成最后才想起的事情。但這些問題必須被正視。所以,我們不僅要從網(wǎng)絡(luò)安全、應(yīng)用自身的安全和隱私問題出發(fā)去思考,也要考慮下游影響,比如對(duì)社會(huì)的影響、對(duì)環(huán)境的影響等等。

主持人: 我還想問你一個(gè)關(guān)于 LLM 的問題。大概一年前,你寫過:所謂 reasoning,并不是人類意義上的推理,而是一種“偽推理”;模型其實(shí)并不會(huì)真正推理。現(xiàn)在一年過去了,我們看到這類“推理能力”已經(jīng)顯著增強(qiáng)。你的看法變了嗎?

Matt: 對(duì)我來說,沒變。因?yàn)檫@仍然不是人類意義上的推理,對(duì)吧?當(dāng)我們說 next-token prediction(下一個(gè) token 預(yù)測(cè))時(shí),我們是在通過文本、通過人類給出的示例,去模仿人的推理方式。

但我們?nèi)祟惼綍r(shí)并不是以 token 或書面形式來推理的,對(duì)吧?我們是通過大腦來推理。所以我覺得很重要的一點(diǎn)是,要意識(shí)到:LLM 所展現(xiàn)出來的“推理”,并不等同于人類層面的推理能力。但這并不意味著 LLM 的這種推理沒用,對(duì)吧?它不需要和人腦推理完全同構(gòu),問題在于:它對(duì)應(yīng)用有用嗎?當(dāng)然有。

它總是對(duì)的嗎?不是。那人類總是對(duì)的嗎?也不是。我覺得我們需要從這樣一個(gè)視角來看:把 LLM 或聊天機(jī)器人“人格化”,或者在潛意識(shí)里相信我們正在與一個(gè)活著的人對(duì)話,是有些危險(xiǎn)的。

主持人: 為什么?

Matt: 很多時(shí)候人們會(huì)深陷其中,甚至產(chǎn)生一種被它理解的幻覺,進(jìn)而被引導(dǎo)做出一些極端的行為。我們需要時(shí)刻提醒自己,和我們對(duì)話的,只是一個(gè)被精心調(diào)校過的統(tǒng)計(jì)學(xué)系統(tǒng)。它在進(jìn)行數(shù)據(jù)模式的匹配。有時(shí),它只是在原封不動(dòng)地把我們自己的執(zhí)念和聲音反射(echo)回來。

主持人: 我想說的是,我非常喜歡你把 LLM 的推理比喻成“鸚鵡”的說法——它可以復(fù)述人的短語(yǔ),甚至整句話,但并不真正理解自己在說什么。

Matt: 對(duì)。不過我要說明一下,“stochastic parrot(隨機(jī)鸚鵡)”這個(gè)類比并不是我最先提出來的。但確實(shí),當(dāng)我們訓(xùn)練 LLM 時(shí),本質(zhì)上就是在做模式匹配,對(duì)吧?而且通過微調(diào)和強(qiáng)化學(xué)習(xí),我們其實(shí)是在有意地確保 LLM 能夠遵循意圖。

你給它塞進(jìn)去一堆上下文,同時(shí)也表達(dá)你的意圖,理想情況下,它會(huì)返回你所期待的那類結(jié)果。我覺得過去幾年里,我們?cè)跀?shù)據(jù)配比和模型訓(xùn)練方法上確實(shí)做得更好了,這也帶來了明顯更好的結(jié)果。

主持人: 大語(yǔ)言模型的局限性很明顯。你怎么看 Yann LeCun 現(xiàn)在在推進(jìn)的那個(gè)所謂“世界模型”?

Matt: Yann LeCun 有他的 JEPA 架構(gòu),那是一種不同的理解方式,關(guān)于如何……不一定是順序式訓(xùn)練,而是……

我覺得這很好。對(duì)我來說,我對(duì) world model(世界模型)的興趣更多和機(jī)器人、具身智能有關(guān)。如果你認(rèn)同這樣一種觀點(diǎn):要實(shí)現(xiàn) AGI、超級(jí)智能,或者無(wú)論你最終追求什么,就必須具備和人類似的全部要素——多感官輸入、對(duì)物理規(guī)律的理解等等——那么世界模型就說得通,對(duì)吧?

當(dāng)然,對(duì)“世界模型”到底是什么,也有不同看法。有人說它是視頻、圖像和文本;也有人說,不,你還得能夠在里面構(gòu)建三維空間。

主持人: 還得能接收實(shí)時(shí)指令。

Matt: 對(duì)。所以世界模型會(huì)有不同的路徑。假如你是做機(jī)器人的,你關(guān)心的是 action(動(dòng)作)。你關(guān)心的是:不僅要感知世界,還要預(yù)測(cè)結(jié)果,對(duì)吧?比如“我的機(jī)器人下一步要怎么抓這個(gè)物體?” 這意味著你觸發(fā)的是行動(dòng),你關(guān)心實(shí)時(shí)感官輸入,也關(guān)心執(zhí)行器的驅(qū)動(dòng)能力等等。

所以它取決于你的出發(fā)點(diǎn)。“世界模型”在不同語(yǔ)境里意味著不同東西。甚至游戲玩法、游戲生成,或者“選擇你自己的冒險(xiǎn)”那種互動(dòng)電影,也都可能從世界模型中衍生出來。我非常好奇接下來會(huì)怎么發(fā)展。擴(kuò)散模型和 Transformer 目前還是主流架構(gòu),除非你走的是 JEPA 這條路線。

主持人: 你提到了機(jī)器人。你這次也見了宇樹的創(chuàng)始人,以及中國(guó)其他一些機(jī)器人公司。你還暗示過,這個(gè)行業(yè)正在局部進(jìn)入泡沫期,只是你當(dāng)時(shí)沒有細(xì)說是哪種泡沫。你能不能展開講講你的觀察?

Matt: 對(duì)。全球范圍內(nèi)都有很多機(jī)器人公司,但中國(guó)尤其多。光是做人形機(jī)器人的公司,大概就有 150 家以上。大家都在爭(zhēng)奪一個(gè)目前還很小、但正在增長(zhǎng)的市場(chǎng)。

那些真正能夠解決機(jī)器人核心難題的公司——比如手部靈巧度問題——才會(huì)更有機(jī)會(huì)。自主性問題現(xiàn)在也還沒解決。現(xiàn)在很多機(jī)器人系統(tǒng)其實(shí)仍然是遠(yuǎn)程操控的,或者是高度編排好的、提前寫好程序的。所以 autonomy(自主性)還沒有真正被攻克,而很多人都在做這件事。

我看到的是,中國(guó)機(jī)器人創(chuàng)業(yè)公司在機(jī)械、物理、執(zhí)行器設(shè)計(jì)、以及把所有零部件整合起來這方面非常強(qiáng)。而美國(guó)機(jī)器人公司則更聚焦于“大腦”——也就是背后的 AI,以及支撐機(jī)器人的多模型系統(tǒng)。

確實(shí)有可能出現(xiàn)“太多了”、過度飽和的情況。這在任何行業(yè)里都會(huì)發(fā)生:當(dāng)大家一擁而入的時(shí)候,總會(huì)如此。但中國(guó)機(jī)器人公司這一塊,是北京明確優(yōu)先推動(dòng)的方向,所以他們對(duì)這個(gè)生態(tài)做了很多投資。就像任何市場(chǎng)一樣,最后一定會(huì)有贏家和輸家。接下來幾年,我們大概就會(huì)看到,誰(shuí)會(huì)真正脫穎而出,誰(shuí)又無(wú)法在頂級(jí)競(jìng)爭(zhēng)中繼續(xù)站穩(wěn)。

“‘我們自己能做得更好’這種幻覺,正在讓很多企業(yè)空手而歸”

主持人: 我很想聽聽你對(duì)這個(gè)問題的看法。你在企業(yè)技術(shù)領(lǐng)域干了很多年、很多個(gè)十年,現(xiàn)在又在這個(gè)前沿層面上和很多 AI 公司打交道。從你的觀察來看,企業(yè)在嘗試應(yīng)用 AI 時(shí),最常犯的錯(cuò)誤是什么?無(wú)論是他們看待 AI 的方式,還是他們?cè)趹?zhàn)略上如何把 AI 引入工作流、尋找可落地的商業(yè)模式或內(nèi)部自動(dòng)化機(jī)會(huì)——你的看法是什么?

Matt: 我不覺得企業(yè)在“采用 AI”這件事上存在問題。我覺得真正的挑戰(zhàn)在于:如何在企業(yè)里“成功部署 AI”。而導(dǎo)致失敗結(jié)果的因素,其實(shí)有很多。

其中一個(gè),就是那種“我知道我能把這個(gè)做得更好”的心態(tài)。于是企業(yè)不是去買現(xiàn)成方案,而是自己造;但問題在于,你并沒有相應(yīng)的人才儲(chǔ)備。于是你花了很多時(shí)間做實(shí)驗(yàn),消耗了大量周期和資本,試圖做出某種“新東西”,可實(shí)際上,生態(tài)里可能早就已經(jīng)有了成熟的核心組件。

開源想做的一件事,就是提供這些基礎(chǔ)組件,讓組織可以站在它們之上繼續(xù)搭建,而不是從頭全部重造,對(duì)吧?現(xiàn)在大家都在跑,尤其在 agentic AI 這邊,有時(shí)候你會(huì)覺得“自己搭最有吸引力”,而不是去用一個(gè)已經(jīng)由合作伙伴構(gòu)建好的成熟框架。即便那個(gè)框架不是開源的,對(duì)方也可能提供專業(yè)服務(wù),并幫助你走正確的路徑。

所以我覺得,企業(yè)應(yīng)該認(rèn)真看待合作伙伴。不要把這當(dāng)成一段必須獨(dú)自完成的旅程。當(dāng)然,會(huì)有很多顧問很樂意拿你的錢給你建議;但我最常看到的還是那種“我們能做得更好”或者“這我們自己也能做”的心態(tài),最后結(jié)果卻達(dá)不到預(yù)期。

主持人: 你能舉一些具體行業(yè)或用例的例子嗎?哪些場(chǎng)景里你看到這種思路經(jīng)常失敗?

Matt: 可以。不點(diǎn)名任何具體機(jī)構(gòu),幾年前最典型的就是聊天機(jī)器人,對(duì)吧?“我們?cè)趺丛谧约旱幕A(chǔ)設(shè)施上做一個(gè)更好的聊天機(jī)器人?”“哦,我們有數(shù)據(jù),那就自己預(yù)訓(xùn)練一個(gè)模型吧。”——這就不是個(gè)好主意,對(duì)吧?

市面上已經(jīng)有很多優(yōu)秀的預(yù)訓(xùn)練模型。你完全可以從這些基礎(chǔ)模型出發(fā),再自己做微調(diào)。但我們當(dāng)時(shí)看到很多企業(yè)直接去訓(xùn)練模型,而這通常都是個(gè)壞主意。如果你不是一家實(shí)驗(yàn)室,那就不要把重心放在那里。

我知道有很多組織試圖自己預(yù)訓(xùn)練模型,最后都不了了之,燒掉了大量資金,卻幾乎一無(wú)所獲。所以我的建議是:站在現(xiàn)有的積木之上繼續(xù)搭。現(xiàn)在開放生態(tài)里已經(jīng)有很多很棒的東西,我們當(dāng)然希望看到更多。我們希望看到更多真正開放、真正采用寬松許可證的模型。我覺得我們擁有一個(gè)充滿活力的項(xiàng)目生態(tài)非常重要——這些項(xiàng)目不僅幫助“開發(fā) AI”,也幫助“應(yīng)用 AI”。

主持人: 我知道的一個(gè)例子是 Revolut。他們發(fā)布了自己的模型,不過按他們的說法,那不算語(yǔ)言模型,而是更多基于他們內(nèi)部數(shù)字和數(shù)據(jù)訓(xùn)練出來、供內(nèi)部使用的模型。我猜,一方面可能是因?yàn)樗麄儺?dāng)時(shí)從現(xiàn)有項(xiàng)目里可選的不夠多,另一方面,大規(guī)模數(shù)據(jù)和隱私敏感性可能也確實(shí)會(huì)把他們推向這條路。我們拭目以待吧,這畢竟只是第一版,還得看會(huì)不會(huì)有第二版。

除了“我們內(nèi)部做得更好、而不是用現(xiàn)成模型”這一類問題之外,現(xiàn)在企業(yè)在管理層面或業(yè)務(wù)層面,做 AI 時(shí)還有哪些常見錯(cuò)誤?

Matt: 另一個(gè)關(guān)鍵點(diǎn),是要識(shí)別“低垂果實(shí)”(low-hanging fruit)。當(dāng)你在看可探索的用例時(shí),不要一開始就伸手去夠最高那層架子上的東西,不要上來就挑最復(fù)雜、風(fēng)險(xiǎn)最高的用例。

你一定要對(duì)用例做風(fēng)險(xiǎn)評(píng)估。要確保你選擇的是那些既可實(shí)現(xiàn)、又能真正帶來優(yōu)化與自動(dòng)化收益的用例。如果它不能,那你做出來的東西就只是一個(gè)“看,我們也能做”的演示品,卻沒有給組織帶來任何實(shí)實(shí)在在的回報(bào),那這件事顯然就不值得做,對(duì)吧?

你要確保自己是在做那些可以落地的用例,而不是花 6 到 12 個(gè)月造一個(gè)東西,最后卻一無(wú)所獲。當(dāng)然,風(fēng)險(xiǎn)評(píng)估也很重要,因?yàn)楹芏嗳硕紝?duì)這樣一種前景感到興奮——

其實(shí)昨天還聊到一個(gè)話題:你會(huì)愿意讓一個(gè) agent 代你投資多少錢?我覺得隨著時(shí)間推移、隨著它們變得更可靠,人們會(huì)越來越愿意讓它們替自己投資。但現(xiàn)在,大家的態(tài)度還是:“我可不想讓 agent 碰我的錢。”

我們已經(jīng)看到過一些聊天機(jī)器人或客服 agent,本不該退款卻退了款,或者被 jailbreak 之后做出錯(cuò)誤行為。所以,還是要回到安全、安保和隱私這些基本問題上:你必須有非常強(qiáng)的安全姿態(tài),必須設(shè)置牢靠的 guardrails。因?yàn)槟憧隙ú幌Ml(fā)生數(shù)據(jù)外泄,或者個(gè)人信息泄露這類事情。

很多這類系統(tǒng),必須通過代碼以確定性的方式去構(gòu)建,而不是每次都依賴模型去正確執(zhí)行你的意圖。

主持人: 對(duì),我剛意識(shí)到,單靠 prompt 里的那些 guardrails 可能并不是最好的做法,對(duì)吧?也許應(yīng)該在用戶和 LLM 之間硬編碼一層“感應(yīng)器”或攔截器,專門處理各種邊緣情況。

Matt: 對(duì)。

主持人: 說到 agentic AI,現(xiàn)實(shí)里你有沒有看到過什么成功案例,是自主 agent 在日常工作中完全替代人類的?

Matt: 我會(huì)說,大家對(duì)“自治”在 agent 里的含義其實(shí)理解并不一致。我見過最極端的一種說法,是把 agent 想象成某種完全主權(quán)化、漂浮在以太中的存在,自己跑出去把事情都做了。

但說到底,你希望 agent 真正做到的,還是它定義上的那件事:代表你工作,幫你達(dá)成某種結(jié)果。

我現(xiàn)在看到能量最集中、關(guān)注最多的,大概有兩個(gè)方向。第一個(gè)是基礎(chǔ)積木。我還是會(huì)回到“積木”這個(gè)概念:有這些開源的基礎(chǔ)組件,你可以在上面繼續(xù)搭,無(wú)論是像 MCP 這樣的協(xié)議,還是某種通用型 harness,或者其他可以用來構(gòu)建 agent 的組件。再比如 skills,把這些東西組合起來,做出真正有用的系統(tǒng)。

我覺得現(xiàn)在很多人都在聚焦這一層:做協(xié)議、做標(biāo)準(zhǔn)、做規(guī)范、做框架,以及各種可復(fù)用的 skill 組件。

第二個(gè)方向是落地應(yīng)用。不過現(xiàn)在這些都還很實(shí)驗(yàn)性。在采用層面,真正最有價(jià)值的,還是那些更簡(jiǎn)單的用例,對(duì)吧?所以你得穿透很多噪音。總有人說自己靠一個(gè)金融 agent 一夜賺了一萬(wàn)億美元,或者“我把團(tuán)隊(duì)都裁掉了,現(xiàn)在我有 50 個(gè) agent”。

主持人: 對(duì),“我現(xiàn)在沒有員工了,我是 one-person company。我原來有 500 個(gè)員工,全裁了,現(xiàn)在只剩 12 個(gè) agent。”

Matt: 對(duì),這種話你必須學(xué)會(huì)過濾。你得現(xiàn)實(shí)一點(diǎn)。很多人對(duì)“一個(gè)人開公司,把自己徹底解放出來”這種前景充滿想象,這當(dāng)然很好。AI 讓一些人能做以前做不到的事情,也能自動(dòng)化他們大量日常工作。

但我們普遍并沒有看到一個(gè) agent 獨(dú)立完成整個(gè)工作流。通常是:這個(gè)步驟用一個(gè) agent,那個(gè)步驟用一個(gè) agent,再另一個(gè)步驟用另一個(gè) agent。

比如報(bào)稅。如果你不想自己翻收據(jù)、做匯總,你可以把收據(jù)掃描,或者把 PDF 丟給一個(gè) agent,讓它幫你做表格、算總額、把材料整理好,然后你再去核驗(yàn),最后提交報(bào)稅。

所以,現(xiàn)實(shí)里有很多細(xì)膩、具體的用例。但有一件事始終重要:你必須驗(yàn)證。尤其如果你在做應(yīng)用,你一定要 benchmark(做基準(zhǔn)評(píng)估)。很多時(shí)候你還得自己設(shè)計(jì) benchmark,因?yàn)槟惚仨毚_認(rèn)它在你的場(chǎng)景下確實(shí)有效。在你把東西上線、或者真正投產(chǎn)之前,確保你有正確的 benchmark,這非常重要。

主持人: 說到企業(yè)內(nèi)部的 AI 采用,對(duì)于不同規(guī)模的公司,最佳策略會(huì)是什么?應(yīng)該從哪里開始?今天如果有人在經(jīng)營(yíng)一家公司,做法會(huì)有很多種,對(duì)吧?有些老板會(huì)說“所有人必須用 AI”;還有的說“誰(shuí)不用 AI 我就不給獎(jiǎng)金”,甚至“誰(shuí)不用我就罰誰(shuí)”。從你的角度看,第一步、第二步、第三步,應(yīng)該怎么走?

Matt: 我覺得有一點(diǎn)非常重要,需要先認(rèn)識(shí)到:你并不一定非要直接和 AI 交互,才能獲得 AI 帶來的收益。AI 正在一點(diǎn)點(diǎn)進(jìn)入你所使用產(chǎn)品的功能之中,對(duì)吧?

所以,無(wú)論你是不是直接使用 GPT 或 Gemini,其實(shí)都不是唯一途徑。像 Adobe 這種策略就很好:把能力集成在幕后,在產(chǎn)品里加入更多生成式功能、更多 agentic功能,用這種方式提升企業(yè)生產(chǎn)力。這是一種很好的路徑。

因?yàn)閷?duì)采用者來說,這是“阻力最小”的方式。你不一定非得直接操作這項(xiàng)技術(shù)。

主持人: 比如在客服層面這樣做。

Matt: 對(duì),正是如此。所以即使你是企業(yè),也可以去跟你的供應(yīng)商、產(chǎn)品提供商溝通,說:“我們希望你把這個(gè)功能做進(jìn)去。” 讓他們替你構(gòu)建,這樣你就不必自己去補(bǔ)齊這部分能力了,對(duì)吧?因?yàn)槟惆堰@項(xiàng)功能開發(fā)外包給了你的第三方供應(yīng)商——也就是那些為你提供應(yīng)用軟件的人。

這是最輕量的一種方式,對(duì)吧?尤其是如果你并不是一家 AI-native 的組織,內(nèi)部也沒有足夠熟練的人才。

主持人: 所以就是:去找你的 vendor,讓他們把 AI 驅(qū)動(dòng)的功能做進(jìn)去。

Matt: 對(duì)。尤其如果你是一家 100 人公司、50 人公司,真的沒必要什么都自己造,對(duì)吧?你應(yīng)該更多借助你的 vendor。

如果你是更大的組織,我總是會(huì)說:去找顧問。不要假設(shè)自己第一天就能把所有東西都學(xué)明白。

如果你是硅谷創(chuàng)業(yè)公司,那你大概率會(huì)更傾向自己做。但如果你的業(yè)務(wù)目標(biāo)不是做 AI 本身,也不是做 agentic-first 公司,那你還是應(yīng)該更多利用外面現(xiàn)成的工具。

這也是為什么開源如此重要,對(duì)吧?能夠接觸到這么多工具、這么多組件,用來構(gòu)建你的產(chǎn)品、服務(wù),或者增強(qiáng)你內(nèi)部系統(tǒng)。

如果我們講的是企業(yè),要和大量遺留系統(tǒng)、后臺(tái)系統(tǒng)打交道,要利用自己的數(shù)據(jù),那現(xiàn)在已經(jīng)有很多工具,能把原本屬于經(jīng)典 SQL 世界的數(shù)據(jù)接到語(yǔ)言模型里。

現(xiàn)在市面上真的已經(jīng)有很多很好的產(chǎn)品了。很多當(dāng)然是商業(yè)產(chǎn)品,但關(guān)鍵還是:你必須先明確自己的用例是什么,對(duì)吧?我不會(huì)建議你在還沒明確問題之前,就先去找解決方案。

說到底,還是回到第一性原理:對(duì)你的組織來說,最重要的用例是什么?你能通過自動(dòng)化實(shí)現(xiàn)哪些最大化優(yōu)化?你會(huì)通過哪些方式實(shí)現(xiàn)成本節(jié)省?諸如此類。你必須非常聚焦于自己真正要解決的問題。

主持人: 但如果你讓 vendor 幫你做這些事,那你的競(jìng)爭(zhēng)對(duì)手也都能拿到同樣的能力。那你就沒有優(yōu)勢(shì)了。

Matt: 當(dāng)然。這就要區(qū)分“差異化”和“生產(chǎn)力提升”了。內(nèi)部生產(chǎn)力是一回事。有時(shí)把那個(gè)功能外包給供應(yīng)商并不明智。但在差異化因素上,這才是你應(yīng)該投資的地方,對(duì)吧?如果你要讓自己和競(jìng)爭(zhēng)對(duì)手區(qū)分開來——如果你的唯一優(yōu)勢(shì)只是理賠處理得更快,如果你是在保險(xiǎn)行業(yè),那算不上真正的護(hù)城河,對(duì)吧?這確實(shí)能讓你跑得更快,提供更好的客戶服務(wù),但終究還是要找出這些差異化因素,并看看 AI 是否是個(gè)好的解決方案。

AI 并不總是萬(wàn)能藥,對(duì)吧?生成式模型也不見得能搞定所有事情。我記得很清楚,大模型剛出來那會(huì)兒,大家都說:“防欺詐檢測(cè),我得用大模型。” 根本不用,你手頭明明有非常好用、也更精準(zhǔn)和穩(wěn)定的經(jīng)典機(jī)器學(xué)習(xí)模型,完全能搞定識(shí)別網(wǎng)絡(luò)里的違規(guī)設(shè)備或者欺詐交易,而且準(zhǔn)確度更高。

所以你沒必要僅僅因?yàn)樗钚隆⒆畛保头且岩磺卸寂驳酱竽P蜕稀?/p>

主持人: 是的。而對(duì)于差異化,你應(yīng)該自己投資去建;而對(duì)于內(nèi)部?jī)?yōu)化,你最好去用現(xiàn)成的供應(yīng)商,我非常贊同。因?yàn)閮?nèi)部?jī)?yōu)化的上限是高度受限的。

Matt: 是的。在那個(gè)領(lǐng)域里,去創(chuàng)新和自己建更合理,或者至少找個(gè)能幫你在那個(gè)空間創(chuàng)新的供應(yīng)商合作。

因?yàn)樗腥私K究都會(huì)做內(nèi)部?jī)?yōu)化,如果你把所有錢都花在這上面,可能并沒有產(chǎn)生真正的差異化優(yōu)勢(shì)。

主持人: 你提到了 AI 原生公司。如果企業(yè)不是 AI 原生公司,可能就不應(yīng)該硬做。但企業(yè)能不能自己做一個(gè) AI 實(shí)驗(yàn)室,或者分拆一個(gè)項(xiàng)目出來?什么是真正的“AI 原生”?

Matt: 如果你是一家已經(jīng)很成熟的公司,想變成 AI-first,大致有兩種路徑。

一種是把 AI 能力嵌入組織內(nèi)部。也就是說,在每個(gè)團(tuán)隊(duì)里都配備一個(gè)非常懂 AI 的人,不管是應(yīng)用開發(fā)層,還是技術(shù)棧更底層。

另一種,是建立一支專門團(tuán)隊(duì),去和公司各個(gè)部門協(xié)作,幫助他們上手、受訓(xùn)、并在不同程度上應(yīng)用 AI。

因?yàn)槲覀儸F(xiàn)在談的是企業(yè)、創(chuàng)業(yè)公司,以及各種各樣不同的組織。它們對(duì) AI 的需求不同,內(nèi)部構(gòu)建能力的條件也不同。

如果你是創(chuàng)業(yè)公司,那 AI-first 絕對(duì)是正確方向。你想在這個(gè)領(lǐng)域競(jìng)爭(zhēng),如果你不用 AI,就會(huì)被甩在后面。

但如果你經(jīng)營(yíng)的是物流,比如航運(yùn)物流,那 AI 的應(yīng)用空間很多。也許最合理的做法,是建立一個(gè)小團(tuán)隊(duì),專門去研究這些用例:我們需要構(gòu)建哪些工具?哪些可以采購(gòu)?哪些能幫助解決特定問題并實(shí)現(xiàn)優(yōu)化?

低垂果實(shí)其實(shí)很多,比如客服聊天機(jī)器人。再往復(fù)雜一點(diǎn),比如一些創(chuàng)業(yè)公司開始嘗試替代呼叫中心。

主持人: 說到客服。現(xiàn)在有了 MCP 之后,你的 agent,或者像 Claude 這樣的開放式系統(tǒng),已經(jīng)可以原生地通過 MCP 替你執(zhí)行某些動(dòng)作了。那問題就變成:如果你的 agent 可以直接連到商家的 agent,代替你和對(duì)方溝通,那你還真的需要客服團(tuán)隊(duì)嗎?或者說,未來兩三四年內(nèi),我們還真的需要網(wǎng)站、需要自己去訂機(jī)票和酒店嗎?如果你只要對(duì)自己選擇的 LLM 提供商說一句“幫我訂張票”就行,那這一切還需要嗎?

Matt: 對(duì)。我覺得每個(gè)人都希望擁有這樣一個(gè)私人 agent:它能代表你行動(dòng),了解你的偏好,能主動(dòng)替你做決定,理解你的意圖,并且在商業(yè)環(huán)境或其他系統(tǒng)中處理不確定性,以一種負(fù)責(zé)任的方式替你完成事情。

當(dāng)然,human in the loop 依然很重要。假設(shè)我告訴 agent:某款沙發(fā)降到某個(gè)價(jià)格以下時(shí)就替我買。這個(gè)用例很簡(jiǎn)單。但中間可能有一些細(xì)微之處,是人類能識(shí)別出來的:比如價(jià)格趨勢(shì)實(shí)際上還在繼續(xù)往下走,而且我從其他信息源知道它可能還會(huì)再降。那即便它已經(jīng)觸發(fā)了購(gòu)買閾值,我可能還是想再等等。

股票、加密貨幣這些也是一樣。有些事情,可能還是我們?nèi)祟愖约焊m合做判斷。

但如果說到購(gòu)買行為,我還是會(huì)回到那個(gè)問題:你到底愿意把多少信任交給你的 agent?不過我當(dāng)然會(huì)更愿意讓一個(gè) agent 去幫我買票、安排行程、確保一切都安排妥當(dāng),并且以一種沒有意外、能體現(xiàn)我偏好的方式完成這一切。

所以我覺得,這就是未來幾年我們會(huì)前進(jìn)的方向。我認(rèn)為,我們會(huì)越來越多地看到這一點(diǎn)真正落地。現(xiàn)在已經(jīng)有一些不斷演化中的規(guī)范和標(biāo)準(zhǔn)出現(xiàn)了,它們會(huì)幫助構(gòu)建 agentic interfaces,推動(dòng)這一層標(biāo)準(zhǔn)化。

比如你的在線商店,不再只是一個(gè)給人類用的界面,讓你點(diǎn)來點(diǎn)去選商品;它也可能變成一個(gè)更偏文本驅(qū)動(dòng)、更適合 agent 交互的界面。

我們已經(jīng)看到很多這類趨勢(shì)。同時(shí),我們也看到很多關(guān)于微支付、支付通道以及 agentic AI 配套系統(tǒng)的創(chuàng)新。

在 Agentic AI Foundation,我們從第一天開始就設(shè)立了七個(gè)不同的工作組,關(guān)注的內(nèi)容從監(jiān)管問題,到安全、隱私、可靠性、可觀測(cè)性——這些都是 agentic AI 必須解決的領(lǐng)域。

在這個(gè)過程中,我們會(huì)逐步看到一系列新標(biāo)準(zhǔn)、新規(guī)范、新方案和新想法涌現(xiàn)出來,由社區(qū)采納,幫助構(gòu)建一個(gè)非常強(qiáng)健的生態(tài),構(gòu)建網(wǎng)絡(luò),構(gòu)建這樣一個(gè)空間:讓我們能夠賦予 agent 一定程度的責(zé)任,讓它們真正代表我們?nèi)バ袆?dòng)。

我覺得大家都對(duì)這個(gè)想法非常興奮,尤其是在中國(guó)。比如 OPC(一人公司)那種“自己坐著不動(dòng),所有 agent 都在外面幫我賺錢”的想象,當(dāng)然誰(shuí)都會(huì)很興奮。

那我們?cè)撛趺醋呦蜻@種經(jīng)濟(jì)形態(tài),也就是不斷演化的智能體經(jīng)濟(jì)?現(xiàn)在已經(jīng)有一些關(guān)于自主主權(quán)智能體的設(shè)想,也有一些關(guān)于 agent 如何在區(qū)塊鏈上行動(dòng)、如何在傳統(tǒng)商業(yè)體系中行動(dòng)的設(shè)想。這一切都非常令人興奮,也帶來了很多創(chuàng)新機(jī)會(huì)。

我覺得這也是為什么我們會(huì)看到這么多高度聚焦 agent 的創(chuàng)業(yè)公司。誠(chéng)然,“agent”這個(gè)詞在很多場(chǎng)景里可能已經(jīng)被過度使用了,但我認(rèn)為,這里確實(shí)存在一個(gè)讓創(chuàng)新者解決真實(shí)問題的機(jī)會(huì)。

“現(xiàn)在開源社區(qū)里,你幾乎不得不使用 AI 去對(duì)抗 AI 帶來的海量垃圾”

主持人: 很有意思。回到你自己,回到 Linux Foundation。我不確定你現(xiàn)在是否還親自寫代碼,但至少你的工程師團(tuán)隊(duì)——他們可以使用 AI 嗎?可以用到什么程度?你們內(nèi)部是怎么治理這件事的?大家通常會(huì)把 AI 用在什么場(chǎng)景?

Matt: 我們?cè)?Linux Foundation 有很多很多項(xiàng)目。每一個(gè)項(xiàng)目對(duì)“如何使用 AI”都有自己的政策。但我會(huì)說,大多數(shù)項(xiàng)目都在使用 coding agents 來增強(qiáng)開發(fā)能力。

我本身也寫代碼,所以我最常用的工具也是 Claude Code,和很多人一樣。我很認(rèn)可它的實(shí)用性。它生成的代碼我能直接發(fā)版嗎?不能。我還是需要自己把各部分拼起來,跑單元測(cè)試之類的。但它在完成單元測(cè)試、以及生產(chǎn)化一個(gè)系統(tǒng)所需的各個(gè)環(huán)節(jié)方面,已經(jīng)越來越熟練了。

不同項(xiàng)目對(duì) AI 有不同政策。但可以肯定的是,在開源社區(qū)里,AI 的使用已經(jīng)非常廣泛了。很多以前根本不會(huì)寫代碼的人,現(xiàn)在也能通過對(duì)代碼庫(kù)跑一遍 AI,找一個(gè)可修可優(yōu)的點(diǎn),然后提一個(gè) PR。這讓很多維護(hù)者不得不面對(duì)海量 PR,逐個(gè)查看、整理、篩選。

而在這個(gè)鏈條的另一端,我們又看到很多人開始用 AI 去審查這些 PR、合并修改、驗(yàn)證它們是否真的是可接受的 PR。所以我會(huì)說,現(xiàn)在幾乎所有人都在以某種程度使用 AI,因?yàn)槟銕缀醪坏貌皇褂?AI 去對(duì)抗 AI 帶來的效應(yīng)。這件事挺有意思的。

主持人: 我覺得工程團(tuán)隊(duì)現(xiàn)在確實(shí)有點(diǎn)頭疼:業(yè)務(wù)團(tuán)隊(duì)拿著用 Claude 搞出來的東西跑過來,說“看,我這邊都能跑,為什么你們做不到?” 我感覺某種共識(shí)正在形成:工程團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)之間的距離其實(shí)在縮短。因?yàn)闃I(yè)務(wù)團(tuán)隊(duì)現(xiàn)在確實(shí)可以通過 vibe-code 做出 MVP、做出產(chǎn)品原型,對(duì)業(yè)務(wù)邏輯進(jìn)行快速試驗(yàn)、調(diào)整和迭代;而工程團(tuán)隊(duì)則可以從中獲益,因?yàn)樗麄兡苤苯涌吹綐I(yè)務(wù)邏輯被實(shí)現(xiàn)出來,哪怕那段代碼本身未必真的能拿來用。

Matt: 對(duì)。軟件開發(fā)生命周期正在被壓縮。現(xiàn)在從需求走到 POC 更容易了。但能生成代碼,并不意味著代碼就是優(yōu)化過的;也不意味著它是安全的。所以開發(fā)者仍然有很多工作要做。

主持人: 對(duì),你還得做生產(chǎn)級(jí)擴(kuò)展、安全性、這些所有東西。如果你只是剛開始用 Claude Code,大概率還做不到這些。

最后一個(gè)問題:如果你今天是創(chuàng)始人,手上有 100 萬(wàn)美元,你現(xiàn)在會(huì)投什么?在這個(gè)領(lǐng)域里,你現(xiàn)在最會(huì)專注做什么?

Matt: 這是個(gè)非常開放的問題,因?yàn)槊總€(gè)人都得先想清楚,自己要如何在市場(chǎng)上形成差異化,對(duì)吧?

主持人: 那你覺得機(jī)會(huì)在哪兒?從細(xì)分賽道、行業(yè)或者“低垂果實(shí)”的角度看,你會(huì)怎么看?

Matt: 因?yàn)槲乙恢笔菑拈_源視角看問題,所以我打從心眼里更偏好那些解決實(shí)際問題的通用系統(tǒng)。我非常看好 agents。它們現(xiàn)在還不擅長(zhǎng)處理長(zhǎng)時(shí)程任務(wù),而且多智能體系統(tǒng)、安全、安保方面還有很多問題需要解決。

我希望看到、但現(xiàn)在還沒看到足夠多的,是那些聚焦于 agentic system 的安全與隱私的公司。市面上當(dāng)然有一些創(chuàng)業(yè)公司在做,但更多是針對(duì)某些特定場(chǎng)景,而不是通用型應(yīng)用。

我看到有一些團(tuán)隊(duì)在金融這類強(qiáng)監(jiān)管行業(yè)里,為特定系統(tǒng)構(gòu)建腳手架和 guardrails。但更一般化的問題是:我們?nèi)绾伟堰@套東西推廣到更通用的場(chǎng)景?我們能不能像在確定性系統(tǒng)里那樣,構(gòu)建通用型的安全與安保系統(tǒng)?我們?cè)撊绾伟堰@件事應(yīng)用到隨機(jī)性空間里?

我很希望看到有人往這個(gè)方向努力,尤其是在提升可靠性方面。在 agentic AI 里,LLM 的失敗模式是會(huì)被繼承下來的,對(duì)吧?幻覺,會(huì)被 agent 繼承。

當(dāng)然,借助 agent,我們可以增加更多確定性層,把 harness 里的上下文收得更緊,讓系統(tǒng)更聚焦。但與此同時(shí),你不可能僅靠模型解決一切。你必須采取一種“構(gòu)建系統(tǒng)”的方法,對(duì)吧?你要做的是一個(gè)系統(tǒng),而不是把全部精力都?jí)涸谀P捅旧砩稀?/p>

我認(rèn)為,這正是我們放大當(dāng)今 LLM 能力的方式:不是單盯著模型,而是在模型周圍構(gòu)建系統(tǒng)。


AI 不該只停留在概念和 Demo,更要真正走進(jìn)業(yè)務(wù)現(xiàn)場(chǎng)。

7 月 17-18 日,2026 奇點(diǎn)智能產(chǎn)品大會(huì)將在北京金隅喜來登酒店舉辦。大會(huì)圍繞 Agent 智能體、企業(yè)級(jí) AI、AI Coding、具身智能、行業(yè)應(yīng)用落地等核心方向,邀請(qǐng)一線產(chǎn)業(yè)實(shí)踐者,共同拆解 AI 產(chǎn)品從想法到落地、從試點(diǎn)到規(guī)模化的關(guān)鍵路徑。

掃碼領(lǐng)取 AI 實(shí)戰(zhàn)落地資料包,搶先了解大會(huì)亮點(diǎn),與 1000+ 產(chǎn)業(yè)決策者相聚現(xiàn)場(chǎng),共赴智能奇點(diǎn)。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
沒有證據(jù)?那就發(fā)明證據(jù)!從中國(guó)第一“女福爾摩斯”到冤案制造者

沒有證據(jù)?那就發(fā)明證據(jù)!從中國(guó)第一“女福爾摩斯”到冤案制造者

許三歲
2026-06-24 11:06:59
沈騰一家阿那亞度假,7歲兒子身高搶鏡,王琦專心啃雞爪更富態(tài)了

沈騰一家阿那亞度假,7歲兒子身高搶鏡,王琦專心啃雞爪更富態(tài)了

星星沒有你亮
2026-06-30 21:27:41
官媒終于出手!韓紅風(fēng)波再升級(jí), 出言暗諷僅是皮毛, 丑聞接連曝光

官媒終于出手!韓紅風(fēng)波再升級(jí), 出言暗諷僅是皮毛, 丑聞接連曝光

曹莽看世界
2026-07-01 13:45:48
萊曼談德國(guó)隊(duì)世界杯出局:納格爾斯曼最大問題是沒踢過球

萊曼談德國(guó)隊(duì)世界杯出局:納格爾斯曼最大問題是沒踢過球

懂球帝
2026-07-01 00:49:17
任素汐演唱會(huì)好評(píng)如潮,三個(gè)亮點(diǎn)驚喜出圈,謝娜羨慕哭了

任素汐演唱會(huì)好評(píng)如潮,三個(gè)亮點(diǎn)驚喜出圈,謝娜羨慕哭了

小僫搞笑解說
2026-07-01 13:46:52
一覺醒來,“冤大頭”出現(xiàn),特朗普美了,高市早苗哭了,中國(guó)笑了

一覺醒來,“冤大頭”出現(xiàn),特朗普美了,高市早苗哭了,中國(guó)笑了

小小科普員
2026-07-01 15:33:38
韓信被殺,蕭何大擺宴席慶賀,一個(gè)門客卻穿著喪服說:禍?zhǔn)虏贿h(yuǎn)了

韓信被殺,蕭何大擺宴席慶賀,一個(gè)門客卻穿著喪服說:禍?zhǔn)虏贿h(yuǎn)了

白云故事
2025-10-23 10:02:02
加油站油價(jià)三連跌!7月3日國(guó)內(nèi)油價(jià)調(diào)整,將迎斷崖式油價(jià)大幅下調(diào)

加油站油價(jià)三連跌!7月3日國(guó)內(nèi)油價(jià)調(diào)整,將迎斷崖式油價(jià)大幅下調(diào)

有料財(cái)經(jīng)
2026-07-01 22:19:35
投70萬(wàn)回本遙遙無(wú)期,從網(wǎng)紅黑馬到全員控訴,麥記牛奶只用了一年

投70萬(wàn)回本遙遙無(wú)期,從網(wǎng)紅黑馬到全員控訴,麥記牛奶只用了一年

財(cái)經(jīng)八卦
2026-07-01 17:37:19
乾隆皇帝一生到底臨幸過多少女子?野史記載數(shù)字驚人,身體真不錯(cuò)

乾隆皇帝一生到底臨幸過多少女子?野史記載數(shù)字驚人,身體真不錯(cuò)

王知魚說歷史
2026-06-29 07:16:34
美國(guó)發(fā)話也不行,中方正式通告全球:打日本,中國(guó)具備“正當(dāng)性”

美國(guó)發(fā)話也不行,中方正式通告全球:打日本,中國(guó)具備“正當(dāng)性”

鳳語(yǔ)談
2026-05-28 12:13:58
新加坡打臉:請(qǐng)新加坡尊重自己的祖先印度人,別啥事都硬扯上中國(guó)

新加坡打臉:請(qǐng)新加坡尊重自己的祖先印度人,別啥事都硬扯上中國(guó)

怪味歷史連連看
2026-06-30 20:12:54
女同事往我水杯滴液體,我悄悄倒進(jìn)她杯子,10分鐘后她一飲而盡

女同事往我水杯滴液體,我悄悄倒進(jìn)她杯子,10分鐘后她一飲而盡

千秋文化
2026-06-24 20:05:47
特斯拉最新優(yōu)惠上線,降價(jià) 8000 元!

特斯拉最新優(yōu)惠上線,降價(jià) 8000 元!

花果科技
2026-07-01 17:27:12
2號(hào)線停運(yùn)大半年,成都東西兩極的房?jī)r(jià),快要冰火兩重天了?

2號(hào)線停運(yùn)大半年,成都東西兩極的房?jī)r(jià),快要冰火兩重天了?

林子說事
2026-07-01 16:08:25
逼真到以假亂真!機(jī)器人伴侶訂單破1萬(wàn),價(jià)格11.98萬(wàn)至99萬(wàn),為宇樹科技5倍,僅限成人購(gòu)買,A股受益公司曾18連板

逼真到以假亂真!機(jī)器人伴侶訂單破1萬(wàn),價(jià)格11.98萬(wàn)至99萬(wàn),為宇樹科技5倍,僅限成人購(gòu)買,A股受益公司曾18連板

金融界
2026-07-01 15:28:12
外媒:阿根廷提前飛邁阿密,首發(fā)三處未定

外媒:阿根廷提前飛邁阿密,首發(fā)三處未定

懂球帝
2026-07-01 21:48:09
當(dāng)明星不易?亞馬爾:我媽16歲生我,我爸曾流浪,那才是不易

當(dāng)明星不易?亞馬爾:我媽16歲生我,我爸曾流浪,那才是不易

懂球帝
2026-07-01 17:22:09
日本防衛(wèi)大臣將要求中國(guó)就將防衛(wèi)研究所列入出口管制名單一事作出解釋

日本防衛(wèi)大臣將要求中國(guó)就將防衛(wèi)研究所列入出口管制名單一事作出解釋

俄羅斯衛(wèi)星通訊社
2026-07-01 16:05:30
江蘇女輔警許艷因賣春被判7年刑滿釋放

江蘇女輔警許艷因賣春被判7年刑滿釋放

大國(guó)老記老顧
2026-06-28 09:09:14
2026-07-01 23:19:00
AI科技大本營(yíng) incentive-icons
AI科技大本營(yíng)
連接AI技術(shù)的創(chuàng)造者和使用者
2737文章數(shù) 7711關(guān)注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識(shí)別中國(guó)用戶

頭條要聞

前往日本周邊海域的中國(guó)軍艦 在日本防衛(wèi)省網(wǎng)站"刷屏"

頭條要聞

前往日本周邊海域的中國(guó)軍艦 在日本防衛(wèi)省網(wǎng)站"刷屏"

體育要聞

賣球衣救子的門將,把德國(guó)撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時(shí)差

財(cái)經(jīng)要聞

新氧貸款:宣傳年化15%,實(shí)際頂格24%

汽車要聞

上半年累計(jì)銷量突破142萬(wàn)輛 吉利6月銷量出爐

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
房產(chǎn)
藝術(shù)
旅游

Meiinpsn的穿衣風(fēng)格,清新又叛逆

數(shù)碼要聞

GPD預(yù)告9.06" PC掌機(jī)WIN MAX 3,Max+ 395 / 388處理器

房產(chǎn)要聞

洞察新局 | 2026年天河置業(yè)紅盤圖鑒

藝術(shù)要聞

西安美術(shù)學(xué)院,2026屆油畫系碩士研究生畢業(yè)作品選(二)

旅游要聞

9條青春線路,30余項(xiàng)優(yōu)惠政策!煙臺(tái)大學(xué)生畢業(yè)季嘉年華啟動(dòng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版