中國AI研究員的性格、魅力和真誠……讓人倍感親切。
這是艾倫研究所(Ai2)的研究員Nathan Lambert,在最近結(jié)束中國之行后,發(fā)自內(nèi)心的一番感慨。
在Nathan眼里,國內(nèi)的LLM圈子簡直是天堂,大家彼此尊重、即便立場不同也客客氣氣的。
反觀大洋彼岸的御三家,他突然有點(diǎn)沒眼看。
天天激情互噴,跟部落爭霸似的……
![]()
并非場面客套話。
這次來中國的36小時,Nathan幾乎把國內(nèi)AI圈打卡了個遍,月之暗面、智譜、清華、美團(tuán)、小米、千問……都有深度交流。
在和大量一線AI研究員、學(xué)生聊完天后,Nathan得出了這個結(jié)論:
這里的AI玩家,在合作共贏。
基于此,Nathan寫下長文,分享了他此次中國行期間令他印象深刻的種種事跡——
所有實(shí)驗(yàn)室都有點(diǎn)怕字節(jié),所有人都敬佩DeepSeek。
北京簡直跟硅谷一樣,他36小時內(nèi)跑了6家AI公司。
他問一名中國研究員對AI風(fēng)險的看法,對方困惑地愣住了——這似乎是個不合適的問題。
美團(tuán)、小米這種公司也會自研大模型,這在中國是理所當(dāng)然的事。
從筆記本上抬起頭,總能看到地平線上的起重機(jī),仿佛中國工程師文化的一種具象化。
實(shí)在太真誠了,連MiniMax都跑來前排圍觀,表示希望下次Nathan的「中國行」能把上海和深圳也安排上。
![]()
以下是整理后的文章節(jié)選。
Enjoy。
中國研究員的心態(tài)
Nathan在文中花了大篇幅聊一個事:為什么中國實(shí)驗(yàn)室這么擅長追趕前沿?
他的核心判斷是,文化。
今天做一個好的LLM,靠的是從數(shù)據(jù)到架構(gòu)到RL算法,全棧每個細(xì)節(jié)的打磨。每個環(huán)節(jié)都能榨出一些提升,但怎么把這些提升拼到一起,是一個極其復(fù)雜的多目標(biāo)優(yōu)化問題。
有時候某個天才研究員的工作,需要為模型的整體工作讓路。
在美國,這種事經(jīng)常引爆沖突。
Nathan透露了個瓜:Llama團(tuán)隊據(jù)傳就是因?yàn)閮?nèi)部政治斗爭過重而崩盤的。
大家都想讓別人按自己的想法做事,有實(shí)驗(yàn)室需要花錢安撫頂級研究員,才能讓他們別再抱怨自己的想法沒被采納。
據(jù)此,他得出一個結(jié)論:
過強(qiáng)的Ego和野心,會妨礙做出最好的模型。
而中國這邊,他觀察到一個微妙差異:
中國實(shí)驗(yàn)室的核心貢獻(xiàn)者有大量都是在讀學(xué)生,在這里,學(xué)生被當(dāng)成同事直接參與核心研發(fā)。
他們會愿意做那些不那么Sexy的工作,無所謂,只要能讓模型變好就行。
反觀美國呢?OpenAI、Anthropic、Cursor這些頂級公司干脆就不開實(shí)習(xí)。
Google這類公司名義上會有和Gemini相關(guān)的實(shí)習(xí),但事實(shí)上,大家會擔(dān)心實(shí)習(xí)生會被隔離在邊緣區(qū)域,接觸不到核心工作。
但中國經(jīng)驗(yàn)證明,學(xué)生的參與,反而能大幅加快行進(jìn)速度。
除此之外,這些學(xué)生還帶來了一個意想不到的優(yōu)勢:全新的視角。
過去幾年LLM的關(guān)鍵范式從Scaling MoE,到Scaling RL,再到Agent,每一次轉(zhuǎn)換都需要瘋狂吸收新的上下文。
學(xué)生恰恰最擅長這個。他們擅長快速學(xué)習(xí),也樂于放下一切預(yù)設(shè),一頭扎進(jìn)去。
Nathan還注意到一件有意思的事。當(dāng)他問中國研究員對AI的經(jīng)濟(jì)影響或長遠(yuǎn)社會風(fēng)險有什么看法時,很多人的反應(yīng)是——
愣了一下。
不是不想回答,是真的覺得不關(guān)他們事。他們的任務(wù)就是做出最好的模型,其他的事,不是他們操心的范圍。
相比之下,美國文化更強(qiáng)調(diào)為自己發(fā)聲。
作為科學(xué)家,你越能為自己的工作發(fā)聲,就越容易成功。
而硅谷文化也在推動一種新的成名路徑,也就是成為明星AI科學(xué)家。所以大家樂忠于上Dwarkesh、Lex Fridman這種超級播客節(jié)目。
一位研究員引用了Dan Wang那個經(jīng)典說法,很精辟:中國是工程師治國,美國是律師治國。
工程師考慮的是解決問題,而律師考慮的,是定義問題。
![]()
概括一下,Nathan覺得有四點(diǎn)比較重要的文化差異:
1、更愿意做那些不那么光鮮,但能提升最終模型的工作。
2、剛進(jìn)入AI構(gòu)建領(lǐng)域的人,不受上一輪AI炒作周期的路徑依賴束縛,因此能更快適應(yīng)新的現(xiàn)代技術(shù)。
3、更少的自我意識,讓組織結(jié)構(gòu)能稍微更好地擴(kuò)張,因?yàn)楦儆腥嗽噲D鉆組織系統(tǒng)的空子。
4、大量人才非常適合解決那些已經(jīng)在別處有概念驗(yàn)證的問題。
北京=硅谷
Nathan的北京游挺有意思。
他說北京簡直像灣區(qū)。隨便走兩步就是一個競爭對手的辦公室。
他下了飛機(jī),去酒店的路上順便就拐進(jìn)了阿里巴巴北京園區(qū)。然后在36個小時內(nèi),他依次去了智譜、月之暗面、清華、美團(tuán)、小米、零一萬物。
線下交流中,他向研究員們八卦中國的人才爭奪情況怎么樣。回答是:
跟美國差不多。
跳槽很正常,主要看當(dāng)前哪個團(tuán)隊氛圍最好。
但有一點(diǎn)跟美國很不一樣。
在中國的AI圈,實(shí)驗(yàn)室之間更像是一個生態(tài),而不是互相廝殺的部落。在很多私下交流中,大家對同行都是尊重的。
所有實(shí)驗(yàn)室都對字節(jié)跳動和豆包保持高度關(guān)注,在Nathan看來,字節(jié)是中國少數(shù)走閉源路線推進(jìn)的大模型玩家。
所有人都敬佩DeepSeek,認(rèn)為它是研究品味最好的實(shí)驗(yàn)室。
這讓Nathan很驚訝,和美國研究員的線下對話,火藥味可比這濃多了。
但在中國,大家似乎冥冥中形成了一種默契的共識。
![]()
還有一點(diǎn)他覺得很奇怪——
中國研究員談到商業(yè)化的時候經(jīng)常聳聳肩,說:那不是我的事。
而美國這邊,從數(shù)據(jù)供應(yīng)商到算力到融資,人人都對各種生態(tài)級別的產(chǎn)業(yè)趨勢如數(shù)家珍。
中國AI產(chǎn)業(yè)的真實(shí)樣貌
聊完文化,Nathan接著聊了聊產(chǎn)業(yè)層面他觀察到的幾個關(guān)鍵差異。我挑幾個最有意思的說。
1、國內(nèi)AI需求的早期信號
一直有一種說法:中國AI市場會比較小,因?yàn)橹袊静惶敢鉃檐浖顿M(fèi)。Nathan認(rèn)為這個判斷只對了一半。不愿意花錢的部分對應(yīng)的是SaaS生態(tài),這在中國確實(shí)很小。但中國有一個龐大的云計算市場。
關(guān)鍵問題在于:企業(yè)在AI上的花費(fèi),最終會走SaaS的路線還是云的路線?
Nathan的感受是,AI更接近云,而且沒有人在擔(dān)心圍繞新工具是否能長出市場。
2、中國公司的技術(shù)自研執(zhí)念
為什么美團(tuán)、螞蟻集團(tuán)這種公司也在自己做大模型?
西方人可能會覺得奇怪。
但在Nathan看來,中國人的邏輯是:LLM顯然會成為未來科技產(chǎn)品的核心,所以必須自己掌握。
不過,雖然自研,但也開源。
先訓(xùn)一個通用底座,開源出去讓社區(qū)幫忙打磨,內(nèi)部再微調(diào)一個版本用到自己的產(chǎn)品里。
開源不是信仰,是實(shí)用主義——它能獲得社區(qū)反饋,能回饋開源生態(tài),也能幫助他們更好地理解自己的模型。
3、算力不足
英偉達(dá)仍是訓(xùn)練的黃金標(biāo)準(zhǔn),每個實(shí)驗(yàn)室都因?yàn)樾酒粔蚨芟蕖?/p>
4、數(shù)據(jù)產(chǎn)業(yè)不夠成熟
Nathan聽說過Anthropic和OpenAI動輒花1000萬美元以上買單個RL訓(xùn)練環(huán)境,每年累計花費(fèi)數(shù)億美元來推動前沿。
他很好奇,中國實(shí)驗(yàn)室是不是也在從美國公司買這些環(huán)境?或者有鏡像的國內(nèi)供應(yīng)鏈?
答案是:有數(shù)據(jù)產(chǎn)業(yè),但質(zhì)量參差不齊。
所以自己做更靠譜。一般來說研究員們會親自花大量時間搭RL訓(xùn)練環(huán)境,字節(jié)和阿里這種大公司則有內(nèi)部數(shù)據(jù)標(biāo)注團(tuán)隊。
尾聲
Nathan文章最后的一段話,關(guān)乎「了解」。
Nathan表示,來之前就知道自己對中國了解甚少,走了一圈之后反而更強(qiáng)烈地感受到,自己根本不了解這塊土地。
中國不是一個能用規(guī)則或公式來概括的地方,它有完全不同的動力學(xué)和化學(xué)反應(yīng)。
如此古老且深厚文化,卻又與當(dāng)下的技術(shù)建設(shè)完全交織在一起。
在Nathan跟幾乎所有中國領(lǐng)先AI實(shí)驗(yàn)室交談后,他發(fā)現(xiàn)中國有很多特質(zhì)和直覺,是很難用西方的決策框架去建模的。
他不明白,為什么這些實(shí)驗(yàn)室要開源自己好不容易訓(xùn)練出來的模型。
它們不會認(rèn)為自己構(gòu)建的每一個模型都必須開源,但都非常有意愿支持開發(fā)者、支持生態(tài),并且把開源進(jìn)一步了解模型的一種方式。
這些公司構(gòu)建LLM,并不是因?yàn)樽分馃狳c(diǎn),想在新潮技術(shù)里刷存在感。
這一切的背后,是一種Nathan沒有想過強(qiáng)烈的深層愿望:
把技術(shù)棧掌控在自己手中。
這也讓Nathan在文章結(jié)尾,直言自己有些許焦慮:
如果說我不希望美國實(shí)驗(yàn)室在AI的每個領(lǐng)域都保持明確領(lǐng)先——特別是在開源模型這塊——那我就是在騙人。
我是美國人,這是一個誠實(shí)的偏好。
我希望開源生態(tài)能在全球繁榮。這能為世界創(chuàng)造更安全、更可及、更有用的AI。
但現(xiàn)在的問題是,硅谷是否能保住這個領(lǐng)導(dǎo)地位?
歸根結(jié)底,依舊是在談中國開源文化這件事。
關(guān)于這一點(diǎn),Nathan說了一句非常有畫面感的話,很適合用作結(jié)尾:
當(dāng)我從筆記本電腦上抬起頭,總能看到地平線上的一簇簇起重機(jī)。
這跟中國的開源精神,顯然是一脈相承的。
Nathan報告原文: https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
文章來源:量子位。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.