一場(chǎng)原本圍繞“理想主義與商業(yè)化背叛”的世紀(jì)庭審,突然變了味。
在加州聯(lián)邦法庭上,Elon Musk被追問(wèn)一個(gè)看似技術(shù)細(xì)節(jié)的問(wèn)題:你們有沒(méi)有用OpenAI的模型訓(xùn)練自己的AI?
他的回答并不復(fù)雜——“部分(Partly)”。
但真正引爆行業(yè)的,不是這句承認(rèn),而是他緊接著補(bǔ)的一句話:
“基本所有AI公司都會(huì)這么做。”
一瞬間,一個(gè)原本藏在技術(shù)幕后、行業(yè)默認(rèn)但從不公開(kāi)討論的做法,被直接搬上了法庭中央。
這個(gè)詞,叫“蒸餾”。
01 什么是“蒸餾”?一句話講清楚
如果用最直白的方式解釋?zhuān)罢麴s”其實(shí)不是偷,而是“學(xué)”。
更具體一點(diǎn),是讓一個(gè)更強(qiáng)的AI當(dāng)老師,把能力“教”給一個(gè)更小、更便宜的AI。
權(quán)威解釋也很一致:蒸餾是用一個(gè)模型去訓(xùn)練另一個(gè)模型,讓后者模仿前者的行為與輸出,從而在更低成本下實(shí)現(xiàn)類(lèi)似能力。
可以打個(gè)比方:不是把清華教材復(fù)印回家,而是連續(xù)問(wèn)清華教授上萬(wàn)道題,然后整理出一套自己的講義。結(jié)果可能非常接近,但路徑完全不同。
02 為什么“蒸餾”會(huì)成為行業(yè)剛需?
答案很簡(jiǎn)單:錢(qián)。
訓(xùn)練一個(gè)頂級(jí)大模型,成本極高。業(yè)內(nèi)普遍認(rèn)為,領(lǐng)先模型的訓(xùn)練成本動(dòng)輒上億美元級(jí)別。
但蒸餾改變了這件事。
通過(guò)反復(fù)調(diào)用大模型、學(xué)習(xí)輸出結(jié)果,可以在更短時(shí)間內(nèi)做出一個(gè)“差不多好用”的模型,成本甚至可以壓縮到原來(lái)的零頭。
這也是為什么硅谷對(duì)這個(gè)技術(shù)既依賴(lài),又警惕。
OpenAI、Anthropic等公司一邊使用蒸餾優(yōu)化自家模型,一邊又試圖防止別人對(duì)自己做同樣的事情。
因?yàn)橐坏┦Э兀瑔?wèn)題就變了:
你投入100億做出來(lái)的能力,別人可能用1%的成本就“復(fù)刻”。
03 xAI到底做了什么?爭(zhēng)議的真正焦點(diǎn)
回到這次庭審。根據(jù)多家權(quán)威媒體報(bào)道,馬斯克承認(rèn):
xAI確實(shí)使用了“模型蒸餾”
并且“部分”使用了OpenAI的模型進(jìn)行訓(xùn)練
關(guān)鍵點(diǎn)就在這里。行業(yè)內(nèi)部蒸餾,是標(biāo)準(zhǔn)操作。
但問(wèn)題是:你蒸的是“自己的模型”,還是“競(jìng)爭(zhēng)對(duì)手的模型”?
這兩者,本質(zhì)完全不同。
04 “行業(yè)慣例”這句話,有多少是真的?
馬斯克說(shuō)“大家都這么干”,并非完全沒(méi)有依據(jù)。
現(xiàn)實(shí)情況是:
AI公司確實(shí)會(huì)用其他模型做測(cè)試和對(duì)比
蒸餾本身是成熟技術(shù),學(xué)術(shù)界早在十年前就提出
但這里存在一個(gè)被刻意模糊的邊界:
行業(yè)普遍接受的是——用自己的模型蒸餾自己的模型
而爭(zhēng)議最大的,是——用競(jìng)爭(zhēng)對(duì)手的閉源模型,系統(tǒng)性訓(xùn)練自己的模型
后者,已經(jīng)進(jìn)入“灰色地帶”。
甚至有公司直接采取封鎖措施。比如Anthropic就曾因擔(dān)心違規(guī)使用,限制其他AI公司訪問(wèn)其模型接口。
05 這件事真正刺痛行業(yè)的地方
如果只是技術(shù)爭(zhēng)議,不至于鬧到法庭。
真正的沖突,是商業(yè)邏輯。
過(guò)去幾年,AI行業(yè)的基本假設(shè)是:
誰(shuí)投入更多算力、更多數(shù)據(jù),誰(shuí)就能建立長(zhǎng)期優(yōu)勢(shì)。
但蒸餾在動(dòng)搖這個(gè)前提。
華爾街日?qǐng)?bào)此前分析指出,蒸餾可以讓一個(gè)新模型在更短時(shí)間、用更低成本達(dá)到接近領(lǐng)先模型的水平,這正在沖擊巨頭的商業(yè)模型。
換句話說(shuō):領(lǐng)先者花巨資“造山”,后來(lái)者用蒸餾“抄路徑”。
山還在,但門(mén)檻被拆了。
06 更深一層:為什么各國(guó)政府也開(kāi)始介入?
事情還在升級(jí)。
不僅是公司之間的競(jìng)爭(zhēng),已經(jīng)開(kāi)始涉及國(guó)家層面。
美國(guó)政府已明確表示,將關(guān)注外國(guó)企業(yè)通過(guò)蒸餾獲取美國(guó)AI能力的問(wèn)題,并與企業(yè)共享相關(guān)情報(bào)。
原因很現(xiàn)實(shí):AI不再只是商業(yè)工具,而是戰(zhàn)略資源。
如果蒸餾失控,相當(dāng)于:
技術(shù)擴(kuò)散速度遠(yuǎn)超監(jiān)管能力。
07 結(jié)局還沒(méi)到,但方向已經(jīng)很清楚
這場(chǎng)庭審還沒(méi)結(jié)束,Sam Altman、微軟CEOSatya Nadella等關(guān)鍵人物還將出庭。
但有一件事已經(jīng)確定:蒸餾,從幕后走到了臺(tái)前。它不再只是一個(gè)工程技巧,而是一個(gè)行業(yè)分水嶺。
08 寫(xiě)在最后
如果用一句話總結(jié)這件事:這不是“抄不抄”的問(wèn)題,而是——AI能力,究竟能不能被復(fù)制。
一旦答案是“可以”,那整個(gè)行業(yè)的游戲規(guī)則,都要重寫(xiě)。
來(lái)源 | 盧山說(shuō)AI精進(jìn)
(ID:KEEP-POLISH)
作者 | 盧山 LUCENT LU ; 編輯 | 蝦餃
內(nèi)容僅代表作者獨(dú)立觀點(diǎn),不代表早讀課立場(chǎng)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.