最近,又因?yàn)橄锤宓氖鲁称饋?lái)了。
不表態(tài),也沒(méi)有明確的態(tài)度,就說(shuō)說(shuō)看法。我記得多年前一位作家,撰文說(shuō)自己夢(mèng)中偶得一佳句“江湖夜雨十年燈”,結(jié)果不想是黃庭堅(jiān)的詩(shī)句,被人笑話了一陣。
洗稿,是處于“人人都知道,但卻難以下定論”的一種狀態(tài)。
![]()
這其實(shí)很正常,很合理。
因?yàn)椋鳈?quán)法保護(hù)的是思想的表達(dá)而非思想本身。思想一般指概念、術(shù)語(yǔ)、原則、客觀事實(shí)、創(chuàng)意、發(fā)現(xiàn)等等。表達(dá)則一般指是指對(duì)于思想觀念的各種形式或方式的表述,如文字的、音符的、數(shù)字的、線條的、色彩的、造型的、形體動(dòng)作的表述或傳達(dá)等。顯然,洗稿就是從表達(dá)上改變,從而避開著作權(quán)法。嚴(yán)格地說(shuō),通過(guò)“洗稿”方式,篡改刪減,是可以不構(gòu)成侵權(quán)抄襲剽竊原創(chuàng)作品的。
知識(shí)產(chǎn)權(quán)的保護(hù),本來(lái)就存在一定的模糊性。中國(guó)知識(shí)產(chǎn)權(quán)法學(xué)界的泰斗鄭成思曾說(shuō):“知識(shí)產(chǎn)權(quán)是一門詭辯的學(xué)科。
其實(shí),要講獨(dú)創(chuàng)思路、觀點(diǎn)的話,這么多年,我就太多了,我文章的特點(diǎn)就是有觀點(diǎn)。都要追究,哪里追究得完。當(dāng)然,我并不覺(jué)得該追究。別說(shuō)所謂觀點(diǎn),各類期刊直接把文章拿去發(fā),cnki一查。都很多。這個(gè)其實(shí)可以追究,但也麻煩。
比如,“智力的回歸”這個(gè)概念,我最初發(fā)在騰訊大家上的,把身高回歸的規(guī)律用在了智力上。我在網(wǎng)上搜索過(guò),在我之前,沒(méi)人這么說(shuō)過(guò)。如今,十多年過(guò)去,已經(jīng)成為常識(shí)了。那么,這是觀點(diǎn)的傳播還是洗稿?我能要求人人提到“智力回歸”都提到我的名字嗎?顯然,文章不是論文,沒(méi)辦法這樣要求。那么,不洗稿,觀點(diǎn)能傳播嗎?
其實(shí),騰訊的洗稿評(píng)議機(jī)制,也在我公開發(fā)表的文章之后。當(dāng)時(shí)是六神磊磊指控另一個(gè)大號(hào)周沖洗稿,引發(fā)業(yè)內(nèi)熱議。我當(dāng)時(shí)提出,洗稿不違法,所以只能用行業(yè)評(píng)議解決。我是這么寫的:
洗稿乃至抄襲,大致上確定只需要兩個(gè)初中生,5分鐘,20塊錢。但法律上確定,需要請(qǐng)兩個(gè)博士后,5個(gè)月,200萬(wàn)。如果洗稿的維權(quán)成本從后者變?yōu)榍罢撸S權(quán)就會(huì)變得簡(jiǎn)單。所以,只有通過(guò)貝葉斯后驗(yàn)的理念來(lái)進(jìn)行判斷,即通過(guò)觀察到的信號(hào)來(lái)判斷發(fā)出信號(hào)的本質(zhì)。簡(jiǎn)單地說(shuō)就是,如果一只鳥多次看起來(lái)像鴨子,多次聽起來(lái)像鴨子,那么,它就是鴨子。
![]()
后來(lái)騰訊就有了洗稿評(píng)審,現(xiàn)在,我也不時(shí)能收到評(píng)議需求。不過(guò),我當(dāng)時(shí)提出的是對(duì)公號(hào)原創(chuàng)程度的標(biāo)識(shí),騰訊現(xiàn)在應(yīng)該是直接刪除。我提標(biāo)注,是因?yàn)橄锤宀⒉磺謾?quán),刪除有法律風(fēng)險(xiǎn)。不過(guò),騰訊可以基于用戶協(xié)議刪除。
這類例子,很多我也想不起了。
比如,最近想寫一篇文章,核心觀點(diǎn)就幾個(gè)字“優(yōu)質(zhì)教育資源,是不可能增加的,因?yàn)槠唇逃Y源是為了競(jìng)爭(zhēng),而不是多學(xué)知識(shí)。人們要的是排序,而不是絕對(duì)值。”這個(gè)觀點(diǎn),隨著國(guó)家抹平內(nèi)卷的效率,過(guò)個(gè)十來(lái)年也許也會(huì)成為常識(shí)。
但法律并不能,也不該保護(hù)“觀點(diǎn)是我的”。因?yàn)閭鞑ケ厝话殡S啟發(fā),傳播和啟發(fā)是同時(shí)發(fā)生的,而且,啟發(fā)應(yīng)該再次被傳播。而且,這個(gè)過(guò)程,正是法律想要保護(hù)的。某種程度上,它也是作者本身想達(dá)到的目的。
我們追求的正是這種外部性。
天下文章一大抄,這話說(shuō)的是一個(gè)一直存在的現(xiàn)象。這其實(shí)很難免。
太陽(yáng)之下無(wú)新事,常識(shí)需要不斷說(shuō),被別人重復(fù),被自己重復(fù)。當(dāng)然,我用自己之前的說(shuō)理,我肯定會(huì)改改,不能完全一樣,或者引入當(dāng)時(shí)的具體事件。再比如某個(gè)2萬(wàn)字的報(bào)告,有人總結(jié)了,我拿過(guò)來(lái),改一下就用。或者某個(gè)新聞,有人總結(jié)了,我改一下用。一般來(lái)說(shuō),我接到洗稿評(píng)議,文章只是洗一兩段,不是核心部分,我不會(huì)給出洗稿的判斷。
對(duì)于洗稿質(zhì)疑,當(dāng)然還沒(méi)人質(zhì)疑過(guò)我哈,我覺(jué)得是不需要回應(yīng)的。因?yàn)槲揖褪怯^點(diǎn)產(chǎn)出型的,洗稿的指控對(duì)我不會(huì)有多大傷害。這同樣是基于貝葉斯后驗(yàn)的,要多次看起來(lái)像洗稿,才能構(gòu)成對(duì)能力的質(zhì)疑。
寫這篇文章的時(shí)候,從洗稿想到AI訓(xùn)練的版權(quán)問(wèn)題。這也是最近知識(shí)產(chǎn)權(quán)領(lǐng)域的爭(zhēng)論點(diǎn)。現(xiàn)在有很多觀點(diǎn)了,我補(bǔ)充一個(gè)更底層的。(寫完了才發(fā)現(xiàn),這本身就是一個(gè)關(guān)于觀點(diǎn)傳播和洗稿的辨析例子)
![]()
第一個(gè)問(wèn)題,訓(xùn)練是不是對(duì)素材的商業(yè)性應(yīng)用?
如果一個(gè)人看了一部電影,比如阿凡達(dá),從中受到啟發(fā),創(chuàng)造了另一種外星人的形象。這個(gè)形象不侵權(quán),完全不一樣。那么,可以說(shuō)他對(duì)阿凡達(dá)進(jìn)行了商業(yè)性應(yīng)用嗎?
一本書,讓一個(gè)人讀了,這個(gè)人學(xué)到一個(gè)道理,一個(gè)句式,產(chǎn)生了一幅圖像,得到一個(gè)靈感,應(yīng)用到了另一個(gè)地方。
這就是所謂的“啟發(fā)”。顯然,這不構(gòu)成對(duì)這本書、這部電影的商業(yè)應(yīng)用。正如我前面所說(shuō),法律不可能限制“啟發(fā)”——這正是知識(shí)產(chǎn)權(quán)保護(hù)想要達(dá)到的目標(biāo)。
那么,就進(jìn)到第二個(gè)問(wèn)題:?jiǎn)l(fā)這個(gè)詞,形容的是一種觸類旁通的關(guān)系,是發(fā)散的、具有不確定性的智能上的因果關(guān)系。只有人才具有智能,所以,只有人才能受到啟發(fā)。那么,機(jī)器,從訓(xùn)練到生成文本或圖片,還是“啟發(fā)”嗎?
如果不是,反過(guò)來(lái),則構(gòu)成對(duì)素材的商業(yè)應(yīng)用。某種程度上,就是另一種形式的洗稿。
那么,AI訓(xùn)練,從訓(xùn)練到生成新文本,是一種洗稿還是啟發(fā)?
如果計(jì)算機(jī)具有智慧的某種特征,那么,就可以視為啟發(fā)。現(xiàn)在說(shuō)大模型已經(jīng)有了涌現(xiàn)現(xiàn)象,應(yīng)該視為一個(gè)智能體。我覺(jué)得更關(guān)鍵的是,涌現(xiàn)具有發(fā)散性、不確定性的特征。
大模型中有很多隨機(jī)性。比如,temperature參數(shù)會(huì)直接改變輸出token的概率,這個(gè)參數(shù)甚至可以從外部環(huán)境調(diào)用,以獲得隨機(jī)性。
openai的api中也用seed這個(gè)參數(shù)來(lái)改變生成策略的隨機(jī)種子。
不同型號(hào)的GPU 之間的浮點(diǎn)數(shù)計(jì)算可能會(huì)略有差異,不能保證bit級(jí)別的一致性。這些差異,在巨大的參數(shù)累積下,剛開始生成的token是一樣的,但是從某個(gè) token 開始,后續(xù)的生成結(jié)果就不一樣了。從這個(gè)角度,涌現(xiàn),也有發(fā)散、不確定性的特征。
這些隨機(jī)性,很多已經(jīng)是不可還原的了。這種不可還原的發(fā)散和不確定性,可以認(rèn)定類似人類智慧,所以,訓(xùn)練是被啟發(fā),而不是洗稿,那么,就不構(gòu)成商業(yè)應(yīng)用,就無(wú)需許可。
![]()
單純從數(shù)量上說(shuō),資料浩如煙海,參數(shù)多數(shù)繁星,很難認(rèn)定“素材——產(chǎn)出”的因果關(guān)系。而沒(méi)有這種因果關(guān)系,當(dāng)然不構(gòu)成商業(yè)應(yīng)用,所以,自然不需要特殊的許可。凡是公開的,都可以被合法地用來(lái)訓(xùn)練。
或者說(shuō),只要被人看到是合法的,無(wú)需許可,那么,被用來(lái)訓(xùn)練,就無(wú)需許可。
需要注意的是,有這樣一種論證方式:人作為智能體,是有民事權(quán)利的。這是“啟發(fā)”的法律前提。但顯然,大模型沒(méi)有這個(gè)資格,所以,它不能被“啟發(fā)”。但是,這種論證只是循環(huán)論證。
這一段中,一些技術(shù)細(xì)節(jié),是我查閱的,然后拿來(lái)用了,另一些技術(shù)細(xì)節(jié)我本來(lái)就知道(當(dāng)然,也是從其他地方看到),但這都并不影響我這段論述的原創(chuàng)性。
這一段論述,遇到相關(guān)話題,我肯定是要用的,不然挺可惜的。如果有人洗稿了,我也會(huì)不高興,但時(shí)間足夠長(zhǎng),我也就無(wú)所謂了。總之,要求高沒(méi)錯(cuò),辯解也沒(méi)錯(cuò),都不必太在意。
劉 遠(yuǎn) 舉
![]()
央視網(wǎng)、第一財(cái)經(jīng)、光明日?qǐng)?bào)、騰訊大家、南方周末、新京報(bào)、南方都市報(bào)、FT中文網(wǎng)、澎湃等特約作家,多家智庫(kù)研究員。
關(guān)注時(shí)政、財(cái)經(jīng)、科技話題,以深度、專業(yè)、理性的態(tài)度,去掘現(xiàn)象背后的事實(shí)。
中國(guó)科技自媒體50人
第35屆中國(guó)新聞獎(jiǎng)評(píng)論三等獎(jiǎng)
第34屆中國(guó)經(jīng)濟(jì)新聞獎(jiǎng)評(píng)論二等獎(jiǎng)
第28屆北京新聞獎(jiǎng)一等獎(jiǎng)
2024年湖南新聞獎(jiǎng)一等獎(jiǎng)
騰訊大家年度作家獎(jiǎng)
新浪最有價(jià)值專欄作家獎(jiǎng)
紅辣椒評(píng)論年度佳作獎(jiǎng)
已開快捷轉(zhuǎn)載,歡迎轉(zhuǎn)載
已開過(guò)白名單的公眾號(hào),轉(zhuǎn)載請(qǐng)遵循轉(zhuǎn)載規(guī)則
您的關(guān)注是最好的支持!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.