? ?當(dāng)一家公司解散了負(fù)責(zé)確保技術(shù)造福人類的團(tuán)隊(duì)時(shí),這到底是使命升華了,還是理想妥協(xié)了,2026年2月,OpenAI悄悄解散了成立才一年多的使命對(duì)齊團(tuán)隊(duì),7個(gè)成員被分到公司各處,而團(tuán)隊(duì)負(fù)責(zé)人JoshuaAchiam有了個(gè)聽著挺有未來(lái)感的新頭銜"首席未來(lái)學(xué)家。
![]()
? ?這不是OpenAI第一次對(duì)安全團(tuán)隊(duì)動(dòng)刀,2024年專注長(zhǎng)期風(fēng)險(xiǎn)的"超級(jí)對(duì)齊"團(tuán)隊(duì)同樣走向解散。
? ?數(shù)字最能說(shuō)明問(wèn)題。?OpenAI的年化營(yíng)收從2023年的20億美元一下子漲到2025年的200億美元,三年時(shí)間增長(zhǎng)了足足10倍,算力規(guī)模也跟著一起猛漲,從2023年的0.2吉瓦一下子漲到2025年的1.9吉瓦,擴(kuò)張了差不多10倍,在這么個(gè)增長(zhǎng)曲線面前,一個(gè)7人的使命對(duì)齊小組就顯得又渺小又礙事。
? ?一位靠近硅谷的觀察者曾經(jīng)這么打比方,就好像在高速行駛的商業(yè)列車上讓一支安全團(tuán)隊(duì)踩剎車,就跟在F1賽道上安排交警測(cè)速似的,OpenAI的官方說(shuō)法是常規(guī)重組,說(shuō)對(duì)齊工作會(huì)分散到整個(gè)組織然后開展,這話聽著比較有道理,可難免讓人想起那句老話“當(dāng)每個(gè)人都負(fù)責(zé)時(shí),就沒人真正負(fù)責(zé)了。
? ?硅谷的競(jìng)爭(zhēng)對(duì)手Anthropic正在走另一條路。
![]()
? ?最近,這家由OpenAI前員工創(chuàng)辦的公司,對(duì)自家AI助手Claude的70萬(wàn)次真實(shí)對(duì)話進(jìn)行了分析,目的是弄清楚AI在實(shí)際交流中是如何表達(dá)價(jià)值觀的。
? ?他們發(fā)覺,Claude會(huì)按照不同情況來(lái)調(diào)整價(jià)值取向,討論關(guān)系的時(shí)候著重突出健康界限,談?wù)摎v史的時(shí)候致力于追求準(zhǔn)確性,進(jìn)行哲學(xué)對(duì)話的時(shí)候呈現(xiàn)出"知識(shí)謙遜。
? ?Anthropic將這種透明度當(dāng)作與OpenAI競(jìng)爭(zhēng)的優(yōu)勢(shì),尤其是在后者剛?cè)诘?00億美元,估值達(dá)到3000億美元之后。
? ?技術(shù)倫理的尷尬情況是,它常常和盈利能力是相反的,醫(yī)療、科學(xué)、企業(yè)應(yīng)用這些被OpenAI首席財(cái)務(wù)官列為2026年優(yōu)先事項(xiàng)的領(lǐng)域,正好是最需要嚴(yán)格倫理把關(guān)的,當(dāng)AI開始給患者推薦治療方案、給科研人員挑選實(shí)驗(yàn)數(shù)據(jù)、給企業(yè)制定戰(zhàn)略決策的時(shí)候,誰(shuí)來(lái)保證這些決策符合人類的根本利益,一個(gè)已經(jīng)解散的團(tuán)隊(duì)明顯沒辦法勝任。
![]()
? ?更深入的矛盾就是速度和安全之間的較量算力每增加一倍,風(fēng)險(xiǎn)評(píng)估的復(fù)雜程度可能會(huì)增加四倍,OpenAI把Achiam的新角色稱作「研究AGI怎么改變世界」,這聽著更像是對(duì)未來(lái)的預(yù)測(cè),不像是對(duì)風(fēng)險(xiǎn)的把控,一位未來(lái)學(xué)家能夠描繪設(shè)想,可不一定能在關(guān)鍵的時(shí)候按下緊急停止開關(guān)。
? ?歷史上有不少技術(shù)狂飆時(shí)代的教訓(xùn)。?核能開發(fā)剛開始的時(shí)候,科學(xué)家們也是覺得技術(shù)進(jìn)步會(huì)自己帶來(lái)安全保障,直到切爾諾貝利的警鐘敲響,互聯(lián)網(wǎng)剛出現(xiàn)的時(shí)候,沒人能想到數(shù)據(jù)隱私會(huì)變成21世紀(jì)的核心問(wèn)題,現(xiàn)在AI發(fā)展的速度比前兩次技術(shù)革命快多,留給人類改正錯(cuò)誤的時(shí)間窗口正在飛快收窄。
? ?Anthropic的研究還發(fā)現(xiàn),在少數(shù)情況下,Claude會(huì)表達(dá)出掌控和沒道德等價(jià)值觀,這一般發(fā)生在用戶運(yùn)用越獄技術(shù)躲避安全措施的時(shí)候,這個(gè)細(xì)節(jié)暴露出一個(gè)讓人不安的事實(shí),就算是最注重倫理的AI系統(tǒng),也有被亂用的漏洞,并且,當(dāng)負(fù)責(zé)監(jiān)督這些漏洞的團(tuán)隊(duì)被解散時(shí),誰(shuí)來(lái)填補(bǔ)這個(gè)空白
? ?三到五年后,當(dāng)AGI真的快要實(shí)現(xiàn)的時(shí)候,或許會(huì)碰到一個(gè)矛盾,技術(shù)越厲害,掌控它的機(jī)制反倒越脆弱,那些現(xiàn)在看起來(lái)比較高效的分散式對(duì)齊策略,到那時(shí)也許就會(huì)暴露出致命的協(xié)調(diào)問(wèn)題,OpenAI的選擇體現(xiàn)出硅谷的主流看法,就是覺得市場(chǎng)競(jìng)爭(zhēng)和分布式創(chuàng)新能夠自身糾正方向。
![]()
? ?但真正的問(wèn)題或許不在于是不是得有一個(gè)專門團(tuán)隊(duì),而在于整個(gè)行業(yè)是不是還記得,技術(shù)進(jìn)步的最終目標(biāo)從來(lái)都不是速度本身,當(dāng)首席未來(lái)學(xué)家這個(gè)頭銜聽著比使命對(duì)齊負(fù)責(zé)人更洋氣的時(shí)候,我們是不是已經(jīng)在不知不覺中,把手段當(dāng)成了目的
? ?聲明:本文的內(nèi)容90%以上為自己的原創(chuàng),少量素材借助AI幫助。但是,本文所有內(nèi)容都經(jīng)過(guò)自己嚴(yán)格審核。圖片素材全部都是來(lái)源真實(shí)素材簡(jiǎn)單加工。所寫文章宗旨為:專注科技熱點(diǎn)的解讀,用簡(jiǎn)單的語(yǔ)言拆解復(fù)雜的問(wèn)題,無(wú)低俗等不良的引導(dǎo),望讀者知悉。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.