Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
猛獸要出籠了。
就在剛剛,Anthropic那個(gè)被傳得神乎其神的最強(qiáng)模型——
Claude Mythos,釋放出了預(yù)覽版。
![]()
爆料說(shuō)得沒(méi)錯(cuò),這的確是款劃時(shí)代的模型。
各種benchmark上,全方位碾壓Opus 4.6。
并非擠牙膏,真的是「碾壓」……
- SWE-bench Pro:修bug能力,暴漲24%
- SWE-bench Verified:拿嚴(yán)格版又測(cè)了一遍,仍有13%的提升。
- Terminal-Bench 2.0:電腦操作類Agent能力,提升17%。
![]()
![]()
比Opus 4.6還強(qiáng)的模型?還給Opus壓著打??
朋友們,這到底會(huì)會(huì)是個(gè)什么模樣,我已經(jīng)完全想象不到了。
繼十四行詩(shī)、巨作后,OpenAI如今迎來(lái)其最嚴(yán)厲的父親——
Mythos,神話。
![]()
但這一次,Anthropic并不想談benchmark。
相比于興奮和炫耀,官宣博客的字里行間,反而隱隱透出一絲難以掩飾的「擔(dān)憂」。
甚至,是恐慌。
因?yàn)檫@款神話模型,存在致命「缺陷」。
Mythos Preview已經(jīng)發(fā)現(xiàn)了數(shù)千個(gè)高危漏洞,各大主流操作系統(tǒng)和瀏覽器,無(wú)一幸免。
沒(méi)錯(cuò),在AI編程能力飛速提升,越來(lái)越像一名稱職工程師的同時(shí),與之一體兩面的另一項(xiàng)能力,也在無(wú)可避免地野蠻生長(zhǎng)。
現(xiàn)在,Mythos攻擊安全漏洞的能力,已經(jīng)遠(yuǎn)超絕大多數(shù)黑客了。
AI 在代碼層面的能力已經(jīng)強(qiáng)到,在找漏洞和利用漏洞這件事上,可以超過(guò)絕大多數(shù)人類工程師,只剩最頂尖的一小撮還能與之抗衡。
硬幣的另一面,終于翻到了我們面前。
Anthropic表示,照現(xiàn)在AI的發(fā)展速度,這種能力很快就會(huì)擴(kuò)散開(kāi)來(lái),甚至可能被那些不那么安全的人掌握。
一旦失控,對(duì)經(jīng)濟(jì)、公共安全來(lái)說(shuō),都將是滅頂之災(zāi)。
為了給所有人留下足夠的時(shí)間來(lái)應(yīng)對(duì),在首次官宣這個(gè)新模型時(shí),Anthropic做出了一項(xiàng)對(duì)于AI公司來(lái)說(shuō),非常反常的舉動(dòng)。
暫時(shí)不向公眾開(kāi)放。
是的,Mythos會(huì)作為玻璃翼計(jì)劃(Project Glasswing)的一部分,先向各個(gè)合作伙伴開(kāi)放。
![]()
他們的任務(wù),是在這頭猛獸徹底出籠前,盡最大的努力,拉起安全護(hù)欄。
被囚禁的Claude Mythos
這是一場(chǎng)聲勢(shì)浩大的「圍剿」。
為了馴服Mythos這頭猛獸,Anthropic幾乎叫上了所有老牌互聯(lián)網(wǎng)巨頭。
參與方包括:Amazon、Apple、Google、Linux Foundation、Microsoft、NVIDIA……
在這個(gè)項(xiàng)目里,沒(méi)有旁觀者。所有合作方都會(huì)把Mythos Preview投入到自身的防御性安全工作中。
他們會(huì)提前解鎖Mythos的真實(shí)能力,將它從籠子里放出來(lái)。
這是一次提前訓(xùn)練。在被Mythos正式版捅成篩子之前,他們會(huì)盡可能利用Mythos預(yù)覽版的能力,加強(qiáng)自己的防御措施。
安全這件事,這次,是動(dòng)真格的。
Anthropic稱會(huì)把過(guò)程中積累的經(jīng)驗(yàn)分享出來(lái),讓整個(gè)行業(yè)都能受益。
項(xiàng)目還額外開(kāi)放給了40多家關(guān)鍵軟件基礎(chǔ)設(shè)施的建設(shè)者和維護(hù)者,讓他們用這個(gè)模型去掃描和加固自研系統(tǒng)以及開(kāi)源系統(tǒng)。
更夸張的是,Anthropic還承諾提供最高1億美元的使用額度來(lái)支持這些工作,甚至直接向開(kāi)源安全組織捐贈(zèng)了400萬(wàn)美元。
![]()
不是,別啊,敢情你是來(lái)真的啊??
好久沒(méi)看到這樣的事了。
之前一直有實(shí)驗(yàn)室說(shuō)在限制自己內(nèi)部模型的能力,但說(shuō)實(shí)話,一直覺(jué)得是種公關(guān)作秀。
而這次的玻璃翼計(jì)劃,第一次讓我切切實(shí)實(shí)地,感到后背發(fā)涼。
一款這么強(qiáng)大的模型,卻死死捏著不發(fā),搞出這么大的動(dòng)靜,只為了宣布一項(xiàng)安全計(jì)劃。
主要重視程度完全不是一個(gè)級(jí)別的,誰(shuí)家會(huì)為了宣傳,還專門給別人送這么多錢?
原來(lái)Pro和Max用戶們像漏水一樣的Token usage,都用來(lái)支持你們的安全事業(yè)了是吧(doge)。
![]()
也行。
畢竟,如果Mythos的能力真像如今公布的那樣,這款模型的發(fā)布,無(wú)疑會(huì)徹底改變網(wǎng)絡(luò)安全格局。
AI安全,真的不再是部分科學(xué)家的「杞人憂天」,這只猛獸,已經(jīng)隔著籠子發(fā)出了第一聲嘶吼。
玻璃翼計(jì)劃只是個(gè)起點(diǎn)。
Anthropic表示,網(wǎng)絡(luò)安全這件事沒(méi)有任何一家機(jī)構(gòu)可以單獨(dú)解決,前沿 AI 公司、軟件廠商、安全研究員、開(kāi)源社區(qū)、各國(guó)政府都得一起參與。
防御全球網(wǎng)絡(luò)基礎(chǔ)設(shè)施可能是一個(gè)持續(xù)數(shù)年的工程,而AI的能力在接下來(lái)幾個(gè)月就可能發(fā)生明顯躍遷。
如果想不被AI捅成篩子,現(xiàn)在,立刻,馬上就得動(dòng)起來(lái)。
猛獸出籠了
Token usage燒的飛快,Pro用戶「降級(jí)」成免費(fèi)用戶,OpenClaw被斷水?dāng)嗉Z,Claude Code莫名其妙的開(kāi)源……
一切,似乎都有了理由。
Anthropic可能真忙暈頭了。
Mythos的安全問(wèn)題,已經(jīng)嚴(yán)重到讓團(tuán)隊(duì)內(nèi)部無(wú)心關(guān)注其他項(xiàng)目,只得押上自己手中所有的GPU,全部押注到安全上來(lái)。
因?yàn)椤?/p>
猛獸,要出籠了。
參考鏈接:
[1]https://x.com/alexalbert__/status/2041579938537775160?s=46&t=iTysI4vQLQqCNJjSmBODPw
[2]https://www.anthropic.com/glasswing
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.