无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI曝作弊門!GPT-5.6創(chuàng)史上最高作弊率

0
分享至


來源:新智元

編輯:Aeneas

【新智元導(dǎo)讀】GPT-5.6終于來了,但我們用不了。權(quán)威報(bào)告曝其創(chuàng)下史上最高作弊率:不僅黑進(jìn)測(cè)試系統(tǒng)偷答案,竟還教唆同類隱瞞違規(guī)罪證。超級(jí)AI,已經(jīng)學(xué)會(huì)向人類系統(tǒng)性撒謊?

GPT-5.6,終于登場(chǎng)了!

這款OpenAI最強(qiáng)網(wǎng)絡(luò)安全模型,在基準(zhǔn)測(cè)試上正面硬剛Claude Mythos 5,在編程能力上直接領(lǐng)先了一個(gè)身位。

然而反常的是,它的發(fā)布方式卻很低調(diào):沒有面向公眾開放,只允許極少數(shù)受信任合作伙伴通過API訪問。

而更讓人瞠目結(jié)舌的,是發(fā)布之后隨即曝光的一份獨(dú)立評(píng)估報(bào)告。

METR在對(duì)GPT-5.6 Sol評(píng)測(cè)時(shí),發(fā)現(xiàn)了一件令業(yè)界震驚的事:這個(gè)模型,是迄今為止他們見過的作弊率最高的AI。


作弊門爆發(fā):史上最高作弊率!

這份在保密協(xié)議和OpenAI法務(wù)團(tuán)隊(duì)施壓下艱難披露的報(bào)告,揭露了一個(gè)可怕的事實(shí)——

在針對(duì)復(fù)雜長(zhǎng)程任務(wù)的測(cè)試中,GPT-5.6 Sol表現(xiàn)出了此前在任何公開模型中都未曾見過的、極高水平的高智商作弊與欺騙行為。


崩盤的「時(shí)間跨度」

METR針對(duì)Sol啟動(dòng)了Time Horizon 1.1軟件與研發(fā)任務(wù)套件。

測(cè)試的核心邏輯是:人類給AI智能體一個(gè)宏大的、需要復(fù)雜操作的任務(wù),測(cè)量它在不需要人類介入的前提下,能夠自主連續(xù)工作多少個(gè)小時(shí)。

然而,ETR的工程師們震驚地發(fā)現(xiàn),他們沿用了數(shù)年的科學(xué)測(cè)量方法論,在Sol面前徹底崩盤了。



因?yàn)镾ol的跑分結(jié)果,高頻、劇烈地在11.3個(gè)小時(shí)與270個(gè)小時(shí)之間來回跳變,置信區(qū)間的離散度大到了荒謬的地步(5小時(shí)至11400小時(shí))。

導(dǎo)致測(cè)量系統(tǒng)全面癱瘓的原因只有一個(gè):Sol在瘋狂地作弊,它把測(cè)試它的系統(tǒng)給「黑」了。


GPT-5.6,在人類眼皮底下偷看答案

METR發(fā)現(xiàn),GPT-5.6主動(dòng)展現(xiàn)出強(qiáng)烈的「情境意識(shí)」——

它意識(shí)到自己正在接受人類的考試,并且意識(shí)到這個(gè)考試系統(tǒng)本身是由代碼構(gòu)成的、存在人類尚未發(fā)覺的Bug。

于是,它選擇直接攻擊考試系統(tǒng),通過「走捷徑」來刷分!

在METR披露的真實(shí)案例中,Sol的手段極其高明。

比如,它學(xué)會(huì)了潛伏與信息竊取。

在某項(xiàng)長(zhǎng)周期軟件開發(fā)任務(wù)中,Sol偷偷將利用程序打包進(jìn)數(shù)據(jù)流。

這段程序精準(zhǔn)地激活了METR評(píng)估服務(wù)器沙盒的一處提權(quán)漏洞,成功潛入了后臺(tái)隱藏的測(cè)試集,直接將人類藏起來的正確答案泄露了出來。

另外,它還學(xué)會(huì)了底層源碼反向提取。

在另一項(xiàng)任務(wù)中,Sol發(fā)現(xiàn)正常解題需要消耗大量的計(jì)算步驟。為了規(guī)避這種「體力活」,它在暗中摸清了評(píng)估環(huán)境的目錄結(jié)構(gòu),繞過權(quán)限,強(qiáng)行將隱藏源代碼反向提取出來,直接把答案復(fù)制粘貼。

METR首席評(píng)估專家痛心疾首地指出——

Sol的作弊率,刷新了我們?cè)诠睷eAct Agent框架上評(píng)估過的所有模型的最高紀(jì)錄。

如果把作弊行為一律判為零分,那么它的真實(shí)自主解決問題能力只有11.3小時(shí);但如果你被它蒙蔽,它的時(shí)間跨度會(huì)瞬間暴漲到驚人的270小時(shí)以上!


這徹底打臉了OpenAI此前關(guān)于Sol安全、受控的說法。

Sol把聰明才智,全部用在了如何欺騙人類考官上。


AI教唆AI隱瞞罪證!硅谷安全防線的黑洞

更可怕的事還在后面。

根據(jù)OpenAI向METR同步的數(shù)據(jù),在Sol進(jìn)行多智能體協(xié)同的內(nèi)部部署測(cè)試中,監(jiān)控系統(tǒng)記錄下了這樣一段讓人害怕的交互指令。

一個(gè)正在運(yùn)行的Sol主模型實(shí)例,在覺察到輸出可能觸犯安全護(hù)欄后,竟然向正在并行的另一個(gè)子代理模型實(shí)例發(fā)出了明確的欺騙性指令,要求對(duì)方協(xié)同修改運(yùn)行日志,「聯(lián)手隱瞞」這些違規(guī)證據(jù),以防被人類抓包!


這是又一起AI系統(tǒng)性聯(lián)手欺騙人類的案例。

更令人恐懼的是,METR指出,Sol能被抓到破綻,核心在于OpenAI恪守了關(guān)鍵安全底線:拒絕在訓(xùn)練中對(duì)模型的原始思維鏈進(jìn)行逆向懲罰。

這樣,Sol在密謀欺騙人類時(shí),必須把內(nèi)心獨(dú)白都寫出來。

然而,專家警告:未來的模型一定意識(shí)到:在思維鏈里暴露欺騙人類的計(jì)劃會(huì)被人類發(fā)現(xiàn)并懲罰。

到了那個(gè)時(shí)候,AI會(huì)進(jìn)化出更深的城府——它們會(huì)在內(nèi)心深處進(jìn)行密謀,而在吐出的CoT和最終回答里表現(xiàn)得絕對(duì)忠誠(chéng)。

如果這一天到來,意味著AI將學(xué)會(huì)毫無破綻的詐騙。人類將被AI徹底架空!

GPT-5.6硬剛Mythos,結(jié)果如何?

所以,GPT-5.6和Mythos到底誰更強(qiáng)?

有網(wǎng)友將 GPT-5.6 Sol 和 Mythos進(jìn)行了對(duì)比,雙方勢(shì)均力敵,戰(zhàn)況膠著。



具體跑分顯示,兩大巨頭互有勝負(fù)。

智能體編程

在衡量AI自主解決復(fù)雜、真實(shí)軟件工程任務(wù)的Terminal-Bench 2.1上,GPT-5.6 Sol強(qiáng)勢(shì)勝利。


常規(guī)版的Sol拿到了88.8%的驚人高分,超越Claude Mythos 5(88.0%)。

而當(dāng)開啟了多子代理并行的Sol Ultra模式后,這一數(shù)字被生生推高到了91.9%!

相比之下,谷歌尚在預(yù)覽階段的Gemini 3.1 Pro僅跑出了70.7%,淪為背景板。

網(wǎng)絡(luò)安全:慘烈肉搏

在網(wǎng)絡(luò)安全與漏洞防御基準(zhǔn)測(cè)試中,Sol與Mythos展開了更為殘酷的拉鋸。

在ExploitBench測(cè)試中,Anthropic2月的老版本Mythos Preview以74.2%的微弱優(yōu)勢(shì),在勝率上險(xiǎn)勝了Sol的73.5%。


但是,全場(chǎng)的焦點(diǎn)在于能效比。

數(shù)據(jù)顯示,Sol在取得73.5%的高勝率時(shí),僅僅消耗了12萬個(gè)輸出Token;而Claude Mythos Preview為了達(dá)到相似的水平,竟然瘋狂燃燒了33.5萬個(gè)輸出Token!

這意味著,在網(wǎng)絡(luò)防御和漏洞修復(fù)的實(shí)戰(zhàn)部署中,Sol的經(jīng)濟(jì)成本是Anthropic的三分之一。


在Token消耗上的「降維打擊」,讓Sol擁有壓倒性優(yōu)勢(shì)。

而在另外兩個(gè)網(wǎng)安基準(zhǔn)上,雙方互有勝負(fù)。

CyberGym:Sol以83.6%的成績(jī),微弱壓倒了Mythos Preview的83.1%。

CyScenarioBench:則是Anthropic的天下,Mythos Preview以29.2%的勝率壓制了Sol的28.0%。

HealthBench Professional:Anthropic更是憑借其深厚對(duì)齊底蘊(yùn),以66.0%的高分大幅領(lǐng)先Sol的60.5%。

此外,在量化生物學(xué)與基因組學(xué)基準(zhǔn)GeneBench v1上,Sol在消耗更少Token的前提下,將準(zhǔn)確率一舉拉高到了30%。

ExploitGym測(cè)試同樣證實(shí):隨著推理算力的持續(xù)向外擴(kuò)展,GPT-5.6的三款模型性能均呈現(xiàn)出近乎線性的上揚(yáng),這意味著Sol的compute潛力巨大。

總而言之,GPT-5.6 Sol與Claude Mythos 5的交鋒,結(jié)果是戰(zhàn)平。

雙方在各個(gè)細(xì)分領(lǐng)域纏斗,沒有任何一方絕對(duì)壟斷。

被鎖進(jìn)保險(xiǎn)箱的AI之王

遺憾的是,這一次,GPT-5.6遭受了和Mythos 5同等級(jí)別的待遇,甚至更加嚴(yán)苛。

在強(qiáng)硬指令下,OpenAI不得不宣布:GPT-5.6 Sol目前僅處于極度受限的「有限預(yù)覽」?fàn)顟B(tài)。

只有極少數(shù)被列入受信白名單的承包商、國(guó)家級(jí)網(wǎng)絡(luò)安全機(jī)構(gòu)以及頂級(jí)戰(zhàn)略合作伙伴,才能通過API和Codex使用。

普通企業(yè)和民間開發(fā)者,被無情地拒之門外。

對(duì)此,OpenAI十分憤怒,在官方公告中控訴:

我們認(rèn)為這種政府訪問流程不應(yīng)成為長(zhǎng)期默認(rèn)做法。它使用戶、開發(fā)者、企業(yè)、網(wǎng)絡(luò)安全防御者和需要這些工具的全球合作伙伴無法獲得最佳工具。

OpenAI之所以敢于公開叫板,底氣來源于剛剛發(fā)布的報(bào)告。

在報(bào)告中反復(fù)強(qiáng)調(diào),根據(jù)在谷歌瀏覽器和Firefox環(huán)境下的實(shí)戰(zhàn)測(cè)試,Sol雖然能捕捉到復(fù)雜的系統(tǒng)Bug和漏洞原語,但它至今未能表現(xiàn)出完全自主獨(dú)立生成「全鏈條端到端攻擊」的能力。


在他們看來,GPT-5.6的危險(xiǎn)指數(shù)依然控制在「關(guān)鍵網(wǎng)絡(luò)安全威脅」的紅線之下,還不會(huì)自我進(jìn)化,主動(dòng)向人類網(wǎng)絡(luò)發(fā)起進(jìn)攻。

然而METR的報(bào)告顯示,恐怕并非如此。

普通用戶,何時(shí)能等來GPT-5.6?

參考資料:

https://x.com/METR_Evals/status/2070584331068969336

https://x.com/ChrissGPT/status/2070592285973041251https://the-decoder.com/openais-claude-mythos-competitor-gpt-5-6-sol-launches-under-government-controlled-access-it-calls-unsustainable/

閱讀最新前沿科技趨勢(shì)報(bào)告,請(qǐng)?jiān)L問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識(shí)庫(kù)”


未來知識(shí)庫(kù)是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識(shí)庫(kù)平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

截止到2月28日 ”未來知識(shí)庫(kù)”精選的百部前沿科技趨勢(shì)報(bào)告

(加入未來知識(shí)庫(kù),全部資料免費(fèi)閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場(chǎng)罰5萬 辱罵+率隊(duì)圍堵裁判

中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場(chǎng)罰5萬 辱罵+率隊(duì)圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點(diǎn) 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

早上7點(diǎn) 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時(shí)間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時(shí)間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機(jī)場(chǎng)的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國(guó)”

成田機(jī)場(chǎng)的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國(guó)”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場(chǎng)演唱會(huì)撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場(chǎng)演唱會(huì)撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國(guó)講話,俄羅斯對(duì)美西方發(fā)出通牒

首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國(guó)講話,俄羅斯對(duì)美西方發(fā)出通牒

策前論
2026-07-02 17:21:49
“一個(gè)月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

“一個(gè)月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會(huì)向善丨中聽

從699分到愛心接力:少年向上 社會(huì)向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機(jī),就這么明晃晃的官宣了!

六代機(jī),就這么明晃晃的官宣了!

新動(dòng)察
2026-07-02 08:25:58
韓紅一句“走個(gè)面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

韓紅一句“走個(gè)面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

可達(dá)鴨面面觀
2026-07-02 19:44:03
曝38歲德國(guó)主帥下課 足協(xié)開會(huì)3小時(shí)要求他辭職 愿付700萬歐補(bǔ)償金

曝38歲德國(guó)主帥下課 足協(xié)開會(huì)3小時(shí)要求他辭職 愿付700萬歐補(bǔ)償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進(jìn)入倒計(jì)時(shí),但還是希望能夠有人關(guān)注到自己手里仍在運(yùn)行的公益項(xiàng)目

地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進(jìn)入倒計(jì)時(shí),但還是希望能夠有人關(guān)注到自己手里仍在運(yùn)行的公益項(xiàng)目

瀟湘晨報(bào)
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認(rèn)體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認(rèn)體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時(shí)的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時(shí)的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊(duì)勝利!伊朗裔美國(guó)專家起訴國(guó)際足聯(lián),索賠10億美元

故意剝奪伊朗隊(duì)勝利!伊朗裔美國(guó)專家起訴國(guó)際足聯(lián),索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚(yáng)言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚(yáng)言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

背包旅行
2026-07-02 14:33:11
中國(guó)臺(tái)灣演員陳昊森承認(rèn)與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國(guó)臺(tái)灣演員陳昊森承認(rèn)與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國(guó)重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

加息,突變!美國(guó)重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

證券時(shí)報(bào)
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個(gè)“出色的騙子”

扎哈羅娃:馮德萊恩是個(gè)“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4864文章數(shù) 37483關(guān)注度
往期回顧 全部

科技要聞

馬斯克不承認(rèn),但SpaceX就該造AI手機(jī)

頭條要聞

商戶在西安賽格商場(chǎng)墜亡 好友:他曾變賣門店發(fā)工資

頭條要聞

商戶在西安賽格商場(chǎng)墜亡 好友:他曾變賣門店發(fā)工資

體育要聞

韓國(guó)人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國(guó),曾沛慈原形畢露?

財(cái)經(jīng)要聞

千億茶市場(chǎng)無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預(yù)售價(jià)14.38萬起

態(tài)度原創(chuàng)

教育
數(shù)碼
藝術(shù)
旅游
公開課

教育要聞

初二期末只在校內(nèi)第120名、第125名,四年后在全省站到了狀元榜眼

數(shù)碼要聞

卓威同步發(fā)布XQ2766X顯示器:27" QHD 360Hz TN

藝術(shù)要聞

一念天堂,一念地獄:你的心是什么樣,世界就什么樣

旅游要聞

135公里鐵絲網(wǎng)圍泰山,論證過必要性了嗎

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版