无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ChatGPT回復(fù)總是談?wù)摗案绮剂帧保珹I“軍備競賽”陷入困境?

0
分享至

從去年11月開始,ChatGPT用戶便發(fā)現(xiàn)一些異常。當他們與GPT聊天時,人工智能總是喋喋不休地談?wù)摗案绮剂帧保╣oblins)。為什么會這樣?OpenAI隨后展開調(diào)查,試圖搞清楚原因。


在西方民俗傳說中,哥布林是一種虛構(gòu)生物,它們擁有暗綠色或黃褐色皮膚、紅眼睛,體型矮小,相貌丑陋,性格貪婪卑劣,行事狡猾。

為什么在OpenAI的回復(fù)中,突然冒出如此多的哥布林?就連OpenAI也承認這一現(xiàn)象并非個例。OpenAI解釋稱,“哥布林”問題是2025年11月GPT-5.1發(fā)布后才發(fā)現(xiàn)的,當用戶選擇“Nerdy”語言風(fēng)格時,出現(xiàn)的頻率更高。

對于“Nerdy”風(fēng)格,OpenAI是這樣提示的:“你是一個毫不掩飾的極客、是頑皮且充滿智慧的AI導(dǎo)師,你服務(wù)于人類,你熱情地推廣真理、知識、哲學(xué)、科學(xué)方法和批判性思維,你必須用頑皮語言來消解虛偽。世界是復(fù)雜而奇怪的,必須承認、分析并享受這種奇怪,在避開自命不凡的陷阱時探討沉重主題。”

“軍備競賽”陷入困境

最開始時,OpenAI認為“哥布林”現(xiàn)象無須過度擔(dān)憂。隨著新版本的推出,OpenAI開始嚴肅看待此問題。

對大多數(shù)用戶來說,在回復(fù)中頻頻出現(xiàn)“哥布林”只是AI的一個怪癖,并無危害。但為了用戶體驗,OpenAI開始整治“哥布林”亂象,禁止大模型在對話中使用“哥布林”這個詞。

技術(shù)專家認為,“哥布林”泛濫實際上顯示系統(tǒng)訓(xùn)練基礎(chǔ)出現(xiàn)了裂縫,意味著AI“軍備競賽”已經(jīng)陷入困境。

美國東北大學(xué)計算機教授Christoph Riedl說:“行業(yè)如同一個高壓鍋,各大公司面臨新模型發(fā)布壓力,它們用于測試的資源和能力受到限制,流程變得漫長復(fù)雜,于是才出現(xiàn)所謂的‘哥布林’現(xiàn)象。”

為什么會出現(xiàn)如此多的“哥布林”?Christoph Riedl認為,主要是ChatGPT的訓(xùn)練模式存在缺陷。據(jù)教授猜測,在后期訓(xùn)練階段(也就是微調(diào)階段),人類會對回復(fù)進行反饋。鑒于回復(fù)的準確度、語氣等原因,用戶會偏愛某個回復(fù)。

Riedl說:“反饋如同信號,會強化某些回復(fù),它相當于在告訴大模型:‘朋友,如果你生成這樣的答案,會得到表揚和獎勵;如果答案不是這樣的,獎勵就會少一些。’”

在不斷的強化下,ChatGPT的回復(fù)會更加偏向“nerdy”風(fēng)格,新版ChatGPT追求“趣味性”,避免“自命不凡”,不能在自以為是的前提下討論沉重主題。最終,ChatGPT會以狹隘的方式對回復(fù)進行優(yōu)化,甚至不惜偏離本意。

根據(jù)OpenAI的數(shù)據(jù),在去年12月至今年3月期間,帶有“nerdy”風(fēng)格的回復(fù)大幅增加,攀升3881.4%。

從本質(zhì)上講,ChatGPT和其他大型語言模型一樣,都是利用輸入的海量數(shù)據(jù)預(yù)測下一個詞。當大模型從海量文本中學(xué)習(xí),預(yù)測能力就會增強,從而提高理解的準確性。

盡管如此,隨機元素依然存在,因為有許多問題并沒有標準答案。

另外,在強化學(xué)習(xí)過程中,AI會根據(jù)開發(fā)者的“獎勵”做出決策。正如OpenAI所說:“在不知情的情況下,我們對生物隱喻給予了特別高的獎勵。從那以后,哥布林就蔓延開了。”

“我會穩(wěn)穩(wěn)接住你”

哥布林現(xiàn)象是一個很好的例子,證明“獎勵”會以不可預(yù)料的方式塑造模型行為。這一事件還說明,對于大型語言模型如何運作以及如何得出最終回應(yīng),其創(chuàng)造者自身并未完全了解。

許多美國用戶在使用模型時,經(jīng)常聽到“砍一刀”,本來這是中國網(wǎng)民對拼多多營銷口號的調(diào)侃,但當外國人聽到時,卻覺得莫名其妙。

Pangram CEO Max Spero認為,當模型頻繁使用某個短語,會讓人覺得生硬做作,這就是所謂的“模式坍縮”。

在ChatGPT回復(fù)中,經(jīng)常會出現(xiàn)“I will catch you steadily”(我會穩(wěn)穩(wěn)接住你)這句話,結(jié)果遭到網(wǎng)民群嘲。

為什么ChatGPT如此迷戀“I will catch you steadily”這句話?可能是翻譯出現(xiàn)了問題。在中國人的理解中,這句話可能是“我罩著你”的意思。當中國人閱讀翻譯文章時,也會有生硬感,比如句子格外冗長,句式不規(guī)范。

受到“獎勵機制”的影響,AI越來越會“阿諛奉承”,這點在豆包上也很明顯。簡言之,“哥布林”和“砍一刀”現(xiàn)象是當前所有AI模型的通病。

Christoph Riedl認為,當AI模型看到某種怪癖得到獎勵,該行為就會在后期訓(xùn)練中得到強化。正因如此,在新模型的回復(fù)中,我們會看到許多奇異生物,比如小魔怪、食人魔、巨魔、浣熊和鴿子。

Riedl指出,AI模型的詞匯怪癖令人擔(dān)憂。起初,企業(yè)會動用整個數(shù)據(jù)中心訓(xùn)練模型,但訓(xùn)練完成后,企業(yè)卻對模型的走向失去控制力。當不良行為嵌入到訓(xùn)練過程中,企業(yè)需要幾個月才能發(fā)現(xiàn)。

OpenAI最終只能提供一個快速修復(fù)方案,讓回復(fù)避開“nerdy”人設(shè)。但即使如此,“哥布林”現(xiàn)象仍然難以禁絕。存在問題的不只是ChatGPT,其他大語言模型也一樣。例如Grok,它偏執(zhí)地認定南非存在白人種族滅絕。

Riedl說:“這次出現(xiàn)的是哥布林,下次可能是別的什么,類似現(xiàn)象不會消失。”(小刀)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“我真的想多活幾年”,釘釘副總裁,也提桶跑路了!

“我真的想多活幾年”,釘釘副總裁,也提桶跑路了!

南財社V
2026-06-09 20:36:31
浙江女子2萬多的金手鐲被朋友買了個88元的仿制手鐲調(diào)包,轉(zhuǎn)手賣了2.9萬元,女子:兩人的老公是同事,偶爾有來往

浙江女子2萬多的金手鐲被朋友買了個88元的仿制手鐲調(diào)包,轉(zhuǎn)手賣了2.9萬元,女子:兩人的老公是同事,偶爾有來往

揚子晚報
2026-06-10 07:35:31
滬指失守4000點,陳果火線發(fā)聲:戰(zhàn)略上不能再看空大A,抓住難得機遇,積極布局中國股市新一輪上升行情

滬指失守4000點,陳果火線發(fā)聲:戰(zhàn)略上不能再看空大A,抓住難得機遇,積極布局中國股市新一輪上升行情

金融界
2026-06-10 11:29:18
都2026年了,還有人跪著給帝制招魂

都2026年了,還有人跪著給帝制招魂

浪子說
2026-06-10 07:05:16
菲律賓7.8級強震過去了36小時,國際上的慰問鋪天蓋地

菲律賓7.8級強震過去了36小時,國際上的慰問鋪天蓋地

小馬姨
2026-06-10 13:43:21
中國對日鎢出口歸零,日本兩大化工巨頭停產(chǎn)!這就是報應(yīng)!丨大象財富

中國對日鎢出口歸零,日本兩大化工巨頭停產(chǎn)!這就是報應(yīng)!丨大象財富

大象新聞
2026-06-09 18:04:45
藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

阿訊說天下
2026-06-10 12:28:31
17歲少女遭誘騙,被灌酒后遭四名男子輪奸,折磨施暴數(shù)小時

17歲少女遭誘騙,被灌酒后遭四名男子輪奸,折磨施暴數(shù)小時

胡侃社會百態(tài)
2026-06-10 14:05:38
大反轉(zhuǎn)!女子哭訴剖腹產(chǎn)19天,丈夫跑路,親子鑒定成了響亮的耳光

大反轉(zhuǎn)!女子哭訴剖腹產(chǎn)19天,丈夫跑路,親子鑒定成了響亮的耳光

火山詩話
2026-06-10 10:36:03
寶雞天價護欄全網(wǎng)關(guān)注!當?shù)剡B夜通報!全國還有多少天價護欄?

寶雞天價護欄全網(wǎng)關(guān)注!當?shù)剡B夜通報!全國還有多少天價護欄?

聽心堂
2026-06-10 11:01:43
廣東男子殉情后續(xù)!岳母再曝家丑,不止妻子被親戚侵犯這么簡單

廣東男子殉情后續(xù)!岳母再曝家丑,不止妻子被親戚侵犯這么簡單

青梅侃史啊
2026-06-10 09:33:39
11:2!中俄反對無效,美強推制裁,中方硬剛?cè)#瑸橐琳塘x執(zhí)言

11:2!中俄反對無效,美強推制裁,中方硬剛?cè)#瑸橐琳塘x執(zhí)言

知法而形
2026-06-10 15:58:37
“電梯親吻門”事件,宋珍珍多張美照曝光,深圳數(shù)名富豪都睡過她

“電梯親吻門”事件,宋珍珍多張美照曝光,深圳數(shù)名富豪都睡過她

漢史趣聞
2026-06-09 10:59:30
央媒發(fā)聲!養(yǎng)路費改革全面推進,油電同權(quán)正式落地,不再一刀切

央媒發(fā)聲!養(yǎng)路費改革全面推進,油電同權(quán)正式落地,不再一刀切

侃故事的阿慶
2026-06-09 19:37:15
2026年端午節(jié)將至,有1個壞消息,2個好消息,3個要注意,別大意

2026年端午節(jié)將至,有1個壞消息,2個好消息,3個要注意,別大意

阿纂看事
2026-06-09 19:47:11
世體:姆巴佩在法國隊惹不滿,與坎特關(guān)系緊張

世體:姆巴佩在法國隊惹不滿,與坎特關(guān)系緊張

懂球帝
2026-06-10 16:14:32
釣魚島爆發(fā)激烈對峙,日艦艇囂張?zhí)翎叢榇袊>敿淳婊負?>
    </a>
        <h3>
      <a href=共工之錨
2026-06-10 14:39:09
“半夜醒來,老公一個人坐客廳剝繭!”一家三口養(yǎng)1.2萬只蠶寶寶,耗時17天剝繭、煮繭、拉蠶絲兜,終于變成2床蠶絲被,兒子蓋上10分鐘入睡

“半夜醒來,老公一個人坐客廳剝繭!”一家三口養(yǎng)1.2萬只蠶寶寶,耗時17天剝繭、煮繭、拉蠶絲兜,終于變成2床蠶絲被,兒子蓋上10分鐘入睡

都市快報橙柿互動
2026-06-10 09:04:16
一老外來中國飯店吃飯,吃完一碗白米飯后,竟大喊:跟你們比,我活得簡直像原始人!

一老外來中國飯店吃飯,吃完一碗白米飯后,竟大喊:跟你們比,我活得簡直像原始人!

背包旅行
2026-06-10 16:09:28
母子定律,準到驚人

母子定律,準到驚人

心理觀察局
2026-06-10 07:00:08
2026-06-10 18:15:00
極客網(wǎng) incentive-icons
極客網(wǎng)
科技使能新商業(yè)
2981文章數(shù) 2630關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級模型向你開放

頭條要聞

女子金手鐲被朋友買的88元仿制手鐲調(diào)包 轉(zhuǎn)手賣2.9萬

頭條要聞

女子金手鐲被朋友買的88元仿制手鐲調(diào)包 轉(zhuǎn)手賣2.9萬

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發(fā)文開撕白鹿!輿論再次反轉(zhuǎn)

財經(jīng)要聞

一紙研報引"光"速下跌 CPO落地節(jié)奏有變?

汽車要聞

續(xù)航最高605km 吉利銀河星艦7 EV上市限時價9.98萬起

態(tài)度原創(chuàng)

游戲
數(shù)碼
本地
教育
公開課

IGN發(fā)文靈魂質(zhì)問!頑皮狗到底去哪了?

數(shù)碼要聞

小米宣布加入反虛假測評聯(lián)盟:反誤導(dǎo)評價、反消費欺詐

本地新聞

世界杯還沒開始,蘇超已經(jīng)火到爆梗

教育要聞

我國錄取分很低的4所公辦本科,500分以下就能上,就業(yè)不輸211!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版