亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI這毛病治了4年,70%開發(fā)者還在踩同一個(gè)坑

0
分享至

2024年Stack Overflow開發(fā)者調(diào)查顯示,76%的程序員正在用AI寫代碼。但同一批人里,超過一半承認(rèn)被AI"騙過"——不是代碼跑不通,是AI一臉篤定地給了個(gè)根本不存在的方法名。

這就是"幻覺"(Alucina??o):AI生成假信息,但語氣像真的一樣。

人類撒謊需要?jiǎng)訖C(jī)。AI不需要。它甚至沒有"知道自己在說什么"這個(gè)概念。

大型語言模型(LLM,Large Language Model的縮寫)的工作原理,和你以為的完全不同。它不"理解"事實(shí),不"儲(chǔ)存"知識(shí),更沒有"真假"的判斷力。它只是在做一件事:根據(jù)前面出現(xiàn)的詞,預(yù)測(cè)下一個(gè)最可能出現(xiàn)的詞。

訓(xùn)練數(shù)據(jù)里有幾十億個(gè)句子。模型學(xué)到的不是"巴黎是法國(guó)首都",而是"巴黎"后面跟著"法國(guó)"的概率很高。當(dāng)信息充足時(shí),這套機(jī)制運(yùn)轉(zhuǎn)得像精密儀器。但當(dāng)遇到空白——某個(gè)冷門技術(shù)棧、某段模糊的歷史、某個(gè)2023年后才出現(xiàn)的產(chǎn)品——模型不會(huì)說"我不知道"。

它開始"編"

2023年,美國(guó)律師Steven Schwartz用ChatGPT寫了一份法庭文件。AI引用了6個(gè)判例,格式完美,邏輯通順。問題是:這些案子全都不存在。法官發(fā)現(xiàn)后,這位執(zhí)業(yè)30年的老律師面臨執(zhí)業(yè)資格調(diào)查。

不是他不夠謹(jǐn)慎。是AI的自信太有欺騙性。

同樣的陷阱在醫(yī)療領(lǐng)域更危險(xiǎn)。2024年初,有研究人員測(cè)試GPT-4對(duì)罕見病的診斷建議。在37%的案例中,AI推薦了根本不存在的藥物組合,或混淆了癥狀相似的兩種疾病。輸出格式是標(biāo)準(zhǔn)的醫(yī)學(xué)文獻(xiàn)風(fēng)格,附帶虛構(gòu)的參考文獻(xiàn)編號(hào)。

為什么修不好?

OpenAI從GPT-3就開始打補(bǔ)丁。RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí),Reinforcement Learning from Human Feedback的縮寫)讓模型學(xué)會(huì)說"不確定"。檢索增強(qiáng)生成(RAG,Retrieval-Augmented Generation的縮寫)把模型和實(shí)時(shí)數(shù)據(jù)庫掛鉤。但幻覺率始終卡在15%-20%的區(qū)間,某些垂直領(lǐng)域更高。

根本矛盾在這里:用戶要的是"有用"的回答,不是"安全"的拒絕。一個(gè)頻繁說"我不知道"的AI,商業(yè)價(jià)值歸零。所以產(chǎn)品團(tuán)隊(duì)永遠(yuǎn)在走鋼絲——降低幻覺,但不能降低有用性。

Anthropic的Claude系列嘗試用"憲法AI"自我約束,設(shè)定行為邊界。Google的Gemini在醫(yī)療、法律等敏感領(lǐng)域強(qiáng)制觸發(fā)事實(shí)核查。但沒有一個(gè)方案能根除問題,因?yàn)?預(yù)測(cè)下一個(gè)詞"的架構(gòu)本身,就不包含事實(shí)驗(yàn)證的環(huán)節(jié)。

開發(fā)者正在自己想辦法

2024年涌現(xiàn)了一批"防御性編程"實(shí)踐。有人給AI輸出加強(qiáng)制溯源,每個(gè)結(jié)論必須附帶可點(diǎn)擊的原文鏈接。有人在關(guān)鍵決策鏈上設(shè)置"人機(jī)回環(huán)",AI只生成草稿,人類做最終校驗(yàn)。更激進(jìn)的團(tuán)隊(duì)干脆把AI輸出當(dāng)成"創(chuàng)意提示",所有內(nèi)容重新人工撰寫。

這些補(bǔ)丁有效,但都在增加成本。一個(gè)需要三重校驗(yàn)的AI助手,和直接雇實(shí)習(xí)生相比,優(yōu)勢(shì)還剩多少?

Meta AI研究負(fù)責(zé)人Yann LeCun多次公開批評(píng)當(dāng)前路徑。他認(rèn)為幻覺是LLM的結(jié)構(gòu)性缺陷,真正的解決方案需要"世界模型"——讓AI像人類一樣建立對(duì)物理世界的因果認(rèn)知,而非統(tǒng)計(jì)關(guān)聯(lián)。但這套架構(gòu)至少還需要5-10年。

眼下更現(xiàn)實(shí)的期待,或許是改變使用習(xí)慣。把AI當(dāng)作"語速極快、自信滿滿的實(shí)習(xí)生"——能幫你開腦洞,能處理格式,但任何事實(shí)性內(nèi)容都需要你親自核實(shí)。

那個(gè)被AI幻覺坑了的美國(guó)律師,后來在接受《紐約時(shí)報(bào)》采訪時(shí)說了一句話:「我以為它在思考。其實(shí)它只是在完成句子。」

你現(xiàn)在用AI寫代碼或查資料時(shí),會(huì)習(xí)慣性地打開第二個(gè)標(biāo)簽頁交叉驗(yàn)證嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)西湖市91歲奶奶不接電話,警方上門找人,發(fā)現(xiàn)她正忙著打破游戲里的個(gè)人紀(jì)錄……

美國(guó)西湖市91歲奶奶不接電話,警方上門找人,發(fā)現(xiàn)她正忙著打破游戲里的個(gè)人紀(jì)錄……

都市快報(bào)橙柿互動(dòng)
2026-04-16 22:22:55
突發(fā)!以色列發(fā)動(dòng)大規(guī)模空襲

突發(fā)!以色列發(fā)動(dòng)大規(guī)模空襲

農(nóng)民日?qǐng)?bào)
2026-04-17 00:59:15
西雙版納潑水節(jié)一汽車車門及后備箱被人拉開,多人向車內(nèi)噴水,車主稱父母全身淋濕、內(nèi)飾冒煙,汽車如檢查出問題會(huì)報(bào)警

西雙版納潑水節(jié)一汽車車門及后備箱被人拉開,多人向車內(nèi)噴水,車主稱父母全身淋濕、內(nèi)飾冒煙,汽車如檢查出問題會(huì)報(bào)警

大象新聞
2026-04-16 08:45:11
主持人曝何超蕸終身未婚原因:和二太藍(lán)瓊纓有關(guān),她有知心伴侶

主持人曝何超蕸終身未婚原因:和二太藍(lán)瓊纓有關(guān),她有知心伴侶

悅君兮君不知
2026-04-16 05:18:41
不是克洛普!弗洛倫蒂諾鎖定皇馬新帥,英超傳奇成終極人選

不是克洛普!弗洛倫蒂諾鎖定皇馬新帥,英超傳奇成終極人選

瀾歸序
2026-04-17 05:18:42
哈登兩度逃出局!果然是真大腿啊!

哈登兩度逃出局!果然是真大腿啊!

柚子說球
2026-04-16 22:46:27
《乘風(fēng)2026》嘉賓趙子琪喊話芒果TV:是逼我爆所有的料嗎,我跟慧雯吵架的視頻是怎么被你們剪輯出來的

《乘風(fēng)2026》嘉賓趙子琪喊話芒果TV:是逼我爆所有的料嗎,我跟慧雯吵架的視頻是怎么被你們剪輯出來的

魯中晨報(bào)
2026-04-16 09:25:03
五百塊從樹農(nóng)手里買走,數(shù)萬、十幾萬賣到別墅區(qū):一棵老柿樹的奇幻漂流

五百塊從樹農(nóng)手里買走,數(shù)萬、十幾萬賣到別墅區(qū):一棵老柿樹的奇幻漂流

新京報(bào)
2026-04-16 08:03:24
明明是聯(lián)盟前五球星,卻被爛攤子拖垮!或許該走了,你不虧欠什么

明明是聯(lián)盟前五球星,卻被爛攤子拖垮!或許該走了,你不虧欠什么

老梁體育漫談
2026-04-17 00:54:18
浪姐7:姐姐cos經(jīng)典角色,李小冉的安琪太美,陳瑤的岳綺羅太驚艷

浪姐7:姐姐cos經(jīng)典角色,李小冉的安琪太美,陳瑤的岳綺羅太驚艷

星宿影視鴨
2026-04-16 18:07:30
中國(guó)向伊朗提供緊急人道主義援助

中國(guó)向伊朗提供緊急人道主義援助

新華社
2026-04-16 23:43:04
4月17日精選熱點(diǎn):核聚變?cè)俅沃匕趵茫@些三大核心龍頭要大漲

4月17日精選熱點(diǎn):核聚變?cè)俅沃匕趵茫@些三大核心龍頭要大漲

元芳說投資
2026-04-16 21:12:07
臉沒恢復(fù)就別出來拍劇了,頂著膨脹臉、說話嘴歪全是痘坑,太出戲

臉沒恢復(fù)就別出來拍劇了,頂著膨脹臉、說話嘴歪全是痘坑,太出戲

翰飛觀事
2026-04-16 17:03:30
民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長(zhǎng)期一家獨(dú)大政黨

民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長(zhǎng)期一家獨(dú)大政黨

李橑在北漂
2026-04-02 10:22:26
坐后座不系安全帶,北京一市民曬出罰單!

坐后座不系安全帶,北京一市民曬出罰單!

家住東西城
2026-04-16 19:32:29
許家印認(rèn)罪后老家的功德碑還在,村民:一定會(huì)永久保留

許家印認(rèn)罪后老家的功德碑還在,村民:一定會(huì)永久保留

映射生活的身影
2026-04-16 19:18:33
哎呀,見到了真人才知道她真的有多美!比電視上還好看還自然

哎呀,見到了真人才知道她真的有多美!比電視上還好看還自然

喜歡歷史的阿繁
2026-04-16 14:37:01
中國(guó)足球小將鄺兆鐳讀秒進(jìn)球絕平巴薩,收到了轉(zhuǎn)會(huì)通知引發(fā)熱議

中國(guó)足球小將鄺兆鐳讀秒進(jìn)球絕平巴薩,收到了轉(zhuǎn)會(huì)通知引發(fā)熱議

煙潯渺渺
2026-04-16 18:02:47
全歐看不懂的豪賭!帶隊(duì)降級(jí)的孔帕尼,把拜仁焊成了歐洲頭號(hào)噩夢(mèng)

全歐看不懂的豪賭!帶隊(duì)降級(jí)的孔帕尼,把拜仁焊成了歐洲頭號(hào)噩夢(mèng)

老骾體育解說
2026-04-15 21:21:31
吳昕帶男友鄭凱與何炅聚餐,曝已相戀7年,比吳昕小兩歲又高又帥

吳昕帶男友鄭凱與何炅聚餐,曝已相戀7年,比吳昕小兩歲又高又帥

林輕吟
2026-04-16 19:49:36
2026-04-17 07:19:00
碳基打工人
碳基打工人
坐標(biāo)北京,靠咖啡續(xù)命,靠小紅書下飯的普通人類。
1534文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

特朗普:伊朗已同意幾乎所有要求

頭條要聞

特朗普:伊朗已同意幾乎所有要求

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

數(shù)碼
時(shí)尚
親子
本地
旅游

數(shù)碼要聞

榮耀史上最短發(fā)布會(huì),發(fā)布榮耀史上最強(qiáng)MagicBook數(shù)字系列

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

親子要聞

兒子認(rèn)字還可以吧? 董路的微博視頻

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

旅游要聞

社評(píng):讀懂“China Travel”持續(xù)圈粉的邏輯

無障礙瀏覽 進(jìn)入關(guān)懷版