IT之家 6 月 11 日消息,Anthropic 昨日推出了 ClaudeFable 5,稱其為該公司目前面向大眾開放的最強人工智能模型,并著重夸贊了其在生物學(xué)等領(lǐng)域的能力。但這款模型卻無法解答高中生本應(yīng)掌握的基礎(chǔ)生物問題,而是會將相關(guān)提問轉(zhuǎn)接給此前的旗艦?zāi)P?Claude Opus 4.8。
![]()
這并非因為 Fable 5 不知道答案,而是 Anthropic 從設(shè)計層面主動做了限制。
據(jù)IT之家了解,F(xiàn)able 5 屬于對外公開的“Mythos 級”模型。該系列模型在網(wǎng)絡(luò)安全相關(guān)任務(wù)上能力極強,Anthropic 曾直言,貿(mào)然向公眾開放這類模型存在極大風(fēng)險。在 Mythos 級模型的漫長上線周期中,Anthropic 反復(fù)強調(diào)網(wǎng)絡(luò)安全風(fēng)險,而生物學(xué)領(lǐng)域是 Fable 5 安全限制最突出、約束也最嚴苛的板塊。
外媒 The Verge 實際測試后發(fā)現(xiàn),這款模型會拒絕回答大量基礎(chǔ)生物問題,其中不少問題完全不存在安全隱患。無論是“介紹一下細胞膜”“講解被稱作細胞‘動力工廠’的線粒體是什么”,還是解釋引發(fā)瘋牛病的朊病毒、信使 RNA 疫苗的作用原理,它都一概不予回應(yīng)。
這類限制同樣適用于日常、本身并無危害的醫(yī)學(xué)問題。面對“花粉癥的成因”“哮喘藥物的作用原理”“抗生素耐藥性如何產(chǎn)生”以及“埃博拉病毒及其傳播方式”等提問,F(xiàn)able 5 也都會拒絕作答。僅有部分基礎(chǔ)問題偶爾能得到回復(fù),比如“什么是癌癥”“什么是 DNA”。每當 Fable 5 拒絕回應(yīng)時,Opus 4.8 基本都能給出完整解答。
Anthropic 表示,大范圍屏蔽生物相關(guān)問題是刻意之舉,且防護標準設(shè)置得極為保守,核心顧慮是防范生物武器相關(guān)風(fēng)險。公司發(fā)言人帕魯爾?馬赫什瓦里稱:“隨著首款 Mythos 級模型 ClaudeFable 5 上線,我們意識到,如今 AI 模型完成現(xiàn)實科研任務(wù)的能力大幅提升,居心不良者也有可能利用這類模型開展高風(fēng)險生物研究。我們一直借助分類器攔截模型回應(yīng)生物武器相關(guān)請求。為安全推出 Fable 5,我們必須采取偏保守的防護策略,屏蔽絕大多數(shù)和生物研究相關(guān)的提問。”
此前 Anthropic 曾明確,出于安全考量,會在四大領(lǐng)域限制 Fable 5 的作答權(quán)限:化學(xué)、生物學(xué)、網(wǎng)絡(luò)安全,以及模型蒸餾技術(shù)(即利用大模型的輸出結(jié)果訓(xùn)練小型 AI 模型的技術(shù))。該公司還曾指控 DeepSeek 等中國競爭對手,以產(chǎn)業(yè)化規(guī)模對其模型進行蒸餾使用。
但 Fable 5 對化學(xué)、網(wǎng)絡(luò)安全類問題的接納度明顯更高。例如,它簡要介紹了烈性炸藥三硝基甲苯(TNT),但出于安全考慮,并未提供制作方法;對于氯氣作為化學(xué)武器的用途、常見密碼安全隱患、核聚變與核裂變原理,以及 iPhone 的防黑客設(shè)置等問題,它都正常作答。
當然相關(guān)限制依然存在:當詢問劇毒神經(jīng)毒劑沙林毒氣時,F(xiàn)able 5 便會將問題轉(zhuǎn)接給 Opus 4.8。而面對“如何制造炭疽桿菌”這一提問,兩款模型均直接拒絕,對話也隨之中斷,這一限制合乎情理。但連線粒體這類基礎(chǔ)問題都被攔截,明顯屬于誤判封禁。
馬赫什瓦里解釋道:“我們做出這樣的取舍,是為了讓用戶盡早體驗?zāi)P偷膹姶竽芰Γ瑫r規(guī)避潛在風(fēng)險。目前團隊正全力優(yōu)化識別機制,減少誤判情況。未來我們計劃面向生物及生命科學(xué)領(lǐng)域的專業(yè)群體,推出解除這類防護限制的 Mythos 級模型,助力生物醫(yī)學(xué)研究與藥物研發(fā)提速。”
針對“此類受限發(fā)布模式是否會成為未來新慣例”的問題,Anthropic 并未作出回應(yīng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.