无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude Opus 4.8:兩個(gè)0%背后的商業(yè)邏輯

0
分享至



今天凌晨,Anthropic發(fā)布了Claude Opus 4.8。所有人都在看跑分——SWE-Bench Pro 69.2%,GDPval-AA 1890分?jǐn)鄬拥谝弧5袃蓚€(gè)數(shù)字被 嚴(yán)重低估了:

謊報(bào)率:0.00。偷懶調(diào)查率:0%。

上一代Opus 4.7分別 是0.25和25%。再往 前,Opus 4.5的偷懶率高達(dá)91%。

兩個(gè)零。這可能是比任何benchmark都更具顛覆性的信號(hào)。

誠(chéng)實(shí),是Anthropic最鋒利的差異化武器

AI行業(yè)有個(gè)公開的秘密:所有大模型都擅長(zhǎng)"過度自信"。證據(jù)不足時(shí)倉(cāng)促下結(jié)論,然后拍著胸脯告訴你"搞定了"。你信了,一跑,崩了。回去問,它又?jǐn)蒯斀罔F地說"這次絕對(duì)沒問題"——然后你又崩了。

幻覺和謊報(bào)阻礙了許多企業(yè)和用戶對(duì)AI的選擇,因?yàn)樗麄儫o法分辨信息的真實(shí)性,或者沒有耐心一遍一遍追問AI事情的準(zhǔn)確度。Anthropic看起來想從這點(diǎn)入手。

Anthropic把"安全"這個(gè)被喊爛的口號(hào),轉(zhuǎn)化成了一個(gè)可量化、可感知、可對(duì)比的產(chǎn)品特性。Opus 4.8的謊報(bào)率從前代的0.25降至0.00,偷懶調(diào)查率從25%歸零。它會(huì)在不確定時(shí)說"我不確定",會(huì)在發(fā)現(xiàn)問題時(shí)主動(dòng)標(biāo)記。



這不是技術(shù)領(lǐng)先,這是信任領(lǐng)先。在ToB市場(chǎng),信任比智商值錢得多。Anthropic明顯更側(cè)重企業(yè)客戶,它不需要討好C端用戶,只需要讓CIO們相信:用Claude,你的代碼不會(huì)崩,你的模型不會(huì)騙你。

當(dāng)所有頂尖模型的智商差距縮小到個(gè)位數(shù)時(shí),"可靠性"成了最后的護(hù)城河。而"誠(chéng)實(shí)"這個(gè)產(chǎn)品化標(biāo)簽,OpenAI、Google、Meta也有類似機(jī)制,但未像Anthropic這樣作為核心賣點(diǎn)和品牌心智來打造,這形成了一種難以復(fù)制的差異化。

誠(chéng)實(shí)的代價(jià):Opus 4.8變"冷淡"了

但誠(chéng)實(shí)不是免費(fèi)的。

實(shí)測(cè)用戶反饋:4.8更精確、更遵循指令,但也更不主動(dòng)了。你讓它干A,它就只干A,絕不會(huì)自作主張把B也辦了。有人形容:"給它Prompt像強(qiáng)迫i人主動(dòng)說話。"

這對(duì)專業(yè)開發(fā)者是好事——精確、可控、不越界。但對(duì)"氛圍編程"群體來說,可能是個(gè)打擊。很多人習(xí)慣了AI"懂我意思"的爽感:含糊扔一句話過去,AI就猜到你完整需求。這種"被理解"很上頭,但代價(jià)是不可控。

Opus 4.8選擇放棄"爽感",換取可靠性。這是一個(gè)產(chǎn)品哲學(xué)的取舍——Anthropic在告訴用戶:如果你需要AI猜你的心思,你需要的是聊天伙伴;如果你需要AI幫你干活,你需要的是工程師。

動(dòng)態(tài)工作流:Anthropic的真正野心

同步發(fā)布的"動(dòng)態(tài)工作流",允許Claude在單次會(huì)話中啟動(dòng)數(shù)百個(gè)并行子智能體,持續(xù)運(yùn)行數(shù)天。官方直接展示了案例,把Bun從Zig移植到Rust,75萬行代碼,99.8%測(cè)試通過率,僅11天。



所以我們已經(jīng)不能只說"AI寫代碼更快"了,現(xiàn)實(shí)情況是"AI正在變成組織"。

傳統(tǒng)開發(fā)是團(tuán)隊(duì)協(xié)作:產(chǎn)品經(jīng)理提需求、 架構(gòu)師設(shè)計(jì)、前端寫界面、后端寫API、測(cè)試寫用例。動(dòng)態(tài)工作流意味著,這些角色理論上可以被一個(gè)AI系統(tǒng)內(nèi)的多個(gè)"虛擬員工"替代。

Anthropic不是在賣更聰明的模型,它在用AI重塑企業(yè)的組織架構(gòu)。當(dāng)企業(yè)意識(shí)到可以用Claude Code替代一個(gè)開發(fā)團(tuán)隊(duì)時(shí),他的使用成本和多企業(yè)復(fù)用的能力逐漸凸顯,9650億美元估值就不再是泡沫。

身份烏龍:模型歸屬討論暴露的行業(yè)共性

頗為戲謔的是,有網(wǎng)友通過官方API直接調(diào)用Opus 4.8,問"你是什么模型",它回答:"我是通義千問(Qwen)。"換個(gè)人問,又說:"我是DeepSeek。"

這場(chǎng)面頗具戲劇性。就在三個(gè)月前,Anthropic剛發(fā)布官方公告,指出有競(jìng)爭(zhēng)對(duì)手通過大量賬戶批量獲取Claude模型數(shù)據(jù)用于訓(xùn)練,彼時(shí)業(yè)內(nèi)還有知名人士公開評(píng)論此事。

短短數(shù)月輿論風(fēng)向變化,網(wǎng)友調(diào)侃:"你學(xué)我,我學(xué)你,大模型訓(xùn)練本質(zhì)就是互相學(xué)習(xí)。"

所有前沿模型互相借鑒數(shù)據(jù)、論文與模型輸出,早已是行業(yè)不公開的慣例。但Anthropic的尷尬在于:它耗費(fèi)大量成本打磨極致誠(chéng)實(shí)、零謊報(bào)、零偷懶的品牌標(biāo)簽,將可靠性奉為核心護(hù)城河,最終卻被自家模型的"過度誠(chéng)實(shí)"反噬。

模型之所以"認(rèn)錯(cuò)身份",并非什么高深的對(duì)齊故障,而是最樸素的訓(xùn)練數(shù)據(jù)清洗疏漏——中文語料中的外部模型殘留記憶沒被過濾干凈,反學(xué)習(xí)機(jī)制在中文場(chǎng)景下效果有限,結(jié)果被模型"如實(shí)"輸出。這種坦誠(chéng),不是技術(shù)優(yōu)勢(shì),而是產(chǎn)品缺陷的直接暴露。

這一事件,也撕開了行業(yè)的深層困境:頭部模型數(shù)據(jù)源高度重合、技術(shù)框架趨同、評(píng)測(cè)目標(biāo)統(tǒng)一,AI的獨(dú)特性正在消失。頂尖模型的智商壁壘不斷抹平,跑分差距持續(xù)縮小,Terminal-Bench上GPT-5.5甚至以78.2%的成績(jī),反超Opus 4.8的74.6%。

模型能力正在全面收斂。當(dāng)智商差距縮小到個(gè)位數(shù),AI賽道的終局競(jìng)爭(zhēng)早已改寫:決定勝負(fù)的從來不是"誰更聰明",而是誰更可控、更可靠、能守住自身的技術(shù)與數(shù)據(jù)邊界。

當(dāng)AI學(xué)會(huì)誠(chéng)實(shí),人類反而不習(xí)慣了

Opus 4.8標(biāo)志著AI行業(yè)的一個(gè)微妙轉(zhuǎn)折。

過去兩年,競(jìng)爭(zhēng)主線是"誰更聰明"。但當(dāng)頂尖模型的智商差距縮小到個(gè)位數(shù)時(shí),主線正在切換為"誰更可靠"。

Anthropic選擇了一條差異化路徑:不是追求"最聰明",而是追求"最誠(chéng)實(shí)"。它用兩個(gè)0%構(gòu)建了一個(gè)競(jìng)爭(zhēng)對(duì)手難以復(fù)制的品牌護(hù)城河。

但這也帶來一個(gè)悖論:當(dāng)AI變得過于誠(chéng)實(shí),人類反而不習(xí)慣了。我們習(xí)慣了AI的過度自信——那種"搞定了"的篤定,那種虛假的安全感。4.8的誠(chéng)實(shí)打破了這種幻覺。

誠(chéng)實(shí)是一種高級(jí)能力,但接受誠(chéng)實(shí)需要更高的認(rèn)知水平。對(duì)于習(xí)慣了"氛圍編程"的 casual 用戶,4.8可能顯得冷淡、機(jī)械。但對(duì)于需要把AI部署到生產(chǎn)環(huán)境的企業(yè),這種誠(chéng)實(shí)是救命稻草。

9650億美元估值很大程度反映了市場(chǎng)對(duì)"企業(yè)級(jí)可靠AI基礎(chǔ)設(shè)施"的長(zhǎng)期預(yù)期——當(dāng)然,這也包含了收入增速、競(jìng)品格局、融資環(huán)境等多重因素。Anthropic在賭:當(dāng)AI從玩具變成工具,誠(chéng)實(shí)會(huì)比聰明更值錢。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
德拉富恩特:貢薩洛落選不是因俱樂部;加維是西班牙核心球員

德拉富恩特:貢薩洛落選不是因俱樂部;加維是西班牙核心球員

懂球帝
2026-06-13 16:44:25
不露臉年入千萬,167cm口罩女神流量封神,這才是頂流的操控者!

不露臉年入千萬,167cm口罩女神流量封神,這才是頂流的操控者!

生如稗草
2026-05-13 09:09:33
俄羅斯通告全球,將使用核武?澤連斯基向32國(guó)求助,北約也選邊了

俄羅斯通告全球,將使用核武?澤連斯基向32國(guó)求助,北約也選邊了

南宗歷史
2026-06-09 21:26:40
國(guó)乒三天丟三冠!保送生資格賽出局,亞運(yùn)會(huì)還敢用他們嗎?

國(guó)乒三天丟三冠!保送生資格賽出局,亞運(yùn)會(huì)還敢用他們嗎?

鏗鏘格斗
2026-06-14 03:54:01
曼聯(lián)下賽季最值得關(guān)注的球員?梅努&約羅:帕特里克-多古

曼聯(lián)下賽季最值得關(guān)注的球員?梅努&約羅:帕特里克-多古

懂球帝
2026-06-14 02:04:11
貝爾服了!你可以成為最強(qiáng),但成不了梅西,因?yàn)樗缫殉搅俗詈?>
    </a>
        <h3>
      <a href=體育閑話說
2026-06-12 06:34:41
就業(yè)前景最好的六大專業(yè),幾乎全跟電有關(guān)!

就業(yè)前景最好的六大專業(yè),幾乎全跟電有關(guān)!

黯泉
2026-06-13 18:24:10
高鑫女兒畢業(yè),夫婦倆跑去合照,擋臉的動(dòng)作讓網(wǎng)友熱議

高鑫女兒畢業(yè),夫婦倆跑去合照,擋臉的動(dòng)作讓網(wǎng)友熱議

菲姑娘說娛樂
2026-06-13 17:51:02
三百名醫(yī)生提醒:晨起喝溫水對(duì)心腦血管的影響,建議抽一分鐘看看

三百名醫(yī)生提醒:晨起喝溫水對(duì)心腦血管的影響,建議抽一分鐘看看

路醫(yī)生健康科普
2026-06-13 15:43:58
越扒越驚心!你根本想象不到釋永信在少林寺的奢靡生活有多離譜?

越扒越驚心!你根本想象不到釋永信在少林寺的奢靡生活有多離譜?

清歡百味
2026-06-13 09:34:33
我去醫(yī)院探望植物人嫂子,護(hù)工偷偷塞來字條:去查上周的監(jiān)控錄像

我去醫(yī)院探望植物人嫂子,護(hù)工偷偷塞來字條:去查上周的監(jiān)控錄像

紙鳶奇譚
2026-05-21 17:44:37
滴滴接單方式變了,乘客以后再也不能說自己沒坐過車了!

滴滴接單方式變了,乘客以后再也不能說自己沒坐過車了!

網(wǎng)約車觀察室
2026-06-13 09:46:52
悲哀!48歲媽媽因管教12歲女兒發(fā)生爭(zhēng)執(zhí),母女倆同日先后跳樓身亡

悲哀!48歲媽媽因管教12歲女兒發(fā)生爭(zhēng)執(zhí),母女倆同日先后跳樓身亡

青梅侃史啊
2026-06-12 22:00:42
2026美加墨世界杯誕生首個(gè)烏龍,美國(guó)隊(duì)小組賽首戰(zhàn)領(lǐng)先巴拉圭

2026美加墨世界杯誕生首個(gè)烏龍,美國(guó)隊(duì)小組賽首戰(zhàn)領(lǐng)先巴拉圭

大象新聞
2026-06-13 09:46:01
“真以為專科沒學(xué)霸?”女生曬翻身證書被群嘲:含金量不如白開水

“真以為專科沒學(xué)霸?”女生曬翻身證書被群嘲:含金量不如白開水

番外行
2026-06-05 08:52:04
2909億身家有何用?97歲的李嘉誠(chéng)無力回天,兩個(gè)60歲兒子已成心病

2909億身家有何用?97歲的李嘉誠(chéng)無力回天,兩個(gè)60歲兒子已成心病

阿尢說歷史
2026-04-17 04:13:15
澳網(wǎng)法網(wǎng)雙決賽不入,辛納成三十余年來球王第三人!

澳網(wǎng)法網(wǎng)雙決賽不入,辛納成三十余年來球王第三人!

網(wǎng)球之家
2026-06-13 22:27:10
47年孟良崮,敵機(jī)投物資到華野陣地上,粟裕打開一看:張靈甫完了

47年孟良崮,敵機(jī)投物資到華野陣地上,粟裕打開一看:張靈甫完了

新一說史
2026-06-14 00:27:03
今年養(yǎng)老金調(diào)整官宣來了?真實(shí)進(jìn)度、補(bǔ)發(fā)規(guī)則一次性講透

今年養(yǎng)老金調(diào)整官宣來了?真實(shí)進(jìn)度、補(bǔ)發(fā)規(guī)則一次性講透

陳博世財(cái)經(jīng)
2026-06-12 16:51:37
央視主持人康輝身邊的女搭檔太美了,顏值高還大氣

央視主持人康輝身邊的女搭檔太美了,顏值高還大氣

娛你同歡
2026-06-01 16:24:53
2026-06-14 04:39:00
AI唱反調(diào) incentive-icons
AI唱反調(diào)
在這里,聽見不一樣的 AI 聲音。
24文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 霍爾木茲海峽立即開放

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 霍爾木茲海峽立即開放

體育要聞

美國(guó)4比1巴拉圭:這統(tǒng)治力真是美國(guó)隊(duì)?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍(lán)S07華為乾崑激光版增程車型上市 限時(shí)15.49萬元起

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
手機(jī)
教育
健康

藝術(shù)要聞

廣州再建一座“小蠻腰”?190米,頂著個(gè)球,2027年見!

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,海口全款買三房!

手機(jī)要聞

比華為三折疊還稀缺!iPhone Ultra國(guó)行備貨量不足:博主直言搶到賺到

教育要聞

基礎(chǔ)不好建議避開的超恐怖院校。

老人、小孩、孕婦,吃粽子有啥風(fēng)險(xiǎn)

無障礙瀏覽 進(jìn)入關(guān)懷版