无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic估值萬億,但Claude 4.8沒那么驚艷

0
分享至


小版本迭代,試驗屬性強(qiáng)。

AIX財經(jīng)(AIXcaijing)原創(chuàng)

作者 | 王璐

編輯 | 魏佳

Claude再次成為焦點。

5月29日凌晨,AI行業(yè)又上演了一場“深夜突襲”。美國大模型公司Anthropic正式發(fā)布Claude最新旗艦?zāi)P蚈pus 4.8,并同步宣布完成H輪650億美元融資,投后估值高達(dá)9650億美元。在不到三個月的時間里,Anthropic的估值增長約154%,正式超過競爭對手OpenAI。

本次模型更新,覆蓋編碼、智能體任務(wù)、推理與知識工作等核心能力,其中重點提升了模型的“誠實度”,并新增了支持大規(guī)模復(fù)雜任務(wù)并行處理的“動態(tài)工作流”功能。

然而,若僅從功能列表來看,很容易高估此次發(fā)布的意義。實際上,Opus 4.8并沒有帶來架構(gòu)層面的顛覆性突破,從業(yè)者一致認(rèn)為其屬于“漸進(jìn)式進(jìn)步”。

但本次發(fā)布也傳遞出一個明確信號:大模型的競爭重心,正從技術(shù)突破,轉(zhuǎn)向誰更可靠、更好用、性價比更高。

這種轉(zhuǎn)向,也體現(xiàn)在Claude的迭代節(jié)奏上,Opus 4.8距離上一版本Opus 4.7的發(fā)布僅43天。快速的更新速度,既是大模型競爭白熱化的縮影,也反映了Anthropic當(dāng)前的處境。它必須以更快的節(jié)奏,同時向開發(fā)者、企業(yè)客戶與資本市場證明,Claude值得信賴。

01.進(jìn)步有限,“誠實”是最大亮點

先看官方發(fā)布的Opus 4.8成績單。

在編程、多學(xué)科推理、金融分析等主流基準(zhǔn)測試中,Opus 4.8的得分全面超越前代Opus 4.7,也壓過了競爭對手GPT-5.5。但有一個細(xì)節(jié)值得關(guān)注:在最貼近開發(fā)者真實工作流的“終端編碼”測試(Terminal-Bench 2.1)中,Opus 4.8以74.6%拿下本次所有單項測試中最大的提升幅度,但仍落后于GPT-5.5的78.2%。


不過,這個差距在實際使用中的影響,可能比數(shù)字看起來要小。

資深開發(fā)者張鈺樞告訴「AIX財經(jīng)」,模型在“終端編碼”上的表現(xiàn),與開發(fā)者具體采用的工作流密切相關(guān),如果日常高度依賴命令行逐條調(diào)試,GPT-5.5的領(lǐng)先或許更順手;但如果核心工作是在IDE中閱讀代碼、理解架構(gòu)、重構(gòu)或修復(fù)復(fù)雜缺陷,Claude在SWE-Bench Pro上的優(yōu)勢則更具參考價值。

在他看來,對大多數(shù)應(yīng)用層開發(fā)者而言,終端操作上的差距,更多反映的是廠商在各自工具鏈和優(yōu)化策略上的不同側(cè)重,而非模型底層編碼能力的根本性短板。因此,其在實際開發(fā)工作中的影響并不顯著,是可以接受的。

相比編碼能力的細(xì)微得失,這次更新中更值得關(guān)注的,是Anthropic重點打磨的“誠實度”。官方數(shù)據(jù)顯示,Opus 4.8編寫的代碼中缺陷被漏報的概率,只有Opus 4.7的約四分之一,在“欺騙用戶”或“協(xié)助干壞事”等行為上的發(fā)生率也顯著下降。

但這個數(shù)字并非沒有爭議。資深A(yù)I從業(yè)者方思明告訴「AIX財經(jīng)」,他并沒有感受到模型變得特別誠實,“這種進(jìn)步可能更多體現(xiàn)在溝通話術(shù)或表達(dá)方式的微妙調(diào)整上。”

Anthropic官方也表示,其在訓(xùn)練過程中觀察到一個潛在矛盾,即模型在推理時,越來越傾向于“揣測評分者意圖”。也就是說,它可能正在形成“自己正在被測試”的感知,從而給出它認(rèn)為能拿高分的答案,而非真正最優(yōu)或最真實的解答,這對它所追求的“誠實”原則,構(gòu)成了一定挑戰(zhàn)。

綜合來看,Opus 4.8更像是一次扎實但幅度有限的小版本迭代,實際體驗上的提升感知并不顯著。

方思明的評價頗具代表性,他認(rèn)為“Opus4.8相比Opus4.6和GPT-5.5都算不上越級式的提升,更多是針對上一版本Opus4.7的修復(fù)與優(yōu)化。”鑒于此前4.7版本的表現(xiàn),對Anthropic而言,當(dāng)下最迫切的任務(wù)是重建用戶對AI可靠性的信任,然而,僅憑目前公布的數(shù)據(jù)與表現(xiàn),仍難以說服整個市場相信Claude已是“最值得托付的那一個”。

02.“動態(tài)工作流”成新王牌,但成本是個問題

不止一位從業(yè)者表示,這次發(fā)布最值得關(guān)注的不僅只有Opus 4.8的各項評分,還有同步推出的Dynamic Workflows(動態(tài)工作流)。值得一提的是,Anthropic實驗室中能力更強(qiáng)的Claude Mythos Preview并未隨此次發(fā)布對外開放,也就是說,Opus 4.8是當(dāng)前最強(qiáng)的“通用可用版本”,但不是Anthropic手里最強(qiáng)的牌。

動態(tài)工作流可以簡單理解為,Claude現(xiàn)在能扮演“項目總監(jiān)”的角色,把一個大型復(fù)雜任務(wù)自動拆解成數(shù)百個子任務(wù),分派給多個“子智能體”并行處理,中間結(jié)果經(jīng)過交叉驗證后,再整合輸出給用戶。


圖源 / pexels

Anthropic為此展示了一個官方案例:開發(fā)者Jarred Sumner借助動態(tài)工作流,將Bun的底層語言從Zig遷移到Rust,生成了約75萬行Rust代碼,通過了現(xiàn)有測試套件的99.8%,從第一次commit到最終merge,歷時11天。

這相當(dāng)于在不到兩周內(nèi),Claude便完成了一個通常需要高級工程師團(tuán)隊耗時數(shù)月的大型底層重構(gòu)項目。

一位從業(yè)者認(rèn)為,Dynamic Workflows的出現(xiàn)標(biāo)志著Claude的主張,從按次收費(fèi)的“對話/生成”服務(wù),轉(zhuǎn)向了按流程和結(jié)果收費(fèi)的“復(fù)雜任務(wù)交付”服務(wù),企業(yè)購買的,是完成一個具體、復(fù)雜工作流程的確定性。

不過,這張“王牌”在業(yè)內(nèi)也引發(fā)了不少質(zhì)疑。

在技術(shù)層面,有觀點認(rèn)為其創(chuàng)新性有限。

張鈺樞指出,動態(tài)工作流在架構(gòu)上并非顛覆性設(shè)計,其演示案例所驗證的更多是“技術(shù)可行性”,距離在真實生產(chǎn)環(huán)境中穩(wěn)定運(yùn)行仍有顯著的工程化距離,其中涉及性能、資源與邊緣情況等一系列復(fù)雜挑戰(zhàn)。

更為現(xiàn)實的制約來自經(jīng)濟(jì)層面。

方思明指出,該模式比常規(guī)對話消耗更多Token,成本問題尤為突出。“由于需要同時調(diào)度十幾個智能體協(xié)同工作,其成本會陡然上升。即使一個工作流設(shè)計得再精巧,如果最終效果沒有顯著提升,而成本卻翻了幾倍,對企業(yè)來說仍然是不劃算的。”

他補(bǔ)充道,現(xiàn)實中并非所有企業(yè)都擁有高預(yù)算。“微軟就曾表示,在某些場景中,使用AI的成本已高于人力成本。如今,一個成本可能數(shù)倍于普通AI的解決方案,其帶來的價值能否帶來相應(yīng)倍數(shù)的回報,這需要市場和時間的驗證。”在他看來,這個功能的推出本身也帶有一定的實驗與探索性質(zhì)。

為了降低使用門檻,Anthropic在成本端也做了調(diào)整。

一方面,新增effort control(投入控制)機(jī)制,用戶可根據(jù)任務(wù)復(fù)雜程度和需求,手動調(diào)節(jié)Claude在任務(wù)上的“思考投入”強(qiáng)度。比如在“High模式”下,Claude會進(jìn)行更深度的推理,以追求更優(yōu)結(jié)果;而在“輕量模式”下,則可實現(xiàn)更快的響應(yīng)速度和更低的token消耗。

另一方面,在定價策略上,Opus 4.8的常規(guī)模式維持了與上一版本相同的價格,仍為每百萬token 5美元(輸入)/ 25美元(輸出)。但快速模式的價格大幅下調(diào),從4.7時代的30美元(輸入)/ 150美元(輸出),降至10美元(輸入)/ 50美元(輸出)。在保持速度相當(dāng)?shù)那疤嵯拢瑑r格降至原先的約三分之一,性價比提升顯著。

雖然降價能在一定程度上緩解成本壓力,但動態(tài)工作流本身的ROI問題,仍是企業(yè)真正下場之前繞不開的那道坎。

03.按月迭代背后,是技術(shù)與商業(yè)的雙重壓力

Claude Opus 4.8的發(fā)布時間,距上一版本Opus 4.7僅相隔43天。如此密集的迭代節(jié)奏,正是技術(shù)與商業(yè)壓力疊加的直接體現(xiàn)。

技術(shù)層面,這次快速迭代被部分從業(yè)者認(rèn)為是一次不得不做的修復(fù)。

Opus 4.7因自適應(yīng)推理體驗不佳飽受詬病,該功能在部分場景下無法合理分配推理資源,導(dǎo)致模型面對復(fù)雜問題時過早省力,答案草率,推理鏈條殘缺。方思明直言,“Opus4.8主要目的還是在修復(fù)Opus4.7遺留的問題,Opus4.7在開發(fā)者圈里絕對不是一個口碑特別好的模型。”

與此同時,外部壓力也不允許Anthropic慢下來。

競爭對手OpenAI最新發(fā)布的GPT-5.5在多項基準(zhǔn)測試中持續(xù)領(lǐng)先,Google Gemini憑借深度融入谷歌生態(tài)的分發(fā)優(yōu)勢構(gòu)成另一維度的競爭。方思明觀察到,這次發(fā)布某種程度上也是Anthropic與OpenAI在“輿論聲量上的直接對沖”。


圖源 / pexels

這背后有一個更深層的行業(yè)現(xiàn)實。不止一位從業(yè)者表示,當(dāng)下大模型在架構(gòu)層面已難以制造顛覆性差距,競爭焦點正在轉(zhuǎn)向工程化實現(xiàn)和工作流塑造。

也就是說,誰先把AI做進(jìn)企業(yè)的日常生產(chǎn)流程,誰就占據(jù)了下一階段的核心位置。“動態(tài)工作流”的推出,正是Anthropic試圖在這一新維度上搶先布局,押注復(fù)雜任務(wù)的自動化交付能力,不再只靠單項測試分?jǐn)?shù)的微弱領(lǐng)先。

而最直接的壓力,來自資本市場。

發(fā)布新模型同日,Anthropic宣布完成650億美元H輪融資,估值提升至9650億美元,其在2026年2月完成G輪融資時估值僅為3800億美元,三個月內(nèi)增長幅度約為154%,離萬億美元只差一步之遙,這個數(shù)字放在任何行業(yè)都稱得上驚人。

支撐這個估值的,是Anthropic的收入增速。有報道稱,該公司預(yù)計二季度營收將達(dá)109億美元,并有望首次實現(xiàn)季度盈利。

巨額融資帶來的彈藥固然充足,但與之對應(yīng)的是資本市場同樣巨大的期待,投資者需要看到與估值相匹配的實質(zhì)性進(jìn)展。

Opus 4.8承擔(dān)著這個“證明自己”的任務(wù)。它在基準(zhǔn)測試上的表現(xiàn)、動態(tài)工作流所描繪的自動化想象,以及全線對準(zhǔn)企業(yè)級市場的產(chǎn)品升級方向,共同構(gòu)成了支撐這近萬億估值的底座,但動態(tài)工作流的投資回報率仍難以量化,“更誠實”的模型承諾能否真正贏得企業(yè)客戶的長期信任,還有待市場的最終檢驗。

所以,Opus 4.8更像是一次信心釋放,用43天一個版本的節(jié)奏告訴市場,它還在加速。但能不能跑穩(wěn),才是這家公司接下來真正要做的事。

*應(yīng)受訪者要求,文中方思明為化名。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
澤連斯基主要對手來了,俄方也擔(dān)憂

澤連斯基主要對手來了,俄方也擔(dān)憂

觀察者網(wǎng)
2026-07-02 15:28:10
65歲老頭用零食哄騙小女孩,對其侵害長達(dá)兩年,12歲女孩懷孕產(chǎn)子

65歲老頭用零食哄騙小女孩,對其侵害長達(dá)兩年,12歲女孩懷孕產(chǎn)子

易玄
2026-06-27 01:06:14
特朗普性侵成立,最高法院沒有救他!

特朗普性侵成立,最高法院沒有救他!

新動察
2026-07-01 10:04:56
秦海璐變賣房產(chǎn),清空全部資產(chǎn),湊出近億身家,絕境兜底救下劉濤

秦海璐變賣房產(chǎn),清空全部資產(chǎn),湊出近億身家,絕境兜底救下劉濤

秋別離
2026-06-13 15:50:00
湖人連續(xù)三筆簽約評級:格里姆斯B- 馬穆B 塞克斯頓B-

湖人連續(xù)三筆簽約評級:格里姆斯B- 馬穆B 塞克斯頓B-

北青網(wǎng)-北京青年報
2026-07-02 19:50:59
最牛“漢奸”夏文運(yùn):吃日本飯睡日本女人,僅用8個字消滅2萬日寇

最牛“漢奸”夏文運(yùn):吃日本飯睡日本女人,僅用8個字消滅2萬日寇

大運(yùn)河時空
2026-07-01 14:25:03
存款大局已定?2026年7月后,居民儲蓄或?qū)⒂瓉砣蟛豢赡孀兙?>
    </a>
        <h3>
      <a href=混沌錄
2026-07-02 16:52:04
周總理去世后發(fā)生了幾件事,有一些載入史冊,一些則成未解之謎

周總理去世后發(fā)生了幾件事,有一些載入史冊,一些則成未解之謎

好運(yùn)來好運(yùn)
2024-12-12 00:50:20
A股周四現(xiàn)極致割裂行情 科技股集體重挫 周五走勢預(yù)判

A股周四現(xiàn)極致割裂行情 科技股集體重挫 周五走勢預(yù)判

老貓觀點
2026-07-02 17:42:20
7月2日今日金價:大家不必等待了!接下來,金價很可能會重演歷史

7月2日今日金價:大家不必等待了!接下來,金價很可能會重演歷史

白淺娛樂聊
2026-07-02 11:05:07
我爸97看起來才60,長壽秘訣不是多走路多吃保健品,而是這四件事

我爸97看起來才60,長壽秘訣不是多走路多吃保健品,而是這四件事

蟬吟槐蕊
2026-06-28 05:16:03
WTT大滿貫雙打四強(qiáng)揭曉,國乒女雙迎來內(nèi)戰(zhàn),蒯曼組合壓哨晉級

WTT大滿貫雙打四強(qiáng)揭曉,國乒女雙迎來內(nèi)戰(zhàn),蒯曼組合壓哨晉級

林子說事
2026-07-02 15:53:16
方媛郭富城牽手現(xiàn)身馬場!一家四口同框,兩女兒穿同款裙太萌了

方媛郭富城牽手現(xiàn)身馬場!一家四口同框,兩女兒穿同款裙太萌了

孤城落日
2026-07-02 17:37:54
馬斯克力挺遭歐洲封殺的電影:好萊塢不希望你看到

馬斯克力挺遭歐洲封殺的電影:好萊塢不希望你看到

移光幻影
2026-06-30 08:31:30
7月買菜,少買豆角和茄子,多吃4種應(yīng)季“黃金菜”,營養(yǎng)又便宜

7月買菜,少買豆角和茄子,多吃4種應(yīng)季“黃金菜”,營養(yǎng)又便宜

秀廚娘
2026-07-02 16:30:15
韓紅公開道歉不到24小時,荒唐的一幕發(fā)生,羅永浩公開“發(fā)難”

韓紅公開道歉不到24小時,荒唐的一幕發(fā)生,羅永浩公開“發(fā)難”

吳蒂旅行ing
2026-07-01 16:16:02
小米粥被發(fā)現(xiàn)!醫(yī)生研究發(fā)現(xiàn):喝得越多,腦梗患者血管或越干凈?

小米粥被發(fā)現(xiàn)!醫(yī)生研究發(fā)現(xiàn):喝得越多,腦梗患者血管或越干凈?

路醫(yī)生健康科普
2026-07-02 12:00:06
1000臺光刻機(jī)成“定心丸”!荷蘭專家:囤貨這步棋,走得太妙

1000臺光刻機(jī)成“定心丸”!荷蘭專家:囤貨這步棋,走得太妙

瘋狂小菠蘿
2026-07-02 14:57:29
1976年毛主席逝世后,遠(yuǎn)在加拿大的張國燾,面對記者說了10個字

1976年毛主席逝世后,遠(yuǎn)在加拿大的張國燾,面對記者說了10個字

野蠻不失女人心
2024-10-06 08:55:33
特朗普換新專機(jī):太興奮了,這是波音造過最好的747飛機(jī);該機(jī)由卡塔爾贈送,改造后奢華程度前所未見,價值4億美元

特朗普換新專機(jī):太興奮了,這是波音造過最好的747飛機(jī);該機(jī)由卡塔爾贈送,改造后奢華程度前所未見,價值4億美元

大風(fēng)新聞
2026-07-02 11:02:45
2026-07-02 21:12:49
AIX財經(jīng) incentive-icons
AIX財經(jīng)
AI新時代,財經(jīng)新觀察。
73文章數(shù) 23223關(guān)注度
往期回顧 全部

科技要聞

馬斯克不承認(rèn),但SpaceX就該造AI手機(jī)

頭條要聞

售價超30萬小鵬新車僅200公里爆胎 4S店給的說法反復(fù)

頭條要聞

售價超30萬小鵬新車僅200公里爆胎 4S店給的說法反復(fù)

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經(jīng)要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

小鵬MONA L03 智能化水平拉滿 還有玩法多樣的巧思大空間

態(tài)度原創(chuàng)

教育
藝術(shù)
游戲
數(shù)碼
家居

教育要聞

壓線生注意!今年填志愿有大風(fēng)險!

藝術(shù)要聞

冉茂芹人物寫生 17幅

MMO式微?我看《天下貳·經(jīng)典版》依舊火熱!

數(shù)碼要聞

聯(lián)想揚(yáng)天S660 27英寸配置上新,6999元

家居要聞

傳奇筑 日常詩

無障礙瀏覽 進(jìn)入關(guān)懷版