網易首頁 > 網易號 > 正文 申請入駐

最強大模型,保質期越來越短了

0
分享至

文 | 深流研究所,作者 | 絳楓

最近,AI 行業引人矚目的一幕,發生在資本市場。

二級市場交易中,Anthropic 的報價一度突破 1 萬億美元,隱含估值首次超過 OpenAI。一年前,兩者的融資估值還相差近 10 倍,OpenAI 仍是幾乎沒有爭議的行業王者。如今,王者之位已經輪替。

這并不是某一家公司單獨的起落,而是整個 AI 行業競爭節奏變化的縮影。過去一年,從模型榜單到用戶口碑,再到資本定價,Google、OpenAI、Anthropic這些頭部AI公司,輪流站上過"最強"的位置。

被看衰的公司,可能在幾個月后重新回到第一梯隊;備受追捧的公司,也可能在登頂后很快迎來質疑。「深流研究所」初步統計,從"被追捧"到"被審視",2023年前后,完成這樣一個周期大約是12-18個月,現在已縮短到3-6個月。

領先開始變得難以維持,輪轉還在繼續加快。至于為什么會變成這樣,才是這場競爭真正值得關注的部分。

六次易主、三輪反轉,"最強"的保質期越來越短了


2025 年至今,LMArena 排行榜上"最強模型"的位置已至少換了 6 次。從 Grok、Gemini、GPT到Claude,四家輪流登頂。

過去,一次領先還能維持幾個月。到了 2026 年初,這個周期已經被壓縮到不足一個月。類似的快速切換,也發生在公司口碑、市場份額和資本信號上。

Google 的變化最先被感知到。2023 年 Bard 首發翻車,2024 年 AI Overviews 又給出荒誕回答,它一度被視為"大公司病"的代表。轉折發生在 2024 年底。Gemini 團隊并入 DeepMind,由 Hassabis 統一管理,Google 的 AI 研發力量被重新整合。

此后,Google 的節奏開始恢復。2025 年 9 月,Gemini 登頂 App Store,首次在移動端壓過 ChatGPT;11 月 Gemini 3 發布后,"Google 逆襲"開始成為主流敘事。母公司Alphabet 年內股價上漲近 70%,市值重新超過微軟。從組織重整到重回第一梯隊,Google 用了12 個月。


OpenAI 的變化更能說明問題。2025 年上半年,它還是不可動搖的王者:ChatGPT 周活達到 7 億,移動端份額 69%。去年 8 月,GPT-5 發布失利成為轉折點。直播出錯、模型宕機,社區掀起"還我 GPT-4o"運動。此后,OpenAI 的移動端份額以月均 2.2 個百分點的速度下滑,到 2026 年初降至 45%。

今年以來,OpenAI 開始戰略收縮。Sora 視頻生成、硬件等副線被砍掉,資源重新集中到編程工具和企業市場。如今,它從一家什么都想做的超級實驗室,變成一家必須證明商業回報的公司,被市場重新審視。

Anthropic則是這一輪變化中節奏最快的公司。2025 年下半年,Claude 在編程和企業工作流里快速建立口碑,成為開發者圈子里事實上的首選。

進入 2026 年后,Anthropic 又進入一段罕見的密集發布期。12 周內,它完成了近 20 次重大產品更新。密集發版直接推高了業績:Anthropic 官方披露其年化收入突破 300 億美元,創下新高;四個月前,這個數字還不到 90 億美元。


融資曲線上,從 2024 年到 2026 年初,Anthropic 追趕 OpenAI 的速度在加快。

OpenAI 估值仍在創新高——最新一輪投后估值達到 8520 億美元,但二級市場已經出現約 10% 的折價。今年 4 月,6 家機構試圖通過 NextRound 出售合計約 6 億美元的股份,甚至出現了滯銷情況。

反觀 Anthropic,估值從 2025 年 3 月的 615 億美元飆升至 2026 年 2 月 G 輪的 3800 億美元。更關鍵的是二級市場:投資者排隊搶購,報價一度突破 1 萬億美元,較 G 輪溢價超過 160%,隱含估值已經反超 OpenAI。

Anthropic 登上口碑王座不久,口碑就已開始回調。最近幾周,Anthropic 接連被曝出算力不足、在未通知用戶的情況下悄悄降低默認推理深度等問題,用戶投訴集中爆發,Fortune 也用長篇報道揭開了內部壓力。Claude 從"最值得信賴的 AI""透明度受質疑",只用了不到兩個月。

從 Google 的逆襲,到 OpenAI 的份額流失,再到 Anthropic 的快速上升和隨之而來的信任危機,看上去這些公司每一次轉向,都有自己的直接原因。真正值得問的是:為什么"領先"本身,越來越難維持?

模型在基礎設施化,技術不再是唯一護城河

模型迭代的邏輯已經變了。

2023 年,AI 公司還在按"大版本制"發布模型。GPT-3.5 到 GPT-4 間隔 15 個月,Claude 2 到 Claude 3 間隔也接近一年。每次發布都是行業大事,一個版本足以定義一整年的競爭格局。

到了 2025 年,這個節奏被打破了。GPT-5 發布后的 7 個月里,OpenAI 連續推出 5.1、5.2、5.3、5.4 四個大版本及多個子版本,最短間隔不到一周。Anthropic 5 個月內發了至少 5 個版本。

過去 16 個月,OpenAI、Anthropic 和 Google 合計完成了超過40次重大模型發布,平均每 3 周發布一次大版本模型。模型迭代從"攢大招",變成"小步快跑"。

模型也不再是一款單品。2023 年的 GPT-4 仍是單一旗艦模型。到了 2025 年,GPT-5 系列已經分化出 Instant、Thinking、Pro、Codex、Mini 五個版本,分別覆蓋輕量對話、深度推理、編程等不同場景和不同成本帶。

Anthropic 和 Google 也都走向了多檔位產品矩陣。模型越來越像操作系統,持續迭代、分層供應、按需調用。


這背后是產業邏輯在發生改變。首先是預訓練的邊際收益在下降?;ㄒ荒陱念^訓練一個更大的模型,換來的性能提升,可能只剩幾個百分點,這已很難支撐"攢一個大版本再發布"的節奏。

相反,微調、推理優化等后訓練手段越來越成熟,同一個底座可以不斷迭代出新性能,不必重新訓練也能做出代際升級。與此同時,推理成本 3 年下降約 1000 倍,開源與閉源的差距縮小到 1.7%。追趕者的起點更高了,領先者的窗口更短了。

更關鍵的是,頭部公司都在完善訓練模型的基建。OpenAI 收購訓練基礎設施公司 Neptune,又和 Cerebras 簽下 3 年、總額超過 200 億美元的芯片協議,開始降低對英偉達的單一依賴;Anthropic 依靠 Constitutional AI,讓 AI 參與訓練 AI,大幅提升后訓練效率;Google 從 TPU 第七代,到 JAX,再到推理服務,幾乎把整條鏈路都握在自己手里。

底層越扎實,上層迭代就越快。這使得過去需要一年做完的模型升級,現在更短的時間就能完成。

一旦模型基礎設施化,一次模型發布的領先或落后,就不再決定勝負。單一維度上的技術領先,也越來越難轉化為持久優勢。

這也是為什么,過去被認為"節奏慢了"的大公司,也有機會靠組織縱深、生態積累、持續發力完成反轉。

Meta 就是最新的例子。2025 年上半年,Llama 4 因刷榜爭議口碑跌到谷底。之后,Meta 投入 143 億美元收購 Scale AI、挖來創始人 Alexandr Wang,并把 AI 部門重組為"超級智能實驗室"。僅用 9 個月,它就重建了技術棧。2026 年 4 月發布的 Muse Spark,也一改此前的開源路線,轉向把閉源模型嵌入 Meta 自有產品生態。

類似的邏輯也在國內上演。騰訊混元過去一年經歷了人員調整和方向摸索后,將研發力量收攏,重建了從預訓練到強化學習的基礎設施。Hy3 preview 是重建后跑出的第一個模型,目前已上線元寶、CodeBuddy、workbuddy、 ima、騰訊新聞、和平精英等十余個騰訊產品。

一個值得注意的細節,Hy3 preview 的預訓練、后訓練等環節是并行推進的,這也加快了Hy3 preview模型的訓練進程。更為重要的是,整個基建和底座搭建完成,混元后續更多模型也將這套基建上啟動訓練,實現更快迭代。

從性能表現看,Hy3 preview是一個總參數 295B、激活 21B 的 MoE 模型,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現大幅提升?;煸獔F隊給這款模型的定位也很清晰——能力體系化、評測真實性、性價比。

Hy3 preview模型在騰訊內部編程、深度研究等業務評測表現穩定,推理效率較上一代提升約 40%,首token延遲降低54%,端到端時長降低47%,成本較上一代模型大幅下降。這意味著,跟用戶體驗和落地可行性相關的核心指標均被大幅優化。

同一時間,GPT-5.5和DeepSeek-V4相繼發布。DeepSeek-V4 主打"交付質量接近 Claude Opus 4.6 非思考模式"的性價比,而非跑分登頂;GPT-5.5 雖仍是 OpenAI 的旗艦,強調的也不是智能上限,而是"為真實工作而設計"。

三款模型,共性清晰:不再比拼參數和榜單,而是圍繞 Agent、編程交付、長上下文和單位任務成本做深化,評測標準也從公開基準轉向真實場景。這正是"模型基礎設施化”的直接體現。

競爭維度在擴展,優勢不再集中在一家公司


模型之外,產品戰場同樣戰況激烈。過去一年多,僅 OpenAI、Anthropic 和 Google 三家,就完成了超過 40 次非模型級的重大產品發布。

三家的打法并不一樣。OpenAI 鋪得最廣,Agent、編程、辦公集成和消費端同時推進;Anthropic 最聚焦,僅今年 2 月到 3 月的 52 天里,這家公司就密集推出了 74 款大小產品更新,大部分圍繞編程和企業工作流縱深突破;Google 沒有從零做新入口,而是把 AI 能力持續嵌入搜索、辦公和內容產品。

盡管方向不同,但這些密集布局背后有一個共同的驅動力:當模型能力越來越接近,誰更快把模型接進真實場景,誰就更容易成為用戶的默認選擇。

Agent 范式的出現,又把這個趨勢往前推了一步。AI 不再只是回答問題,而是開始調用工具、執行多步驟任務,直接完成一整條工作流。這意味著,只有好模型已經不夠了,還得匹配穩定的執行環境、成熟的工具鏈、可靠的安全機制,以及把這些東西真正串起來的工程能力。

OpenAI 為此搭建了 Apps SDK 和 AgentKit,試圖讓開發者更快構建可調用外部工具的 AI 應用;Anthropic 推出 MCP 協議和 Computer Use,前者統一了 AI 與外部數據源的連接方式,后者讓 Claude 可以直接操作電腦完成任務。

在國內,OpenClaw 今年 3 月爆火后,大廠的 Agent 布局也迅速提速。

騰訊一周內上線了 WorkBuddy、QClaw、CodeBuddy 等多款 Agent 產品,并圍繞 Lighthouse 云端部署、ADP 智能體開發平臺、安全沙箱等能力搭起了一整套 Agent 基礎設施,是動作最敏捷的大廠之一。字節跳動上線了云端方案 ArkClaw,此前已推出 Agent 開發平臺扣子和 AI 編程工具 TRAE;阿里也推出了開源桌面 Agent 工具 QwenPaw。

這場競爭的門檻,已經不只在模型本身,而在模型之外的工程化交付能力。騰訊集團高級執行副總裁湯道生近期也提到,"AI 落地不只是一道算法題,更是一道工程題"。主流模型之間的能力差距在收斂,真正拉開差距的,是誰能把 AI 放進具體場景里,并把鏈路做深、做穩、做順。

這也意味著,競爭形態已經變了。過去,大家追求的是全面領先;現在,越來越多公司追求的是局部優勢。Anthropic 是最典型的例子。它并不試圖在所有維度上壓過 OpenAI,而是把編程和企業工作流做到開發者首選,最終用場景深度換來了市場份額反超。

場景理解、工具鏈和用戶粘性,這些東西比模型跑分更難復制,也更難追平。誰在自己的主場打得更深,誰的位置就更穩。"階段性占優"正在取代"長期統治",成為這個行業更真實的常態。

軍備競賽繼續加速,AI 比拼從"誰最強"走向"誰最持久"


2026 年,僅 Amazon、Google、Meta 和 Microsoft 四家的 AI 資本支出,就預計達到 5870 億至 6700 億美元,接近 2025 年的兩倍。真正值得注意的,不只是規模,而是錢花在了哪里。

過去三年,AI 競賽的瓶頸幾乎每年都在變。2023 年,核心問題是誰先訓練出最強模型;2024 年,瓶頸變成 GPU 供應,H100 一卡難求;2025 年,推理算力成為新卡點,推理在 AI 算力支出中的占比從 33% 翻倍至 66%。

到了 2026 年,瓶頸繼續往下沉,落到電力和物理基建。全球數據中心年耗電量預計突破 1000 TWh,接近日本全國一年的用電量;有機構預測,未來三年美國數據中心的電力缺口高達 47 GW。

現在,每投入 1 美元做 AI,背后大約還要配套 2.3 美元的基礎設施支出。今天的 AI 軍備競賽,大部分錢已經不是花在模型上。

這改變了AI行業的競爭邏輯。決定一家公司能否繼續擴張、誰會被迫減速的,越來越不只是模型能力,而是電力、數據中心和交付能力。

擁有自建基礎設施的平臺公司,因此獲得了結構性優勢。相反,純模型公司一旦用戶增長超出基建承載力,就可能被物理瓶頸卡住。

Anthropic 今年的算力危機就是最直接的例子:模型贏了,收入創了歷史新高,但基礎設施沒跟上,最終被迫下調輸出質量。領先本身,反而可能成為負擔。

巨額投入也在同步抬高市場預期。盡管四大巨頭計劃支出超過 6500 億美元,近一半美國數據中心項目仍可能因為電力設備短缺而延期或取消。到現在為止,還沒有哪家 AI 公司真正證明了持續、規?;恼?ROI。

錢投得越多,市場的容錯率可能就越低;預期越高,一次產品事故或一次交付失速帶來的口碑損傷就越大。

過去,市場習慣用一個簡單框架理解 AI 公司:誰的模型最強,誰就會贏。如今,真正決定市場評價的,不再只是模型跑分,而是一組更復雜的變量:推理能力有沒有躍遷,Agent 能力是否可感知,商業模式能否可持續,生態壁壘是否足夠高。

一家公司在一段時間里發布節奏失焦、體驗不及預期、對外敘事脫離用戶和開發者體感,就可能從"默認贏家"變成"被重新審視的對象"

反過來,一家公司如果能在關鍵窗口里同時做到模型能力明顯提升、工具鏈和工作流補齊、再拿出幾個強信號產品接住體驗,也有機會完成一輪口碑反轉,獲得階段性優勢。

技術趨同,讓"最強"失去決定性意義;競爭外溢,讓"統治"失去穩定基礎;資本加速,則讓市場預期變得更高。

三層變化疊在一起,AI 行業進入了一個結構性的快速輪轉期。領先的保質期在縮短,行業也正在從"誰最強"的時代,走向"誰最持久"的時代。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
湖南岳陽通報“一中學生在校期間飲水杯被同學投放異物”

湖南岳陽通報“一中學生在校期間飲水杯被同學投放異物”

界面新聞
2026-04-28 11:36:30
我們絕不能中計,特朗普正在賭,賭中國不敢強扣美國運臺軍火船!

我們絕不能中計,特朗普正在賭,賭中國不敢強扣美國運臺軍火船!

南山塔的姑娘
2026-04-28 01:21:28
歐冠-巴黎1-1拜仁:巴黎是不是真的強,孔帕尼是否真名帥|前瞻

歐冠-巴黎1-1拜仁:巴黎是不是真的強,孔帕尼是否真名帥|前瞻

體育世界
2026-04-28 12:29:48
特朗普在白宮迎接英王,共進下午茶,系查爾斯三世即位后首次訪美

特朗普在白宮迎接英王,共進下午茶,系查爾斯三世即位后首次訪美

新京報
2026-04-28 09:21:07
體制內“女兒國”現象越來越嚴重,領導吐槽:工作都不好開展!

體制內“女兒國”現象越來越嚴重,領導吐槽:工作都不好開展!

燈錦年
2026-04-27 14:10:17
有人問,若是國民黨當年贏了,老蔣統治中國,那中國的未來會如何

有人問,若是國民黨當年贏了,老蔣統治中國,那中國的未來會如何

浩渺青史
2026-04-27 17:06:59
上海兩女子地鐵打架后續:原視頻曝光,難怪年輕女孩不給老人讓座

上海兩女子地鐵打架后續:原視頻曝光,難怪年輕女孩不給老人讓座

奇思妙想草葉君
2026-04-27 17:04:00
77年來首次?北約內部討論“冷處理”特朗普,被迫放棄每年一會

77年來首次?北約內部討論“冷處理”特朗普,被迫放棄每年一會

上觀新聞
2026-04-28 13:50:53
隨著特魯姆普爆冷12-13,吳宜澤13-11,斯諾克世錦賽8強對陣出爐

隨著特魯姆普爆冷12-13,吳宜澤13-11,斯諾克世錦賽8強對陣出爐

側身凌空斬
2026-04-28 05:28:25
匈牙利一夜變天:馬扎爾開啟全面清算!歐爾班往哪走?

匈牙利一夜變天:馬扎爾開啟全面清算!歐爾班往哪走?

大江看潮
2026-04-27 09:05:55
離譜!許家印只喝2700一瓶水 馬桶必須噴香水 隨身配備女按摩師

離譜!許家印只喝2700一瓶水 馬桶必須噴香水 隨身配備女按摩師

念洲
2026-04-28 11:37:39
首個4-0!雷霆橫掃太陽晉級半決賽,SGA31+8布克24+6

首個4-0!雷霆橫掃太陽晉級半決賽,SGA31+8布克24+6

湖人崛起
2026-04-28 12:14:16
拒絕閉門造車,北汽探索BIP模式,北京81先來打個樣

拒絕閉門造車,北汽探索BIP模式,北京81先來打個樣

汽車網評
2026-04-28 09:08:37
“開不壞”的一汽豐田:在速朽的時代,做時間的朋友!

“開不壞”的一汽豐田:在速朽的時代,做時間的朋友!

中視汽車
2026-04-28 09:09:08
現在就業環境真的這么嚴峻嗎?

現在就業環境真的這么嚴峻嗎?

慧翔百科
2026-04-27 17:34:09
悲催!丈夫降薪被迫離婚,女子分40萬后,得知前夫失業慶幸跑得早

悲催!丈夫降薪被迫離婚,女子分40萬后,得知前夫失業慶幸跑得早

火山詩話
2026-04-28 11:02:31
汪涵妻子被爆近況沖上熱搜:什么樣的“愛”會讓人窒息?

汪涵妻子被爆近況沖上熱搜:什么樣的“愛”會讓人窒息?

桌子的生活觀
2026-04-28 12:19:53
男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

爆角追蹤
2026-04-27 14:54:06
交警提醒:2026車險新規落地,只買 2 種就夠用,一年省下幾千塊

交警提醒:2026車險新規落地,只買 2 種就夠用,一年省下幾千塊

芳姐侃社會
2026-04-28 00:01:03
重磅整治!花唄、白條集體消失,你的錢包要變了

重磅整治!花唄、白條集體消失,你的錢包要變了

旭成傳播
2026-04-28 01:00:40
2026-04-28 14:56:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
132884文章數 862119關注度
往期回顧 全部

科技要聞

10億周活目標落空!傳OpenAI爆發內部分歧

頭條要聞

辭任杭州市市長后 姚高員已任浙江省政府黨組成員

頭條要聞

辭任杭州市市長后 姚高員已任浙江省政府黨組成員

體育要聞

季后賽最新局勢:雷霆4-0晉級首隊 4隊3-1

娛樂要聞

蔡卓妍官宣結婚,老公比她小10歲

財經要聞

俞敏洪再遭重擊

汽車要聞

拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

態度原創

親子
家居
手機
時尚
本地

親子要聞

47歲卵巢功能衰退正常嗎?高齡備孕吃什么卵子質量更好?

家居要聞

江景風格 流動的秩序

手機要聞

華為三折疊手機持續迭代 新款預計10月推出

T恤+闊腿褲、襯衫+闊腿褲,今年夏天最火的搭配,誰穿誰時髦!

本地新聞

用青花瓷的方式,打開西溪濕地

無障礙瀏覽 進入關懷版