網易首頁 > 網易號 > 正文 申請入駐

拐點出現,中國開源大模型下載量超越美國

0
分享至

最近,Interconnects.ai 的一份報告,像在科技圈丟下一枚炸彈:截至 2025 年 8 月,中國開源大模型在 HuggingFace 上的下載量正快速趕上美國,幾乎已經超越了。

美國這2年在開源模型上的領先地位,似乎正在被反超。在鯨哥看來,這不只是一個數據酷炫,下載量說明大家真的在用,證明我們在模型質量、生態建設等方面都實現了反超。

很多人不理解意義,簡答說在移動互聯網時代,很多人都用的是安卓手機,開源的安卓統治了移動操作系統的過半壁江山。AGI時代,Meta也高舉開源大模型的大旗,很多國外企業采用Llama作為AI 引擎,輸出AI的消費級服務。

Llama差點成為新時代的安卓,現在 DeepSeek、Qwen等模型,改變了這一現狀。

國產大模型的高光時刻

具體說,是Interconnects.ai 在《ATOM Project》這份報告里,統計了 Meta、Google、Mistral AI、Microsoft、Alibaba Qwen 和 DeepSeek 等幾家主要大模型開放者,從它們在 HuggingFace 上的下載量和派生(fine?tune/派生模型)的情況做了歸類。報告里幾個關鍵點:

到 2025 年 8 月,美國領先的開源模型(主要是 Llama / Meta 系列)與中國領先的開源模型下載總量都在約 3 億次(~300M 次下載)左右。兩邊差距已經非常小。

中國模型下載量的增長速度明顯快于美國模型。每個月新下載量/新增派生模型的比例,中國那邊漲得更陡。

在派生/fine?tune 模型數量上,美國的留存領頭優勢在減弱。以前美國模型(主要是 Llama 系列)派生模型占比非常高,但到現在,中國模型(比如 Qwen 系列)一個月的新派生模型中可能占到40% 以上。美國 Llama 系列的派生比例從巔峰時的近 50% 下滑到大約 15%。

再看國產模型的一些動靜:

DeepSeek 的 V3 與 R1 模型,自從發布后震動不小。DeepSeek?V3 發布在 2024 年底/2025 年初,其在數學、編碼任務上的表現被業界認為“性價比高 + 推理 +成本比驚人”。

緊接著,阿里在 2025 年春節發布了Qwen 2.5?Max。幾個月后,阿里又發布了 Qwen 3 系列,帶 hybrid reasoning(混合推理)能力。

Qwen3包含235B和30B兩種MoE架構及6個Dense模型,覆蓋6B-232B的多種尺寸的8款系列模型。阿里的Qwen系列更新速度和更新范圍在全球都無出其右。

不只是DeepSeek和Qwen在充當主力軍,混元開放從 0.5B 到7B 的小尺寸模型,支持終端與低功耗場景落地。

Kimi K2 是一個 1T 參數總量、32B 激活參數的 MoE 模型,對 Agent 與 coding 任務友好,支持 128K 上下文,開源且免費商用。

GLM-4.5 融合了推理、代碼與智能體能力,是國產開源模型中的新標桿,在多個 benchmark 上為開源模型中表現最優,參數效率與成本效益顯著提升。

所以「下載量幾乎趕上 + 新模型速度 +派生/fine?tune 模型數目增多」這些都指向了一個拐點:中國開源大模型生態不再是追隨者,而是正式進入高速對抗+超越可能的階段。

國外開源為何落后?

美國這邊落后的原因,不是因為人物不努力,而是結構 +生態 +方向 +部署門檻幾個地方被拉開了差距。Llama 4 是一個重要節點,可以重點說下。

Meta 在 2025 年發布了 Llama 4 家族(包括 Maverick、Scout 等版本),這個趕工版本出現了很多問題:

1.過載現象嚴重,應試的產物

有傳言Llama 4 在后訓練階段中,將多個benchmark測試集混入訓練數據。這讓模型的測試成績出眾,但在泛化任務中表現差強人意。實測很多任務的表現還不如GPT-4o。

2.派生 /開源自由度下降

雖然 Llama4 是開源權重模型(open?weight 模型家族),但在派生(fine?tune/第三方修改)社區里的活力相比之前有所下降。Interconnects 報告里提到,美國模型(Llama 系列)派生模型的比例從 2024 年底約 50% 高峰降到現在約 15%。意味著很多用戶/開發者在下載之后,不是“繼續改造/訓練/fine?tune”的機會變少了。

3.成本與部署門檻太高

DeepSeek 和 Qwen 在“低成本推理”“輕量版本 /蒸餾版/distill/量化支持”上動作快,用 GPU/硬件要求稍低的版本可用性更高。Llama4 在最強的版本可能需要更高算力/內存/成本,這在很多中小企業/開發者里是門檻。

而GPT和Grok開源速度又很慢,難以扛起國外的開源大旗。

OpenAI 在 2025 年 8 月 6 日推出自 GPT-2 以來的首批開源權重語言模型 gpt-oss-120b 與 gpt-oss-20b,性能堪比 o4-mini 和 o3-mini,可在高端筆記本和手機上運行。

不過,OpenAI 的主流模型如 GPT-4o、GPT-5 等仍然是閉源的。

8 月 24 日,xAI 開源了 Grok-2。Grok-2 在編碼、復雜問題和數學方面表現出色,還能生圖識圖,性能比肩當時的 GPT-4o。不過,Grok-2 的開源協議較為嚴苛,xAI 允許非商業與合規商業使用,但禁止用其訓練其他基礎模型,僅當關聯公司年收入低于一百萬美元時,才可用于商業用途,超過此門檻的商業用途需獲得 xAI 的單獨許可。

xAI 表示 Grok-3 將在 Grok-2 開源大概 6 個月內開源。

現在美國開源的大旗,已經看不到一個實力選手了。

開源未來之路探索

最核心的原因,是Meta的Llama4 發布的口碑,確實影響了其行業認可度。

尤其Llama4 雖然支持多模態,但在OCR/圖像 + 文本混合應用等細節優化,以及成本/延遲/部署資源要求上,用戶反饋并不是每個場景都能“拿來就用”。

最新消息傳言,新版本的Llama4X可能轉向閉源。

中國的 DeepSeek + Qwen 則多頻次推出新版本/升級,以及強勁的中國本土需求 +語言 +多模態場景,讓中國模型在下載量+派生+部署效率上增長非常快。

國產開源大模型每隔一段時間就有新版本/新變體/容量/多模態/OCR/混合模態之類的更新。這些頻率+迭代讓用戶/社區“跟得上看到實際進步”的那種信心很強。

比如,最新的 Qwen?3 系列/Qwen?Next(有的媒體稱之為 下一代 Qwen,或者 Qwen3)被報道擁有混合推理能力(hybrid reasoning),更強的推理 + 對多模態 /實際應用場景的支持。

總結:這不是某一個模型的“反超”,而是生態拐點。
甚至a16z的合伙人Martin Casado說,預計80%的灣區初創公司,都在基于中國開源模型進行開發。

未來幾個月/一年里,我們可以重點看三件事:

  1. Qwen?Next / Qwen3 等下一代模型的正式 benchmark +開源程度如何;

  2. DeepSeek 后續版本將帶來多大程度的升級,R2或者V4帶來驚喜可期;

  3. HugginFace/ModelScope 等開源模型托管/派生生態是不是繼續給中國模型更大的空間增長。

總結來說,中國開源模型的優勢不僅是“便宜”或“中文好”,而是“速度 +迭代 +社區生態 +部署門檻低”,這些組合在一起,構成了現在這個拐點。

參考資料:

https://www.interconnects.ai/p/on-chinas-open-source-ai-trajectory

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
歷史性突破!人民幣石油結算躍居全球第二。

歷史性突破!人民幣石油結算躍居全球第二。

流蘇晚晴
2026-04-16 19:08:19
談臺灣農產品銷陸,王金平人馬蕭漢俊促民進黨當局別為反對而反對

談臺灣農產品銷陸,王金平人馬蕭漢俊促民進黨當局別為反對而反對

海峽導報社
2026-04-21 07:36:08
你與球員間有隔閡嗎?羅塞尼爾:沒有,是他們缺乏斗志和信念

你與球員間有隔閡嗎?羅塞尼爾:沒有,是他們缺乏斗志和信念

懂球帝
2026-04-22 06:02:26
東風 - 31 泄密大案:總工程師被美色策反,國之重器險遭滅頂之災

東風 - 31 泄密大案:總工程師被美色策反,國之重器險遭滅頂之災

干史人
2026-04-18 13:44:12
雷神山院長落馬,最揪心的是無數女醫護背后的家庭

雷神山院長落馬,最揪心的是無數女醫護背后的家庭

墨羽怪談
2026-04-21 14:13:25
5種人工養殖的海魚,幾乎沒有純野生的,最后一種號稱“藥罐子”

5種人工養殖的海魚,幾乎沒有純野生的,最后一種號稱“藥罐子”

秀廚娘
2026-04-16 11:24:34
打了45天,伊朗終于發現最大敵人不是美國,不是以色列,而是他們

打了45天,伊朗終于發現最大敵人不是美國,不是以色列,而是他們

楠楠自語
2026-04-15 13:07:39
600606,致歉!更正業績預告,最多虧損265億元!

600606,致歉!更正業績預告,最多虧損265億元!

證券時報e公司
2026-04-21 19:33:07
郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

男足的小球童
2026-04-21 18:16:37
中國最時髦女性,都在練芭桿

中國最時髦女性,都在練芭桿

體育產業生態圈
2026-04-21 20:46:24
醫生忠告:肺癌早期不是咳嗽,而是頻繁出現這3個癥狀,小心異常

醫生忠告:肺癌早期不是咳嗽,而是頻繁出現這3個癥狀,小心異常

芹姐說生活
2026-04-18 15:22:35
女籃世界杯分組出爐!中國隊進死亡之組,難進8強,日韓抽到好簽

女籃世界杯分組出爐!中國隊進死亡之組,難進8強,日韓抽到好簽

侃球熊弟
2026-04-22 01:01:46
擬授大將的王震為何終被授上將?與戰功無關,賀龍態度成核心因素

擬授大將的王震為何終被授上將?與戰功無關,賀龍態度成核心因素

莫地方
2026-04-22 00:45:03
采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

千秋文化
2026-04-15 20:18:32
美伊還沒停火,又一國要迎戰美軍,中國無視警告,先一步送上援助

美伊還沒停火,又一國要迎戰美軍,中國無視警告,先一步送上援助

聞識
2026-04-19 23:14:34
深圳海事局發出警示

深圳海事局發出警示

澎湃新聞
2026-04-21 01:19:02
李亞鵬官宣!嫣然醫院告別14年租房,新院區地理位置優越

李亞鵬官宣!嫣然醫院告別14年租房,新院區地理位置優越

王楔曉
2026-04-21 04:42:47
同時聊300個“老頭”,能月入兩三萬?專挑8090后下手,批量收割

同時聊300個“老頭”,能月入兩三萬?專挑8090后下手,批量收割

米果說識
2026-04-19 22:20:16
F1車隊集體“逼宮”成功!FIA妥協,2026規則修改,邁阿密站實施

F1車隊集體“逼宮”成功!FIA妥協,2026規則修改,邁阿密站實施

體育妞世界
2026-04-21 11:05:45
吳宜澤:贏得冠軍是我的夢想!奧沙利文走錯場地,第34次戰世錦賽

吳宜澤:贏得冠軍是我的夢想!奧沙利文走錯場地,第34次戰世錦賽

排球黃金眼
2026-04-22 00:49:53
2026-04-22 08:16:49
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
149文章數 38關注度
往期回顧 全部

科技要聞

創造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

伊朗極限拉扯拒絕談判 特朗普宣布:延長停火期限

頭條要聞

伊朗極限拉扯拒絕談判 特朗普宣布:延長停火期限

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

家居
本地
藝術
游戲
公開課

家居要聞

詩意光影 窺見自然之境

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

藝術要聞

無花不風景

漲價兩周即回調!索尼官方PS5數字版定價重回399美元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版