網易首頁 > 網易號 > 正文 申請入駐

難以置信!DeepSeek 新變體速度提升200%,企業部署成本銳減60%

0
分享至

距離DeepSeek發布其熱門開源模型 DeepSeek 的最新版本 R1-0528,才剛過去一個多月,本周,一家 24 年歷史的德國公司 TNG 技術咨詢有限公司發布了一個此類改編版本:DeepSeek-TNG R1T2 Chimera,這是其 Chimera 大型語言模型系列的最新型號。

R1T2 在效率和速度上實現了顯著提升,其智能基準分數達到 R1-0528 的 90% 以上,同時生成答案所需的輸出 token 數量不到 R1-0528 的 40%。

這意味著它能產生更簡短的回復,直接轉化為更快的推理速度和更低的計算成本。在 TNG的AI 代碼共享社區上,該公司稱其 “比常規 R1快約 20%,比 R1-0528快兩倍以上”。

對此,AI 開發者社區的反響極為熱烈。社區高級負責人寫道:“天啊!DeepSeek R1T2,比 R1-0528 快 200%,比 R1 快 20%。在 GPQA 和 AIME 24 上顯著優于 R1,通過專家組裝法結合 DS V3、R1 和 R1-0528 構建,且采用 MIT 許可證,可在社區 上獲取。”

這一提升得益于 TNG 的專家組裝(AoE)方法,這是一種通過選擇性合并多個預訓練模型的內部參數來構建 LLM 的技術。作為原始 R1T Chimera 的后繼者,R1T2 引入了新的 “三思維”(Tri-Mind)配置,集成了三個父模型:DeepSeek-R1-0528、DeepSeek-R1 和 DeepSeek-V3-0324。其結果是一個經過精心設計的模型,既能保持高推理能力,又能顯著降低推理成本。

而且,R1T2 的構建無需進一步微調或再訓練。它繼承了 R1-0528 的推理優勢、R1 的結構化思維模式,以及 V3-0324 簡潔的指令導向特性,為企業和研究應用提供了一個更高效且有能力的模型。

01

專家組裝(AoE)與

專家混合(MoE)的區別

專家混合(MoE)是一種架構設計,其中不同組件根據輸入有條件地激活。在 DeepSeek-V3 或 Mixtral 等 MoE LLM 中,任何給定 token 的前向傳播過程中,僅激活模型專家層的一部分。這使得超大型模型能夠實現更高的參數數量和專業化,同時保持推理成本可控,因為每個 token 僅評估網絡的一小部分。

專家組裝(AoE)是一種模型合并技術,而非架構。它用于通過選擇性插值多個預訓練 MoE 模型的權重張量來創建新模型。AoE 中的 “專家” 指的是被合并的模型組件,通常是 MoE 層內的路由專家張量,而非運行時動態激活的專家。

TNG 對 AoE 的實現主要側重于合并路由專家張量,同時通常保留來自更快模型的更高效共享層和注意力層。這種方法使生成的 Chimera 模型能夠繼承推理能力,而無需復制最強父模型的冗長或延遲。

02

性能與速度:基準測試的實際結果

E-25 和 GPQA-Diamond 測試集衡量,R1T2 實現了其最智能父模型 DeepSeek-R1-0528 90% 至 92% 的推理性能。然而,與 DeepSeek-R1-0528 不同,R1T2 被設計為更加簡潔。它能以少得多的詞匯量提供同樣智能的響應。TNG 并非關注原始處理時間或每秒 token 數,而是以每個答案的輸出 token 數來衡量 “速度”,這是成本和延遲的實用代理指標。

根據 TNG 共享的基準測試,R1T2 生成響應所需的 token 數約為 R1-0528 的 40%。這意味著輸出長度減少 60%,直接縮短推理時間和計算負載,將響應速度提升 2 倍,即 200%。與原始 DeepSeek-R1 相比,R1T2 平均也約縮短 20%,為高吞吐量或成本敏感的部署提供了顯著的效率提升。這種效率并未以智能為代價。

03

部署注意事項與可用性

R1T2 根據寬松的 MIT 許可證發布,現已在社區上提供,這意味著它是開源的,可用于構建商業應用。TNG 指出,盡管該模型非常適合一般推理任務,但由于繼承自 DeepSeek-R1 的局限性,目前不建議用于需要函數調用或工具使用的用例。這些問題可能在未來的更新中解決。

對企業技術決策者的意義

對于CTO、AI 平臺所有者、工程負責人和 IT 采購團隊而言,R1T2 帶來了切實的好處和戰略選擇:

更低的推理成本:每個任務的輸出 token 更少,R1T2 減少了 GPU 時間和能源消耗,直接轉化為基礎設施節省 —— 這在高吞吐量或實時環境中尤為重要。

無開銷的高推理質量:它保留了 R1-0528 等頂級模型的大部分推理能力,但沒有其冗長性。這非常適合數學、編程、邏輯等結構化任務,這些任務更偏好簡潔的答案。

開放且可修改:MIT 許可證允許完全的部署控制和自定義,支持在受監管或空氣隔離環境中進行私有托管、模型對齊或進一步訓練。

新興的模塊化:AoE 方法預示著未來模型將以模塊化方式構建,使企業能夠通過重組現有模型的優勢來組裝專用變體,而無需從頭開始再訓練。

注意事項:依賴函數調用、工具使用或高級代理編排的企業應注意當前的局限性,盡管未來的 Chimera 更新可能會解決這些差距。

關于首席信息官

公眾號“首席信息官 ”由資深媒體人創辦,致力于用專業的文字,精準的洞察,特色的服務,深入的踐行服務企業數智化領域,為產業的發展點燃“微光”!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
240萬重罰+徹底除名!張本智和被棄,這場決裂藏著多少殘酷真相

240萬重罰+徹底除名!張本智和被棄,這場決裂藏著多少殘酷真相

行舟問茶
2026-04-25 13:02:48
印度否認軍機墜毀

印度否認軍機墜毀

新華社
2026-04-24 23:48:02
醫生1分鐘復位收100元被舉報,衛健委回懟:應收110,你還少給了!家長拒繳溜走!

醫生1分鐘復位收100元被舉報,衛健委回懟:應收110,你還少給了!家長拒繳溜走!

醫客
2026-04-23 12:09:21
比土木還崩的專業,從年薪20萬跌到月薪2500,畢業即轉行!

比土木還崩的專業,從年薪20萬跌到月薪2500,畢業即轉行!

燈錦年
2026-04-23 19:35:21
醫院判定腦積水 7歲“腦癱”男童被查出出生就遭受顱骨骨折

醫院判定腦積水 7歲“腦癱”男童被查出出生就遭受顱骨骨折

大象新聞
2026-04-25 10:21:09
特斯拉客服回應“FSD將于5月1日在中國上線”:不實

特斯拉客服回應“FSD將于5月1日在中國上線”:不實

IT之家
2026-04-25 11:29:10
統一臺灣后,第一任省長由誰擔任最合適?五人上榜,一人脫穎而出

統一臺灣后,第一任省長由誰擔任最合適?五人上榜,一人脫穎而出

知鑒明史
2026-04-24 20:05:03
芬蘭空軍學員駕飛機空中畫巨型不雅圖案 遭軍方譴責、網友抨擊

芬蘭空軍學員駕飛機空中畫巨型不雅圖案 遭軍方譴責、網友抨擊

環球趣聞分享
2026-04-24 13:10:17
多名院士調查發現:吃一口放久發酵的腐乳,或等于進一次毒?真假

多名院士調查發現:吃一口放久發酵的腐乳,或等于進一次毒?真假

路醫生健康科普
2026-04-25 16:05:03
隨著馬刺2-1開拓者,湖人3-0火箭,西部4強懸念不大了,基本如下

隨著馬刺2-1開拓者,湖人3-0火箭,西部4強懸念不大了,基本如下

小火箭愛體育
2026-04-25 13:59:22
普京支持率跌破戰后最低后被“消音”:克宮直接下令媒體不準報道

普京支持率跌破戰后最低后被“消音”:克宮直接下令媒體不準報道

桂系007
2026-04-25 17:24:36
川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

懂球帝
2026-04-24 18:27:06
正式簽約!加盟雄鹿!字母哥被孤立

正式簽約!加盟雄鹿!字母哥被孤立

籃球教學論壇
2026-04-25 16:29:48
雙子星閃耀!哈珀卡斯爾同場砍25+:比肩杜蘭特韋少

雙子星閃耀!哈珀卡斯爾同場砍25+:比肩杜蘭特韋少

體壇周報
2026-04-25 15:59:10
斯諾克世錦賽:丁俊暉被罰9分逆轉失敗!趙心童脫險,追到3-3!

斯諾克世錦賽:丁俊暉被罰9分逆轉失敗!趙心童脫險,追到3-3!

劉姚堯的文字城堡
2026-04-24 23:50:42
美專家一致認為:戰勝中國只有一個辦法,但這條紅線美國不敢跨越

美專家一致認為:戰勝中國只有一個辦法,但這條紅線美國不敢跨越

歷史龍元閣
2026-04-25 12:20:12
酒店里,擠滿了偷偷開房的已婚女性

酒店里,擠滿了偷偷開房的已婚女性

LULU生活家
2026-04-22 19:03:27
面試官:“谷歌 75% 新代碼都是 AI 寫的,你還學什么?” 我:“那剩下 25% 翻車的時候,你為什么還付錢給谷歌工程師?”

面試官:“谷歌 75% 新代碼都是 AI 寫的,你還學什么?” 我:“那剩下 25% 翻車的時候,你為什么還付錢給谷歌工程師?”

程序員魚皮
2026-04-25 13:58:41
廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

多特體育說
2026-04-25 11:24:28
兩兄弟公司破產的真相!小雞嘴女星復出的代價!

兩兄弟公司破產的真相!小雞嘴女星復出的代價!

八卦瘋叔
2026-04-25 11:34:30
2026-04-25 18:23:00
首席信息官 incentive-icons
首席信息官
以數字化和商業創新為視角
516文章數 130關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

伊朗最高領袖一條腿截肢面部嚴重燒傷 通信方式披露

頭條要聞

伊朗最高領袖一條腿截肢面部嚴重燒傷 通信方式披露

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

游戲
藝術
旅游
家居
本地

《殺戮尖塔2》開發者堅稱門扉締造者強度沒有問題

藝術要聞

美國發現一部《十七帖》!這字還原真實的王羲之筆法,放大10倍仍無瑕疵

旅游要聞

繁花未盡 音浪已起——新鄉何以常來常“新”?

家居要聞

自然肌理 溫潤美學

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

無障礙瀏覽 進入關懷版