網易首頁 > 網易號 > 正文 申請入駐

Zyphra推出Zamba2-mini:以高效性能重新定義設備端AI的小語言模型

0
分享至

Zyphra公司近日發布了Zamba2-mini 1.2B,一款專為設備端應用程序設計的尖端小語言模型。

這款端側開源AI模型共有12億參數,并且在4bit量化下內存占用低于700MB。被稱為端側SOTA(state-of-the-art)小語言模型的Zamba2-mini,雖然尺寸不大,但其性能卻媲美諸如谷歌的Gemma-2B、Huggingface的SmolLM-1.7B、蘋果的OpenELM-1.1B以及微軟的Phi-1.5等更大規模的模型。

1

小身材,大能量:挑戰更大模型的性能

Zamba2-mini的發布引起了廣泛關注,原因在于它成功將高效性能與低內存占用結合

這款“小鋼炮”級別的模型在推理任務中的表現令人驚嘆。與谷歌的Gemma-2B、Huggingface的SmolLM-1.7B、蘋果的OpenELM-1.1B以及微軟的Phi-1.5等更大規模模型相比,Zamba2-mini并不遜色。它不僅首次令牌時間快了一倍,還能在內存占用上減少27%。

這一性能得益于其高度優化的架構設計。Zamba2-mini結合了Transformer和遞歸神經網絡(RNN)的元素,既保留了大型密集變壓器的高質量輸出,又維持了較小模型的計算和內存效率。這種高效性使得Zamba2-mini特別適合資源有限但對高性能有需求的設備端AI應用。

2

優化架構:效率與質量的完美平衡

Zamba2-mini 1.2B的卓越表現歸功于其高度優化的架構設計。該模型結合了不同神經網絡設計的優點,既能保持大型密集變壓器的高質量輸出,又能以更小模型的計算和內存效率運行。

與前代Zamba1相比,Zamba2-mini引入了兩個共享注意力層(attention layers),增強了模型在不同深度上保持信息的能力,從而進一步提高了整體性能。此外,模型在共享注意力層中引入了旋轉位置嵌入,進一步提升了其運算效率。

3

龐大數據集與精心預訓練:卓越性能的基礎

Zamba2-mini是在一個包含三萬億個tokens的龐大數據集上進行預訓練的。

這些數據來自Zyda和其他公開來源,經過了嚴格的過濾和重復處理,以確保最高質量的訓練數據。

在annealing階段,模型還在1000億個極高質量的tokens上進行了專門訓練。這一精心設計和處理的數據集為Zamba2-mini提供了卓越的性能基礎,使其在各種推理任務中表現出色。

4

開源許可:推動行業創新的動力

Zyphra已承諾將Zamba2-mini作為Apache 2.0許可下的開源模型。此舉旨在推廣先進的AI技術,促進整個行業的創新和發展。

通過提供Zamba2-mini的開源模型權重,Zyphra使開發人員和研究人員可以在他們的項目中自由使用這一模型,推動高效語言模型的進一步研究和開發。

Zamba2-mini的出現對當前AI發展的方向提出了新的思考。在過去,AI模型的發展常常陷入“越大越好”的誤區,追求高參數量和復雜結構,往往忽略了實際應用中的資源消耗和效率問題。Zamba2-mini以其“小身材”展示了“大能力”,證明了高效和高性能不一定依賴于龐大的參數和復雜的架構。

Zamba2-mini這樣的高效小模型不僅降低了硬件的要求,還能在更多場景中靈活部署,帶來更好的用戶體驗和商業價值。

從未來發展的角度來看,設備端AI將越來越多地應用于物聯網、移動設備和邊緣計算,這些場景都對AI模型的資源消耗提出了更高要求。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普也沒想到,一場戰爭把中國電車送到了新高度。。。

特朗普也沒想到,一場戰爭把中國電車送到了新高度。。。

差評XPIN
2026-04-29 00:03:13
高市掀桌,日本越做越絕,釣魚島發生爭端,中國海警帶機關炮守疆

高市掀桌,日本越做越絕,釣魚島發生爭端,中國海警帶機關炮守疆

健身狂人
2026-04-29 11:26:47
深夜,五糧液致歉

深夜,五糧液致歉

極目新聞
2026-04-29 10:02:32
足壇一夜動態:巴黎5-4拜仁!世界杯新規官宣 皇馬穆里尼奧談判

足壇一夜動態:巴黎5-4拜仁!世界杯新規官宣 皇馬穆里尼奧談判

念洲
2026-04-29 06:45:00
越南的恥辱!女子和美國大兵親熱完后,趴在床上一臉崇拜地看著他

越南的恥辱!女子和美國大兵親熱完后,趴在床上一臉崇拜地看著他

微野談寫作
2026-04-28 15:50:06
男子失業后瞞著家人,在車里住了7天,車子、手機都沒電,孤立無援的他向路口的交警求助,交警為他搭電并安慰:別頹廢,困難是暫時的

男子失業后瞞著家人,在車里住了7天,車子、手機都沒電,孤立無援的他向路口的交警求助,交警為他搭電并安慰:別頹廢,困難是暫時的

極目新聞
2026-04-28 20:17:48
丟人現眼!女子老太地鐵互毆后續:官方介入,真相曝光,恐將社死

丟人現眼!女子老太地鐵互毆后續:官方介入,真相曝光,恐將社死

派大星紀錄片
2026-04-28 16:23:41
iPhone系統垃圾一鍵清理,26G變8G,告別卡頓超耐用

iPhone系統垃圾一鍵清理,26G變8G,告別卡頓超耐用

小柱解說游戲
2026-04-28 16:31:31
尷尬!網傳天津無血緣繼姐弟互生情愫,重組家庭父母陷入道德焦慮

尷尬!網傳天津無血緣繼姐弟互生情愫,重組家庭父母陷入道德焦慮

火山詩話
2026-04-28 07:41:36
76人逆轉大勝綠軍追到2-3:恩比德33+8爆發 塔圖姆24+16

76人逆轉大勝綠軍追到2-3:恩比德33+8爆發 塔圖姆24+16

醉臥浮生
2026-04-29 09:34:32
劉潔任黔西南州人民政府副州長

劉潔任黔西南州人民政府副州長

貴陽網
2026-04-29 09:30:12
「深度」7.31億非法所得與85處倫敦房產:被通緝前,跨境賭博平臺主犯蘇江波瘋狂購房

「深度」7.31億非法所得與85處倫敦房產:被通緝前,跨境賭博平臺主犯蘇江波瘋狂購房

界面新聞
2026-04-28 17:50:40
起底“性商教母”周媛

起底“性商教母”周媛

中國新聞周刊
2026-04-28 23:01:12
荒誕到刺眼!本科畢業找不到工作,竟要回爐讀技校?這鬧劇該停了

荒誕到刺眼!本科畢業找不到工作,竟要回爐讀技校?這鬧劇該停了

狐貍先森講升學規劃
2026-04-29 05:50:03
曝前央視主持人郎永淳退休工資5萬!本人發聲回應,妻子才3000多

曝前央視主持人郎永淳退休工資5萬!本人發聲回應,妻子才3000多

裕豐娛間說
2026-04-29 09:30:29
湖人vs火箭G5傷病報告:東契奇杜蘭特傷停 里夫斯出戰成疑或復出

湖人vs火箭G5傷病報告:東契奇杜蘭特傷停 里夫斯出戰成疑或復出

醉臥浮生
2026-04-29 08:54:16
4000萬粉網紅白冰,偷稅超900萬被查!從發廊小哥到富豪,靠“接地氣、不割韭菜”立人設!

4000萬粉網紅白冰,偷稅超900萬被查!從發廊小哥到富豪,靠“接地氣、不割韭菜”立人設!

新民周刊
2026-04-28 20:08:08
600萬歐!皇馬終于敲定新主帥,老佛爺力排眾議,穆里尼奧回歸

600萬歐!皇馬終于敲定新主帥,老佛爺力排眾議,穆里尼奧回歸

祥談體育
2026-04-29 10:30:28
潛逃前吳敬中送余則成一根金條,8年后切開才發現里面有膠卷

潛逃前吳敬中送余則成一根金條,8年后切開才發現里面有膠卷

卡西莫多的故事
2026-03-31 09:59:18
4月28日,人社部召開發布會,有關養老金調整消息,來看看

4月28日,人社部召開發布會,有關養老金調整消息,來看看

奧字侃劇
2026-04-29 10:14:04
2026-04-29 13:56:49
小微模型 incentive-icons
小微模型
一起探索AGI世界,解鎖AI實用技能,伴您步入智能生活!
151文章數 9關注度
往期回顧 全部

科技要聞

夭折的造富神話,逼著中國AI回去賺"慢錢"

頭條要聞

競拍者叫價6003萬搶高端別墅悔拍 758萬保證金打水漂

頭條要聞

競拍者叫價6003萬搶高端別墅悔拍 758萬保證金打水漂

體育要聞

巴黎5-4拜仁夜:身價1.55億的“足壇笑話”,成了最硬的底牌

娛樂要聞

單依純演唱會再唱“區區三萬天”宣戰

財經要聞

多地藥店違規串換商品套刷醫保揭秘

汽車要聞

配32寸升降屏 新款別克世紀CENTURY上市53.99萬起

態度原創

游戲
時尚
房產
家居
軍事航空

索尼漫威強強聯手!全新PS5主機獨占大作新消息來了

劉浩存:明媚中綻放

房產要聞

80億投資!浙商總部基地+??诒闭?,金沙灣這是要起飛啊!

家居要聞

寂然無界 簡潔風格

軍事要聞

美國參議院否決限制特朗普對古巴動武的決議

無障礙瀏覽 進入關懷版