无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Gemma 4 12B正式發布:無編碼器統一多模態架構首亮相

0
分享至


今天,我們正式發布Gemma 4 12B,這是我們最新推出的模型,旨在將具備智能體能力的多模態智能直接帶到筆記本電腦上。Gemma 4 12B填補了輕量級E4B模型與更強大的26B混合專家(MoE)模型之間的空白,在顯著降低內存占用的同時,保留了強大的處理能力。值得一提的是,這也是我們首款原生支持音頻輸入的中等規模模型。

得益于廣大開發者社區的支持,Gemma 4系列模型的累計下載量已突破1.5億次。開發者們基于這一系列模型構建了從輔助行動的可穿戴機械臂到企業級AI安全系統等各類創新應用。我們非常期待看到大家利用這一最新成員創造出更多精彩成果。

以下是Gemma 4 12B的核心亮點:

全新統一架構:無需多模態編碼器,視覺與音頻輸入直接流入大語言模型主干網絡進行處理。

卓越推理能力:在標準基準測試中,性能接近26B模型,支持強大的多步推理與智能體工作流。

筆記本可運行:僅需16GB顯存或統一內存,即可在本地流暢運行。

開放可訪問:基于Apache 2.0許可證發布,并獲得開發者生態系統的廣泛支持。

支持草稿推理加速:Gemma 4 12B內置多Token預測(MTP)草稿器,有效降低推理延遲。

上述特性的結合,使Gemma 4 12B得以在日常硬件上實現先進的多模態能力,同時不犧牲速度與推理性能。

高效且統一的新型架構

Gemma 4 12B的突出之處在于其對視覺和音頻輸入的高效整合方式。傳統多模態模型通常依賴獨立的編碼器,先將圖像和音頻轉換為中間表示,再傳遞給語言模型,這種分離式編碼器結構會增加延遲并提高內存占用。為此,我們在訓練Gemma 4 12B時采用了無編碼器架構,實現了音頻與視覺輸入的直接接入。

具體而言,Gemma 4 12B對多模態輸入的原生處理方式如下:

視覺處理:我們以一個輕量級嵌入模塊替代了原有的視覺編碼器,該模塊僅包含一次矩陣乘法、位置嵌入和歸一化操作,使大語言模型主干網絡能夠直接承擔視覺處理任務。

音頻處理:音頻處理的簡化程度更進一步,我們完全移除了音頻編碼器,直接將原始音頻信號映射投影到與文本Token相同的維度空間。

立即上手使用

即刻體驗:通過LM Studio、Ollama、Google AI Edge Gallery應用、Google AI Edge Eloquent應用或LiteRT-LM命令行工具,只需幾步操作即可開始體驗。

下載模型權重:可直接從Hugging Face和Kaggle下載預訓練及指令微調版本的模型檢查點。

集成與學習:查閱開發者文檔及快速入門筆記本,快速完成集成。

靈活使用開發工具:支持通過Hugging Face Transformers、llama.cpp、MLX、SGLang和vLLM搭建本地推理流水線,也可使用Unsloth進行高效微調。

通過Gemma Skills解鎖智能體開發:為了支持開發者使用最新Gemma技術構建智能體應用,我們正式發布官方技能庫(Skills Repository)。該庫提供了專為智能體與Gemma模型協同工作而設計的一系列技能。

靈活部署:可通過Google Cloud搭建生產級服務端點,并通過Gemini企業智能體平臺模型花園、Cloud Run及GKE等方式靈活部署。

Q&A

Q1:Gemma 4 12B的無編碼器架構有什么優勢?

A:傳統多模態模型通常需要獨立的編碼器來處理圖像和音頻,這會增加推理延遲和內存占用。Gemma 4 12B采用無編碼器統一架構,視覺輸入通過輕量級嵌入模塊直接進入大語言模型主干,音頻則直接映射到與文本Token相同的維度空間,從而降低了延遲和內存需求,同時保留了強大的多模態處理能力。

Q2:Gemma 4 12B對硬件配置有什么要求,普通筆記本能跑嗎?

A:Gemma 4 12B對硬件要求相對友好,僅需16GB顯存或統一內存即可在本地運行,適合主流消費級筆記本電腦。相比之下,它的內存占用不到26B MoE模型的一半,因此非常適合希望在本地體驗高性能多模態大語言模型的開發者和普通用戶。

Q3:Gemma 4 12B支持哪些開發工具和部署平臺?

A:Gemma 4 12B支持多種主流開發工具,包括Hugging Face Transformers、llama.cpp、MLX、SGLang和vLLM,也可使用Unsloth進行微調。模型權重可從Hugging Face和Kaggle下載。此外,還支持通過Google Cloud、Cloud Run及GKE等平臺進行生產級部署,并可通過LM Studio、Ollama等工具快速本地體驗。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
科學打臉!鄱陽湖研究實錘:黑魚根本長不到“百斤王”,別再被騙了

科學打臉!鄱陽湖研究實錘:黑魚根本長不到“百斤王”,別再被騙了

粵語音樂噴泉
2026-06-06 03:16:52
6月11日CCTV5+乒乓球轉播時間表:林詩棟蒯曼出戰

6月11日CCTV5+乒乓球轉播時間表:林詩棟蒯曼出戰

阿錯田間生活
2026-06-11 10:10:43
杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

蘭姐說故事
2025-06-09 10:00:07
這組全是許晴年輕舊照!

這組全是許晴年輕舊照!

草莓解說體育
2026-06-05 14:04:24
是誰把紅軍逼上長征路?這位毒諸葛,異常聰明,卻死于非命

是誰把紅軍逼上長征路?這位毒諸葛,異常聰明,卻死于非命

興趣知識
2026-06-11 00:41:07
2026年高考落幕 青春奔赴下一程

2026年高考落幕 青春奔赴下一程

新華社
2026-06-10 21:21:56
端午吃三黃,一年病不沾,“三黃”指的啥,老傳統別忘了

端午吃三黃,一年病不沾,“三黃”指的啥,老傳統別忘了

匹夫來搞笑
2026-06-11 10:30:41
山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

山東一男嬰日夜啼哭,母親掀開被子后,將月嫂當場掐死

罪案洞察者
2025-03-31 09:35:41
笑不活了!學生叫王勃,豆包把電工論文做成唐詩 PPT。網友:這波姓名紅利吃滿了

笑不活了!學生叫王勃,豆包把電工論文做成唐詩 PPT。網友:這波姓名紅利吃滿了

新浪財經
2026-06-11 04:40:56
小S見到王偉忠當場痛哭! 錄影一半突情緒失控喊:很對不起他

小S見到王偉忠當場痛哭! 錄影一半突情緒失控喊:很對不起他

ETtoday星光云
2026-06-10 11:30:04
金價暴跌4290!十年老韭菜警告:現在920補倉黃金,是徒手接菜刀

金價暴跌4290!十年老韭菜警告:現在920補倉黃金,是徒手接菜刀

小蜜情感說
2026-06-10 17:44:59
拒簽潮席卷印度,大批申請者碰壁,印度網友滿心疑惑追問緣由

拒簽潮席卷印度,大批申請者碰壁,印度網友滿心疑惑追問緣由

呼呼歷史論
2026-06-11 00:24:14
最新 | 知名女演員自曝丈夫去世細節!崩潰大哭!自己得了這種病......

最新 | 知名女演員自曝丈夫去世細節!崩潰大哭!自己得了這種病......

天津廣播
2026-06-11 00:04:07
世界杯晴天霹靂!全部取消!

世界杯晴天霹靂!全部取消!

福建睿平
2026-06-10 16:13:20
特朗普宣布報復,5國武裝已參戰,伊朗多地遇襲,中方擔憂正成真

特朗普宣布報復,5國武裝已參戰,伊朗多地遇襲,中方擔憂正成真

音樂時光的娛樂
2026-06-11 00:19:43
增程車突然賣不動了?5月銷量暴跌近25%,創近五年最大降幅,僅3款車型月銷破5000輛!被純電取代之聲再起,專家解讀

增程車突然賣不動了?5月銷量暴跌近25%,創近五年最大降幅,僅3款車型月銷破5000輛!被純電取代之聲再起,專家解讀

每日經濟新聞
2026-06-11 00:14:23
力量訓練,一項被嚴重低估的運動!每周 3 次,這6個好處不請自來

力量訓練,一項被嚴重低估的運動!每周 3 次,這6個好處不請自來

增肌減脂
2026-06-11 11:48:52
太諷刺了!“我有點慢熱”,男生相親邀約到拉黑對方,僅用幾分鐘

太諷刺了!“我有點慢熱”,男生相親邀約到拉黑對方,僅用幾分鐘

火山詩話
2026-06-09 08:04:45
高金素梅被求刑12年6個月以上,國臺辦發聲、本人回應

高金素梅被求刑12年6個月以上,國臺辦發聲、本人回應

中國網
2026-06-11 09:41:04
太可怕了!江蘇女生哭訴侍候父親的至暗時刻,字里行間恐懼與絕望

太可怕了!江蘇女生哭訴侍候父親的至暗時刻,字里行間恐懼與絕望

火山詩話
2026-05-30 17:59:42
2026-06-11 14:56:49
至頂科技 incentive-icons
至頂科技
科技產業媒體與 AI 產業服務機構
19227文章數 49711關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

大批印度學生高考考卷被"調包" 40萬人申請看掃描件

頭條要聞

大批印度學生高考考卷被"調包" 40萬人申請看掃描件

體育要聞

文班:付出那么多努力,卻把勝利拱手讓人

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

埃安i60 530寧德時代版上市限時煥新價10.36萬起

態度原創

房產
健康
數碼
家居
教育

房產要聞

猛砸400億!我敢說,這才是海口最懂生活的神盤!

粽子為何難消化?過量吃會怎么樣?

數碼要聞

AMD稱下一代Zen 6服務器CPU每機架性能可達英偉達Vera的3.3倍

家居要聞

空間微調 移形換境

教育要聞

“Every dog has its day”非狗叫,是莎士比亞400年前的翻身密碼

無障礙瀏覽 進入關懷版