網易首頁 > 網易號 > 正文 申請入駐

中科院計算所團隊讓多語言能力「外掛式」加載

0
分享至



XBridge 能夠將 LLM 低資源語言甚至未見語言的理解和生成能力提升到接近組合的 NMT 模型的水平,在下游任務上顯著縮小高資源、低資源語言間性能差距,同時保持或提升高資源語言能力,全程無需訓練 LLM。

近年來,大語言模型(LLM)在通用問答與復雜推理任務上表現優異。然而在多語言場景下,LLM 則表現出明顯的不均衡:在英語等少數高資源語言上表現優異,在低資源和未見語言上則不穩定或難以支持。

一個直觀的解釋是訓練數據不足,但更本質的問題在于表示空間不匹配。已有研究表明,LLM 已經在統一的語義空間中編碼了豐富的跨語言知識,并且在處理多語言文本時會專門「經過」這個統一語義空間(如英語表示空間)。這意味著,LLM 的多語言瓶頸不在缺乏知識,而是難以將已有的知識正確映射到多語言表示空間中

與此同時,多語言神經機器翻譯(NMT)模型在跨語言表示建模方面表現出色。這些 NMT 模型通過 encoder-decoder 架構構建了一個統一的跨語言語義空間,實現上百種語言之間穩定的語義轉換。這啟發我們:能否將 LLM 的知識處理能力和多語言 NMT 模型的多語言能力組合,實現優勢互補?

基于這一思路,中國科學院計算技術研究所 NLP 團隊提出了一種新的多語言擴展范式 XBridge:組合 LLM 以英文為中心的通用能力,以及現有多語言 NMT 模型的多語言理解和生成能力,實現二者的能力互補,組合成一個多語言通用模型。換言之,將多語言理解和生成卸載到外部 NMT 模型,LLM 進行以英文為中心的通用知識處理



  • 論文:https://arxiv.org/abs/2603.17512
  • 代碼:https://github.com/ictnlp/XBridge
  • 模型:https://huggingface.co/collections/ICTNLP/xbridge

該成果已被 ACL 2026 主會接收。

XBridge:模型組合的多語言擴展方案

XBridge 的核心思想是,將多語言能力卸載到 NMT 模型,同時保留 LLM 作為知識處理和推理的核心。



1. 模型架構

XBridge 采用 encoder-LLM-decoder 三段式架構,模塊之間用 MLP 架構的輕量映射層連接:

  • NMT encoder:將多語言輸入映射到共享語義空間。
  • LLM:以英語為中心的知識處理和推理核心。
  • NMT decoder:生成目標語言輸出。

直觀來看,多語言輸入首先被 encoder 編碼成共享語義表示,再由 LLM 進行知識處理和推理,最后 decoder 映射到目標語言輸出,實現完整的多語言「理解 - 處理 - 生成」閉環。

2. 最優運輸對齊

由于不同模型之間的表示空間天然不一致,例如 token 粒度上嚴重錯位,單純利用 MLP 進行跨模型表示映射難以實現語義一致的轉換。為解決這一問題,我們引入最優運輸(Optimal Transport, OT)對齊目標,自適應地學習 token 粒度的軟匹配,從而在不同長度、不同分詞方式的異構表示空間之間建立細粒度的語義對齊關系,實現穩定的語義轉換和高質量的多語言生成。

3. 三階段訓練策略

為在不同模型之間建立穩定對齊,XBridge 設計三階段訓練策略,LLM 全程無需訓練

  • 跨模型對齊階段:學習 encoder-LLM-decoder 之間的基礎語義映射關系。
  • 編碼器適配階段:讓 LLM 學會利用 encoder 表示完成下游任務。
  • 解碼器適配階段:進一步提升 decoder 多語言生成質量。

分階段的訓練設計能夠有效避免不同優化目標之間的沖突,使模型能夠逐步建立穩定的跨模型映射,并適配下游任務。

實驗結果:

不訓練 LLM 即可支持高質量未見語言問答

1. 多語言能力成功卸載到 NMT 模型

在 FLORES-101 翻譯任務上,XBridge 顯著提升了 LLM 在低資源語言或未見語言(如孟加拉語、斯瓦西里語等)上的理解和生成能力,性能接近或超越外部 NMT 模型。這表明 LLM 的多語言能力是可以卸載到外部 NMT 模型的。



2. 下游任務顯著提升

在多語言數學推理(MGSM)和摘要生成(XL-Sum)任務上,XBridge 在低資源語言上獲得顯著提升,顯著縮小高資源、低資源語言的性能差距,同時保持或提升高資源語言性能。值得注意的是,這個過程不需要訓練 LLM。



3. 可泛化、語言無關的跨模型映射

XBridge 在未訓練的語言上仍表現出良好的泛化能力,性能甚至接近外部 NMT 模型,這表明 XBridge 學到的是一種語言無關的跨模型映射。此外,OT 任務對語言生成的泛化具有重要作用。



4. 可控語言生成與無損語言切換

通過控制 decoder 輸入語言標簽,XBridge 可以靈活指定輸出語言,實現任意語言對之間的跨語言生成,同時保持無損的多語言切換。



以下是一個語言切換示例。



5. 系統演示

我們借助一階段的泛化性,直接在 50 種語言的通用指令遵循數據上訓練 XBridge。以下是一個 demo,展示了 XBridge 多語言問答能力和語言切換的效果。



視頻地址:https://mp.weixin.qq.com/s/Ku1dZNIpI93J21d75RYAkg

總結與展望

通過將多語言能力卸載到外部 NMT 模型,XBridge 在不訓練 LLM 的前提下,實現了對低資源和未見語言的高質量支持。除了性能的提升,XBridge 更重要的價值在于為 LLM 的多語言擴展提供了一個新思路:擴展 LLM 的多語言能力,或許不再需要依賴大規模、高質量、多任務的多語言訓練數據,而是可以通過組合現有模型,實現低成本擴展。

作者介紹

卜夢煜,中國科學院計算技術研究所博士研究生,導師為馮洋研究員。主要研究方向為多語言大模型。在 ACL、EMNLP 等自然語言處理領域頂級國際會議發表多篇論文。

馮洋,中國科學院院計算技術研究所研究員、博士生導師,擔任國際計算語言學學會執委(ACL Secretary)以及 ACL/EMNLP 等多個國際會議高級領域主席,獲 ACL 2019 唯一最佳長文獎。主導研發了百聆大模型和 LLaMA-Omni 即時交互語音大模型(曾位列 Huggingface 連續一周模型下載量前十)。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國家發改委:禁止外資收購Manus項目

國家發改委:禁止外資收購Manus項目

封面新聞
2026-04-27 21:48:07
于和偉:雖然我有緋聞,但余生都不會辜負18歲就跟了我的宋林靜

于和偉:雖然我有緋聞,但余生都不會辜負18歲就跟了我的宋林靜

大眼妹妹
2026-04-27 13:56:56
背叛中國、又出賣美國!臭名昭著的華裔雙面間諜高瞻,下場如何?

背叛中國、又出賣美國!臭名昭著的華裔雙面間諜高瞻,下場如何?

老謝談史
2026-04-26 21:41:19
陳賡抓到殺害劉志丹的兇手后要斃,劉伯承:慢,設宴!結局如何?

陳賡抓到殺害劉志丹的兇手后要斃,劉伯承:慢,設宴!結局如何?

元哥說歷史
2026-04-20 22:00:03
英媒:中國是最大贏家,導彈超伊朗上百倍,美國重新認識中國實力

英媒:中國是最大贏家,導彈超伊朗上百倍,美國重新認識中國實力

云舟史策
2026-04-27 07:38:22
屬牛的注意:5月這兩個地方別去,守住福氣和錢財

屬牛的注意:5月這兩個地方別去,守住福氣和錢財

匹夫來搞笑
2026-04-27 18:22:01
如今回歸上海申花的他,已順利入選國足名單,未婚妻身份不一般

如今回歸上海申花的他,已順利入選國足名單,未婚妻身份不一般

科學發掘
2026-04-27 11:00:37
美若天仙景甜:蕙質蘭心,國色天香。艷絕眾生,絕代芳華!

美若天仙景甜:蕙質蘭心,國色天香。艷絕眾生,絕代芳華!

十為先生
2026-04-27 17:48:56
女子孕期收到丈夫不雅照,他竟出軌20多人!挨了500多針才生下的“珍貴兒”,離婚后被婆家搶走藏匿3個多月……

女子孕期收到丈夫不雅照,他竟出軌20多人!挨了500多針才生下的“珍貴兒”,離婚后被婆家搶走藏匿3個多月……

新民周刊
2026-04-27 13:35:02
紫光股份、中科曙光、浪潮信息、中興通訊,最新年報含金量誰高?

紫光股份、中科曙光、浪潮信息、中興通訊,最新年報含金量誰高?

長風價值掘金
2026-04-27 15:48:46
鄭麗文成功了!國民黨3位元老出山,朱立倫的反撲計劃宣告失敗

鄭麗文成功了!國民黨3位元老出山,朱立倫的反撲計劃宣告失敗

米果說識
2026-04-21 16:58:00
整車成本比Model 3更低!專訪小馬智行CFO王皓。核闱鍐诬嚨馁~,擴張就簡單

整車成本比Model 3更低!專訪小馬智行CFO王皓俊:算清單車的賬,擴張就簡單

時代周報
2026-04-26 13:53:07
全紅嬋最新消息,瘦了一大圈!全紅嬋武漢復出參賽,為不實消息

全紅嬋最新消息,瘦了一大圈!全紅嬋武漢復出參賽,為不實消息

開成運動會
2026-04-26 22:32:59
交通部正式官宣!私家車順路帶人合法上路,保險理賠規則全新調整

交通部正式官宣!私家車順路帶人合法上路,保險理賠規則全新調整

芳姐侃社會
2026-04-25 17:07:08
數據分析:火箭戰勝湖人1-3,是狀態回暖還是湖人送的人情世故

數據分析:火箭戰勝湖人1-3,是狀態回暖還是湖人送的人情世故

鐵甲西奇
2026-04-27 21:51:31
上海迪士尼24歲男子勸阻34歲男子吸煙,反被毆打,上海警方:吸煙游客向勸阻者道歉和賠償,雙方已簽訂《調解協議書》

上海迪士尼24歲男子勸阻34歲男子吸煙,反被毆打,上海警方:吸煙游客向勸阻者道歉和賠償,雙方已簽訂《調解協議書》

都市快報橙柿互動
2026-04-27 19:45:57
故事:聶磊稱霸青島十幾年,最后因惹上一個女人,踢到鐵板就此滅亡

故事:聶磊稱霸青島十幾年,最后因惹上一個女人,踢到鐵板就此滅亡

紅豆講堂
2024-12-17 10:54:23
美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

史智文道
2026-04-24 09:38:52
美專家曾言:美軍一旦向北京、上海扔下核彈,中國并不會對等報復

美專家曾言:美軍一旦向北京、上海扔下核彈,中國并不會對等報復

混沌錄
2026-04-27 20:03:09
薩林杰親自辟謠!稱要與球隊沖擊總冠軍,廣東球迷可以放心了

薩林杰親自辟謠!稱要與球隊沖擊總冠軍,廣東球迷可以放心了

弄月公子
2026-04-27 21:38:01
2026-04-27 22:16:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12874文章數 142637關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

健康
房產
教育
數碼
軍事航空

干細胞如何讓燒燙傷皮膚"再生"?

房產要聞

信號!海南商業版圖,迎來大變局!

教育要聞

文科大撤退,歷史首當其沖

數碼要聞

入手“120W”充電頭后,我終于知曉這行水有多深...

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

無障礙瀏覽 進入關懷版