![]()
機器之心編輯部
今天,除了全球(非美)被禁的 Claude Fable 5,AI 社區還被一個開源模型刷屏了。
![]()
有推特博主發現,一個由巴西里約熱內盧市政府旗下 IT 公司開源的模型Rio 3.5 397B,在多項基準測試中超越了 Qwen 3.7 Plus 等開源模型,而這個模型的基礎模型還是 Qwen3.5-397B-A17B
![]()
另一位推特博主「Chubby」對此表示不可思議,「一個以前從來沒聽過的模型現在成了開源 SOTA,甚至超過了 Qwen 3.7。」
![]()
「這讓所有人都挺意外。直到今天,巴西當地從業者幾乎沒人知道這個模型的存在。」
![]()
這已經是本周第二個基于 Qwen3.5 做后訓練、并躋身前沿水平的模型了。另一個是 Nex-N2-Pro 397B,同樣基于 Qwen3.5-397B-A17B 構建,性能可比肩 GPT-5.5 和 Opus 4.7 等頂級模型。
![]()
Rio 3.5 的崛起讓 Huggingface 聯合創始人兼 CEO Clem Delangue 發出了感嘆,「AI 的未來沒有什么是注定的。接下來會發生,我們每個人都有選擇和行動的空間:路徑一:閉源 API,權力集中,未來由硅谷和華盛頓少數人決定。路徑二:開源 AI,讓每個人都能參與、擁有并共同構建,包括里約市這樣的機構。選你的路吧,朋友。」
![]()
接下來,我們來了解一下 Rio 3.5 397B 模型的技術細節。
![]()
Huggingface 地址:https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B#rio-35-open-397b
Rio 3.5 Open 397B 是一款前沿級通用 AI 模型,由里約熱內盧市政府旗下的市政 IT 公司 IplanRIO 開發。
該模型基于 Qwen 3.5 397B 進行后訓練,在智能體編程、數學、STEM、多語言和多模態等基準測試中達到了開源模型的領先水平,相比基座模型有顯著提升,并且能夠與全球最強的開源和閉源模型競爭。
![]()
模型核心特性包括如下:
- 397B 總參數,17B 激活參數,采用混合專家架構(MoE);
- 1,010,000 token,也就是 100 萬級上下文窗口;
- 集成 SwiReasoning:可在顯式推理和潛空間推理之間動態切換,在準確率和效率上實現更優平衡;
- 通用能力強:在智能體編程、推理、指令遵循和多模態任務上表現突出;
- 多語言能力強:在葡萄牙語、英語、中文以及數十種其他語言中都有較好表現;
- 采用 MIT 許可證:完全開放,可用于商業和研究用途。
其中,SwiReasoning 是一種免訓練推理框架,基于 Shi 等人 2025 年的研究,可根據基于熵的置信度信號,在顯式思維鏈推理和潛空間推理之間動態切換。這樣既能提升準確率,也能大幅提高 token 效率。該模型在訓練時,也明確針對潛空間推理帶來的效率增益進行了優化。
![]()
論文地址:https://arxiv.org/abs/2510.05069
智能體編程與軟件工程基準測試:
![]()
知識與推理基準測試:
![]()
數學基準測試:
![]()
多語言基準測試:
![]()
智能體與指令遵循基準測試:
![]()
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.