網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI圈懵了：一家巴西市政IT公司開源的大模型，殺進(jìn)了全球第一梯隊(duì)

2026-06-15 19:51:35　來(lái)源: 杰絲聊古今

河南舉報(bào)

分享至

你敢信嗎？今年讓整個(gè)海外AI圈集體掉下巴的事，不是谷歌OpenAI發(fā)了啥王炸新品，是巴西里約熱內(nèi)盧市政府下屬，一個(gè)天天修政務(wù)系統(tǒng)的普通IT公司，偷偷摸出了一個(gè)開源大模型，跑分還把阿里最新的通義千問甩在了身后。硅谷一幫從業(yè)者盯著截圖看了好幾天，都沒緩過神來(lái)。

這個(gè)模型最早低調(diào)發(fā)在Hugging Face上，名叫Rio 3.5 Open 397B，發(fā)布賬號(hào)明明白白掛著里約市政府的前綴。剛放出來(lái)的時(shí)候根本沒人當(dāng)回事，誰(shuí)能想到一個(gè)搞市政服務(wù)IT的團(tuán)隊(duì)，能碰前沿大模型這塊蛋糕呢？

直到有海外博主把跑分截圖甩到了推特上，整個(gè)圈子的畫風(fēng)直接就變了。智能體編程、數(shù)學(xué)、理工科、多語(yǔ)言多模態(tài)這些業(yè)內(nèi)公認(rèn)的硬骨頭測(cè)試，這個(gè)名不見經(jīng)傳的模型全啃下來(lái)了，成績(jī)還穩(wěn)穩(wěn)壓過了通義千問Qwen 3.7 Plus一頭。有博主直接喊出這就是新的開源天花板，語(yǔ)氣里全是不敢相信。

更魔幻的是巴西圈內(nèi)的反應(yīng)，大伙翻了一圈才發(fā)現(xiàn)，連里約本地做AI的從業(yè)者，事前都沒幾個(gè)知道這家公司在憋大招。這家叫IplanRIO的開發(fā)團(tuán)隊(duì)，平時(shí)主業(yè)就是給市民辦事窗口、城市數(shù)據(jù)平臺(tái)這類政務(wù)項(xiàng)目做技術(shù)支持，跟前沿大模型本來(lái)隔著十萬(wàn)八千里。

大伙最好奇的莫過于，這么個(gè)模型到底是怎么攢出來(lái)的。看官方說(shuō)明，它也不是從零開始憑空造的，底座用了開源的Qwen3.5-397B-A17B，再跟另一個(gè)叫Nex-N2-Pro的模型做融合，又用在線策略蒸餾的方法從更強(qiáng)的模型那里學(xué)到了本事，才有了現(xiàn)在這個(gè)版本。

說(shuō)幾個(gè)大家聽得懂的關(guān)鍵參數(shù)，它總共有397B參數(shù)，走的是MoE混合專家路線，每次只激活17B參數(shù)。說(shuō)白了就是養(yǎng)了一堆各個(gè)領(lǐng)域的專業(yè)人才，遇到問題喊對(duì)口的人上場(chǎng)解決，既能保證能力夠強(qiáng)，又不會(huì)平白浪費(fèi)太多算力燒電費(fèi)。

它的上下文窗口直接拉到了100萬(wàn)token，這個(gè)數(shù)字放到現(xiàn)在是什么概念？一本五六百頁(yè)的完整小說(shuō)整個(gè)塞進(jìn)去，它能把書里所有細(xì)節(jié)都記下來(lái)，隨便你問哪個(gè)犄角旮旯的內(nèi)容都能精準(zhǔn)答出來(lái)。對(duì)要處理超長(zhǎng)合同、整套代碼庫(kù)的從業(yè)者來(lái)說(shuō)，這個(gè)能力直接改變了原來(lái)的干活方式。

真正讓技術(shù)黨眼睛放光的，是它內(nèi)置了一個(gè)叫SwiReasoning的推理機(jī)制。這個(gè)方法來(lái)頭不小，出自一篇已經(jīng)被ICLR 2026收錄的論文，最新版本今年3月剛剛做了修訂。

現(xiàn)在大模型推理一直有個(gè)挺擰巴的老問題，要么把思考過程一字一句全寫出來(lái)，穩(wěn)是穩(wěn)了但特別費(fèi)token，算力成本蹭蹭往上漲。要么讓模型在內(nèi)部“默想”，省是省了但容易跑偏，結(jié)果壓根收不住。SwiReasoning的思路就很靈活，讓模型自己根據(jù)數(shù)據(jù)變化判斷情況，該寫出來(lái)就寫，該默想就默想，隨時(shí)切換。

論文給出的測(cè)試數(shù)據(jù)很漂亮，換上這套機(jī)制之后，主流推理模型的準(zhǔn)確率能提升1.8%到3.1%。如果是算力預(yù)算比較緊張的場(chǎng)景，token使用效率最多能拉高79%，預(yù)算越緊省得越多，簡(jiǎn)直是小團(tuán)隊(duì)的福音。

Rio 3.5不光把這套機(jī)制內(nèi)置進(jìn)去，訓(xùn)練階段就專門針對(duì)潛空間推理的效率優(yōu)勢(shì)做了優(yōu)化，真不是單純堆參數(shù)或者隨便套個(gè)殼，是實(shí)實(shí)在在在底層做了適配優(yōu)化。

語(yǔ)言支持這塊也挺讓人驚喜，主打葡萄牙語(yǔ)和英語(yǔ)很正常，畢竟是葡語(yǔ)國(guó)家的政府機(jī)構(gòu)開發(fā)的，但它連中文還有另外幾十種語(yǔ)言都做了覆蓋。非英語(yǔ)團(tuán)隊(duì)開發(fā)的開源大模型，能把多語(yǔ)言支持鋪得這么全，其實(shí)并不常見。

許可證它選了最寬松的MIT，也就是說(shuō)不管你拿去商用、改源碼還是二次發(fā)布，統(tǒng)通都沒問題，沒有任何限制。目前這個(gè)模型在Hugging Face上的下載量已經(jīng)超過11萬(wàn)次，社區(qū)討論區(qū)的留言滾得飛快，熱度是實(shí)打?qū)嵠饋?lái)了。

這里還有個(gè)挺有意思的小尷尬，開發(fā)方自己在模型主頁(yè)貼了道歉聲明，承認(rèn)之前傳錯(cuò)了文件，把沒經(jīng)過最終蒸餾的半成品當(dāng)成正式版上傳了，發(fā)現(xiàn)之后正在趕工重傳。這種直白的坦白反而讓人覺得，這就是一群踏踏實(shí)實(shí)趕進(jìn)度的普通人，不是那種包裝出來(lái)騙流量的樣子貨。

這件事連Hugging Face的CEO都忍不住下場(chǎng)表態(tài)，他說(shuō)AI的未來(lái)本來(lái)就沒有什么注定的劇本。一條路是閉源API把持，決定權(quán)攥在硅谷少數(shù)幾家公司手里，另一條是開源路線，連里約市政府這種機(jī)構(gòu)都能下場(chǎng)參與、開發(fā)甚至共建。他最后那句“自己選路”，放在這件事的背景下，分量完全不一樣。

這還真不是孤例，同一時(shí)間段里，還有一個(gè)叫Nex-N2-Pro 397B的模型冒了出來(lái)，底子也是Qwen3.5-397B-A17B，測(cè)試性能說(shuō)能跟GPT-5.5、Opus 4.7這種頂級(jí)閉源模型掰掰手腕。說(shuō)白了國(guó)內(nèi)放出去的開源基礎(chǔ)模型，正在被全球各路團(tuán)隊(duì)接力改造，長(zhǎng)出很多誰(shuí)也沒預(yù)料到的新形態(tài)。

冷靜下來(lái)捋一捋，Rio 3.5最值得琢磨的真不是榜單上那幾個(gè)數(shù)字。跑分這東西，每個(gè)月都有新王，過兩周基本就被人忘干凈了。它真正的沖擊力，其實(shí)來(lái)自開發(fā)方的身份。

過去大伙都心照不宣，能玩得動(dòng)前沿大模型的，只有頂級(jí)實(shí)驗(yàn)室和互聯(lián)網(wǎng)巨頭，普通機(jī)構(gòu)連入場(chǎng)票都摸不到。Rio 3.5這一下，直接把這個(gè)潛規(guī)則戳了個(gè)大口子。開源基礎(chǔ)模型加上開放的研究論文，正在把AI的入場(chǎng)門檻一點(diǎn)點(diǎn)往下拉。

當(dāng)然咱也別盲目上頭，模型才剛出來(lái)，長(zhǎng)期穩(wěn)定性、實(shí)際部署后的表現(xiàn)、社區(qū)后續(xù)的反饋，都得再觀察一段時(shí)間。開發(fā)方自己都還在補(bǔ)傳正確版本，距離“可以閉眼隨便用”還有不小的距離。

但2026年這個(gè)夏天，里約這家不起眼的市政IT公司至少把一件事講透了：下一個(gè)讓AI圈集體震驚的開源模型，可能從世界上任何一個(gè)角落冒出來(lái)，跟它來(lái)自哪個(gè)城市、屬于什么機(jī)構(gòu)，關(guān)系真沒大家想的那么大。

參考資料：新華網(wǎng) 巴西市政IT公司開源大模型躋身全球AI第一梯隊(duì)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.