你敢信嗎?今年讓整個(gè)海外AI圈集體掉下巴的事,不是谷歌OpenAI發(fā)了啥王炸新品,是巴西里約熱內(nèi)盧市政府下屬,一個(gè)天天修政務(wù)系統(tǒng)的普通IT公司,偷偷摸出了一個(gè)開源大模型,跑分還把阿里最新的通義千問甩在了身后。硅谷一幫從業(yè)者盯著截圖看了好幾天,都沒緩過神來(lái)。
![]()
這個(gè)模型最早低調(diào)發(fā)在Hugging Face上,名叫Rio 3.5 Open 397B,發(fā)布賬號(hào)明明白白掛著里約市政府的前綴。剛放出來(lái)的時(shí)候根本沒人當(dāng)回事,誰(shuí)能想到一個(gè)搞市政服務(wù)IT的團(tuán)隊(duì),能碰前沿大模型這塊蛋糕呢?
直到有海外博主把跑分截圖甩到了推特上,整個(gè)圈子的畫風(fēng)直接就變了。智能體編程、數(shù)學(xué)、理工科、多語(yǔ)言多模態(tài)這些業(yè)內(nèi)公認(rèn)的硬骨頭測(cè)試,這個(gè)名不見經(jīng)傳的模型全啃下來(lái)了,成績(jī)還穩(wěn)穩(wěn)壓過了通義千問Qwen 3.7 Plus一頭。有博主直接喊出這就是新的開源天花板,語(yǔ)氣里全是不敢相信。
更魔幻的是巴西圈內(nèi)的反應(yīng),大伙翻了一圈才發(fā)現(xiàn),連里約本地做AI的從業(yè)者,事前都沒幾個(gè)知道這家公司在憋大招。這家叫IplanRIO的開發(fā)團(tuán)隊(duì),平時(shí)主業(yè)就是給市民辦事窗口、城市數(shù)據(jù)平臺(tái)這類政務(wù)項(xiàng)目做技術(shù)支持,跟前沿大模型本來(lái)隔著十萬(wàn)八千里。
![]()
大伙最好奇的莫過于,這么個(gè)模型到底是怎么攢出來(lái)的。看官方說(shuō)明,它也不是從零開始憑空造的,底座用了開源的Qwen3.5-397B-A17B,再跟另一個(gè)叫Nex-N2-Pro的模型做融合,又用在線策略蒸餾的方法從更強(qiáng)的模型那里學(xué)到了本事,才有了現(xiàn)在這個(gè)版本。
說(shuō)幾個(gè)大家聽得懂的關(guān)鍵參數(shù),它總共有397B參數(shù),走的是MoE混合專家路線,每次只激活17B參數(shù)。說(shuō)白了就是養(yǎng)了一堆各個(gè)領(lǐng)域的專業(yè)人才,遇到問題喊對(duì)口的人上場(chǎng)解決,既能保證能力夠強(qiáng),又不會(huì)平白浪費(fèi)太多算力燒電費(fèi)。
它的上下文窗口直接拉到了100萬(wàn)token,這個(gè)數(shù)字放到現(xiàn)在是什么概念?一本五六百頁(yè)的完整小說(shuō)整個(gè)塞進(jìn)去,它能把書里所有細(xì)節(jié)都記下來(lái),隨便你問哪個(gè)犄角旮旯的內(nèi)容都能精準(zhǔn)答出來(lái)。對(duì)要處理超長(zhǎng)合同、整套代碼庫(kù)的從業(yè)者來(lái)說(shuō),這個(gè)能力直接改變了原來(lái)的干活方式。
![]()
真正讓技術(shù)黨眼睛放光的,是它內(nèi)置了一個(gè)叫SwiReasoning的推理機(jī)制。這個(gè)方法來(lái)頭不小,出自一篇已經(jīng)被ICLR 2026收錄的論文,最新版本今年3月剛剛做了修訂。
現(xiàn)在大模型推理一直有個(gè)挺擰巴的老問題,要么把思考過程一字一句全寫出來(lái),穩(wěn)是穩(wěn)了但特別費(fèi)token,算力成本蹭蹭往上漲。要么讓模型在內(nèi)部“默想”,省是省了但容易跑偏,結(jié)果壓根收不住。SwiReasoning的思路就很靈活,讓模型自己根據(jù)數(shù)據(jù)變化判斷情況,該寫出來(lái)就寫,該默想就默想,隨時(shí)切換。
![]()
論文給出的測(cè)試數(shù)據(jù)很漂亮,換上這套機(jī)制之后,主流推理模型的準(zhǔn)確率能提升1.8%到3.1%。如果是算力預(yù)算比較緊張的場(chǎng)景,token使用效率最多能拉高79%,預(yù)算越緊省得越多,簡(jiǎn)直是小團(tuán)隊(duì)的福音。
Rio 3.5不光把這套機(jī)制內(nèi)置進(jìn)去,訓(xùn)練階段就專門針對(duì)潛空間推理的效率優(yōu)勢(shì)做了優(yōu)化,真不是單純堆參數(shù)或者隨便套個(gè)殼,是實(shí)實(shí)在在在底層做了適配優(yōu)化。
語(yǔ)言支持這塊也挺讓人驚喜,主打葡萄牙語(yǔ)和英語(yǔ)很正常,畢竟是葡語(yǔ)國(guó)家的政府機(jī)構(gòu)開發(fā)的,但它連中文還有另外幾十種語(yǔ)言都做了覆蓋。非英語(yǔ)團(tuán)隊(duì)開發(fā)的開源大模型,能把多語(yǔ)言支持鋪得這么全,其實(shí)并不常見。
![]()
許可證它選了最寬松的MIT,也就是說(shuō)不管你拿去商用、改源碼還是二次發(fā)布,統(tǒng)通都沒問題,沒有任何限制。目前這個(gè)模型在Hugging Face上的下載量已經(jīng)超過11萬(wàn)次,社區(qū)討論區(qū)的留言滾得飛快,熱度是實(shí)打?qū)嵠饋?lái)了。
這里還有個(gè)挺有意思的小尷尬,開發(fā)方自己在模型主頁(yè)貼了道歉聲明,承認(rèn)之前傳錯(cuò)了文件,把沒經(jīng)過最終蒸餾的半成品當(dāng)成正式版上傳了,發(fā)現(xiàn)之后正在趕工重傳。這種直白的坦白反而讓人覺得,這就是一群踏踏實(shí)實(shí)趕進(jìn)度的普通人,不是那種包裝出來(lái)騙流量的樣子貨。
這件事連Hugging Face的CEO都忍不住下場(chǎng)表態(tài),他說(shuō)AI的未來(lái)本來(lái)就沒有什么注定的劇本。一條路是閉源API把持,決定權(quán)攥在硅谷少數(shù)幾家公司手里,另一條是開源路線,連里約市政府這種機(jī)構(gòu)都能下場(chǎng)參與、開發(fā)甚至共建。他最后那句“自己選路”,放在這件事的背景下,分量完全不一樣。
![]()
這還真不是孤例,同一時(shí)間段里,還有一個(gè)叫Nex-N2-Pro 397B的模型冒了出來(lái),底子也是Qwen3.5-397B-A17B,測(cè)試性能說(shuō)能跟GPT-5.5、Opus 4.7這種頂級(jí)閉源模型掰掰手腕。說(shuō)白了國(guó)內(nèi)放出去的開源基礎(chǔ)模型,正在被全球各路團(tuán)隊(duì)接力改造,長(zhǎng)出很多誰(shuí)也沒預(yù)料到的新形態(tài)。
冷靜下來(lái)捋一捋,Rio 3.5最值得琢磨的真不是榜單上那幾個(gè)數(shù)字。跑分這東西,每個(gè)月都有新王,過兩周基本就被人忘干凈了。它真正的沖擊力,其實(shí)來(lái)自開發(fā)方的身份。
過去大伙都心照不宣,能玩得動(dòng)前沿大模型的,只有頂級(jí)實(shí)驗(yàn)室和互聯(lián)網(wǎng)巨頭,普通機(jī)構(gòu)連入場(chǎng)票都摸不到。Rio 3.5這一下,直接把這個(gè)潛規(guī)則戳了個(gè)大口子。開源基礎(chǔ)模型加上開放的研究論文,正在把AI的入場(chǎng)門檻一點(diǎn)點(diǎn)往下拉。
![]()
當(dāng)然咱也別盲目上頭,模型才剛出來(lái),長(zhǎng)期穩(wěn)定性、實(shí)際部署后的表現(xiàn)、社區(qū)后續(xù)的反饋,都得再觀察一段時(shí)間。開發(fā)方自己都還在補(bǔ)傳正確版本,距離“可以閉眼隨便用”還有不小的距離。
![]()
但2026年這個(gè)夏天,里約這家不起眼的市政IT公司至少把一件事講透了:下一個(gè)讓AI圈集體震驚的開源模型,可能從世界上任何一個(gè)角落冒出來(lái),跟它來(lái)自哪個(gè)城市、屬于什么機(jī)構(gòu),關(guān)系真沒大家想的那么大。
參考資料:新華網(wǎng) 巴西市政IT公司開源大模型躋身全球AI第一梯隊(duì)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.