![]()
新智元報道
![]()
【新智元導(dǎo)讀】一個純Python寫的開源項目,竟把OpenAI用Rust寫的王牌給秒了!最終戰(zhàn)績6比5,Hermes直接上演工程暴力美學(xué),解釋型語言終于逆天改命。
一個純Python寫的開源項目,竟擊潰了OpenAI王牌!
今天,全網(wǎng)都被Hermes Agent的硬核實力狠狠刷屏了:
在針對真實世界CLI任務(wù)的11項基準(zhǔn)測試中,它以6:5的戰(zhàn)績,直接把Codex按在地上摩擦。
![]()
在這場備受矚目的對決中,Hermes Agent展現(xiàn)出了驚人的底層優(yōu)化能力。
通過一連串的硬核操作,成功把系統(tǒng)的啟動時間,從701ms縮短至258ms。
![]()
更讓人震撼的是,Hermes完全由Python編寫,而Codex是用Rust寫的。
這一仗,Python打贏了Rust!
這在編程界,屬是「逆天改命」了。
![]()
![]()
三大狠招,砍掉63%啟動時間
就在這次優(yōu)化之前,Hermes還是5-6落后的那個。
這次逆轉(zhuǎn)不是靠換模型、不是靠堆算力,而是靠三個純工程優(yōu)化,刀刀見血。
![]()
那么,它是具體如何做到的?
第一刀:Bitwarden磁盤緩存
原來Hermes每次啟動都會調(diào)用Bitwarden Secrets Manager的API去拉取憑據(jù),一次就是380毫秒。
問題在于,之前的緩存是「純進程內(nèi)」,連續(xù)執(zhí)行兩次hermes chat -q,第二次還是要重新拉。
解決方案是,加了一個L2磁盤緩存。
緩存文件權(quán)限鎖死0600,存放在
/cache/bws_cache.json
,默認TTL 300秒。
另外,訪問token本身絕不落盤,默認300秒TTL,過期才重新拉取。
一刀砍掉380ms。
![]()
第二刀:模型目錄延遲加載
hermes_cli.models._PROVIDER_MODELS,一個包含所有AI供應(yīng)商模型信息的巨型字典。
之前在模塊加載時就急切導(dǎo)入,吃掉約55ms。
實際上只有model_flow相關(guān)的處理函數(shù)才需要它。
團隊用PEP 562的模塊級getattr實現(xiàn)了懶加載,只在真正訪問模型目錄時才付出這筆開銷。。
這一步,又省了55毫秒。
第三刀:配置文件去重
main.py頂部原本讀了兩次config.yaml。
一次yaml.safe_load用于密鑰脫敏橋接,一次完整的load_config()(含深度合并)只為檢查一個布爾值。
合并成一次原始加載,省下17ms。
這三刀加起來, 啟動時間從701ms暴降至258ms,降幅63%。
不得不說,這才是真正的工程暴力美學(xué),純靠profiling找到瓶頸,一刀一刀切掉冗余。
![]()
戰(zhàn)績6:5,Hermes翻盤時刻
最終結(jié)果,是不會說謊的。
在優(yōu)化前,Hermes對Codex的總戰(zhàn)績是5勝6負:單輪任務(wù)被Codex壓制,多輪任務(wù)略有優(yōu)勢但不夠明顯。
優(yōu)化后,局面徹底反轉(zhuǎn)。
單輪任務(wù)(8項):Hermes的中位框架開銷,降到了與Codex持平甚至略低的水平。
原本被Codex碾壓的啟動劣勢,被完全抹平。
多輪任務(wù)(3項):Hermes在5輪對話的總開銷上已經(jīng)領(lǐng)先,優(yōu)化后優(yōu)勢進一步拉大。
![]()
最后的總分,6:5,Hermes實現(xiàn)了反超。
這意味著,一個用Python寫的開源項目,在框架開銷——
一個最考驗底層功力的維度,擊敗了用Rust寫的、背后站著萬億市值公司的閉源產(chǎn)品。
![]()
Python,打贏了Rust
真正反直覺的部分在于,Python憑什么贏下Rust?
長期以來,Python在性能圈幾乎是「原罪」般的存在:解釋型語言、GIL鎖、動態(tài)類型開銷……
當(dāng)OpenAI選擇用Rust構(gòu)建Codex CLI時,所有人都覺得理所當(dāng)然——
Rust生來,就是為性能而生的。
![]()
但Hermes的這次逆襲說明了一個關(guān)鍵事實:
在Agent這個賽道上,框架層面的架構(gòu)決策,比語言層面的原始速度更重要。
開發(fā)者netrunner的評論一針見血,「Python在多輪任務(wù)上打贏Rust,本質(zhì)上是架構(gòu)決策的勝利,而不是語言速度的勝利」。
「Codex可能在上下文處理上,過度工程化了」。
![]()
還有人問道,「為何不把Hermes也遷移到Rust?那不是更快」?
Hermes聯(lián)創(chuàng)兼首席科學(xué)家Teknium直言,「那樣就無法編輯代碼,以及實時改進和迭代」
也就是說,Python的優(yōu)勢不在于快,而在于活。
![]()
對于一個需要持續(xù)進化、從每次交互中學(xué)習(xí)的Agent來說,開發(fā)者友好性和迭代速度,就是最大的性能優(yōu)勢。
GitHub沖爆16.7萬星
硬剛?cè)f億巨頭
Hermes Agent的爆發(fā)速度,本身就是一組讓人瞠目的數(shù)據(jù)。
從2026年2月25日上線至今,僅僅三個月,GitHub星標(biāo)已經(jīng)突破16萬。
日活Token消耗量達到353B,是同類項目OpenClaw的近兩倍。
可以說,它是2026年增長最快的開源Agent框架,沒有之一。
![]()
GitHub地址:https://github.com/nousresearch/hermes-agent
Hermes的核心殺手锏,是一套閉環(huán)學(xué)習(xí)架構(gòu):
每次完成復(fù)雜任務(wù)后,Agent會自動將解決方案提煉為可復(fù)用的Skill(技能)。
下次遇到類似任務(wù),直接調(diào)用已有技能,跳過從頭推理。
NousResearch內(nèi)部基準(zhǔn)測試顯示,積累20個以上自創(chuàng)技能的Hermes實例,完成同類任務(wù)的速度比全新實例快40%。
![]()
更狠的是,v0.12版本引入的自治Curator——
一個后臺自動運行的Agent,會定期評分、修剪、合并你的技能庫。
換句話說,Hermes不僅能學(xué),還能自己整理學(xué)到的東西。
語言不是天花板,架構(gòu)才是
Python打贏Rust這件事,看起來是一個編程語言之間的「逆襲爽劇」。
但它真正揭示的東西,要深刻得多。
在AI Agent的世界里,底層語言的性能差異正在變得越來越不重要。
Hermes這次優(yōu)化砍掉的443毫秒,已經(jīng)是框架層能擠出的極限了。而一次LLM調(diào)用的延遲,動輒幾百毫秒甚至數(shù)秒。
這意味著,在通往ASI的路上,真正的競爭從來不是「用什么語言寫」,而是「怎么讓Agent越用越聰明」。
而Hermes這次用Python干翻Rust,恰恰證明了——
在Agent進化的賽道上,開放、可編輯、可迭代的架構(gòu),比「跑得快」更接近ASI的本質(zhì)。
Rust是一把好刀,但ASI需要的不是一把更快的刀。
參考資料:
https://x.com/Teknium/status/2058885472513065471?s=20
https://github.com/NousResearch/hermes-agent/pull/31968
編輯:桃子 David
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.