![]()
新智元報道
![]()
【新智元導讀】一個純Python寫的開源項目,竟把OpenAI用Rust寫的王牌給秒了!最終戰績6比5,Hermes直接上演工程暴力美學,解釋型語言終于逆天改命。
一個純Python寫的開源項目,竟擊潰了OpenAI王牌!
今天,全網都被Hermes Agent的硬核實力狠狠刷屏了:
在針對真實世界CLI任務的11項基準測試中,它以6:5的戰績,直接把Codex按在地上摩擦。
![]()
在這場備受矚目的對決中,Hermes Agent展現出了驚人的底層優化能力。
通過一連串的硬核操作,成功把系統的啟動時間,從701ms縮短至258ms。
![]()
更讓人震撼的是,Hermes完全由Python編寫,而Codex是用Rust寫的。
這一仗,Python打贏了Rust!
這在編程界,屬是「逆天改命」了。
![]()
![]()
三大狠招,砍掉63%啟動時間
就在這次優化之前,Hermes還是5-6落后的那個。
這次逆轉不是靠換模型、不是靠堆算力,而是靠三個純工程優化,刀刀見血。
![]()
那么,它是具體如何做到的?
第一刀:Bitwarden磁盤緩存
原來Hermes每次啟動都會調用Bitwarden Secrets Manager的API去拉取憑據,一次就是380毫秒。
問題在于,之前的緩存是「純進程內」,連續執行兩次hermes chat -q,第二次還是要重新拉。
解決方案是,加了一個L2磁盤緩存。
緩存文件權限鎖死0600,存放在
/cache/bws_cache.json
,默認TTL 300秒。
另外,訪問token本身絕不落盤,默認300秒TTL,過期才重新拉取。
一刀砍掉380ms。
![]()
第二刀:模型目錄延遲加載
hermes_cli.models._PROVIDER_MODELS,一個包含所有AI供應商模型信息的巨型字典。
之前在模塊加載時就急切導入,吃掉約55ms。
實際上只有model_flow相關的處理函數才需要它。
團隊用PEP 562的模塊級getattr實現了懶加載,只在真正訪問模型目錄時才付出這筆開銷。。
這一步,又省了55毫秒。
第三刀:配置文件去重
main.py頂部原本讀了兩次config.yaml。
一次yaml.safe_load用于密鑰脫敏橋接,一次完整的load_config()(含深度合并)只為檢查一個布爾值。
合并成一次原始加載,省下17ms。
這三刀加起來, 啟動時間從701ms暴降至258ms,降幅63%。
不得不說,這才是真正的工程暴力美學,純靠profiling找到瓶頸,一刀一刀切掉冗余。
![]()
戰績6:5,Hermes翻盤時刻
最終結果,是不會說謊的。
在優化前,Hermes對Codex的總戰績是5勝6負:單輪任務被Codex壓制,多輪任務略有優勢但不夠明顯。
優化后,局面徹底反轉。
單輪任務(8項):Hermes的中位框架開銷,降到了與Codex持平甚至略低的水平。
原本被Codex碾壓的啟動劣勢,被完全抹平。
多輪任務(3項):Hermes在5輪對話的總開銷上已經領先,優化后優勢進一步拉大。
![]()
最后的總分,6:5,Hermes實現了反超。
這意味著,一個用Python寫的開源項目,在框架開銷——
一個最考驗底層功力的維度,擊敗了用Rust寫的、背后站著萬億市值公司的閉源產品。
![]()
Python,打贏了Rust
真正反直覺的部分在于,Python憑什么贏下Rust?
長期以來,Python在性能圈幾乎是「原罪」般的存在:解釋型語言、GIL鎖、動態類型開銷……
當OpenAI選擇用Rust構建Codex CLI時,所有人都覺得理所當然——
Rust生來,就是為性能而生的。
![]()
但Hermes的這次逆襲說明了一個關鍵事實:
在Agent這個賽道上,框架層面的架構決策,比語言層面的原始速度更重要。
開發者netrunner的評論一針見血,「Python在多輪任務上打贏Rust,本質上是架構決策的勝利,而不是語言速度的勝利」。
「Codex可能在上下文處理上,過度工程化了」。
![]()
還有人問道,「為何不把Hermes也遷移到Rust?那不是更快」?
Hermes聯創兼首席科學家Teknium直言,「那樣就無法編輯代碼,以及實時改進和迭代」
也就是說,Python的優勢不在于快,而在于活。
![]()
對于一個需要持續進化、從每次交互中學習的Agent來說,開發者友好性和迭代速度,就是最大的性能優勢。
GitHub沖爆16.7萬星
硬剛萬億巨頭
Hermes Agent的爆發速度,本身就是一組讓人瞠目的數據。
從2026年2月25日上線至今,僅僅三個月,GitHub星標已經突破16萬。
日活Token消耗量達到353B,是同類項目OpenClaw的近兩倍。
可以說,它是2026年增長最快的開源Agent框架,沒有之一。
![]()
GitHub地址:https://github.com/nousresearch/hermes-agent
Hermes的核心殺手锏,是一套閉環學習架構:
每次完成復雜任務后,Agent會自動將解決方案提煉為可復用的Skill(技能)。
下次遇到類似任務,直接調用已有技能,跳過從頭推理。
NousResearch內部基準測試顯示,積累20個以上自創技能的Hermes實例,完成同類任務的速度比全新實例快40%。
![]()
更狠的是,v0.12版本引入的自治Curator——
一個后臺自動運行的Agent,會定期評分、修剪、合并你的技能庫。
換句話說,Hermes不僅能學,還能自己整理學到的東西。
語言不是天花板,架構才是
Python打贏Rust這件事,看起來是一個編程語言之間的「逆襲爽劇」。
但它真正揭示的東西,要深刻得多。
在AI Agent的世界里,底層語言的性能差異正在變得越來越不重要。
Hermes這次優化砍掉的443毫秒,已經是框架層能擠出的極限了。而一次LLM調用的延遲,動輒幾百毫秒甚至數秒。
這意味著,在通往ASI的路上,真正的競爭從來不是「用什么語言寫」,而是「怎么讓Agent越用越聰明」。
而Hermes這次用Python干翻Rust,恰恰證明了——
在Agent進化的賽道上,開放、可編輯、可迭代的架構,比「跑得快」更接近ASI的本質。
Rust是一把好刀,但ASI需要的不是一把更快的刀。
參考資料:
https://x.com/Teknium/status/2058885472513065471?s=20
https://github.com/NousResearch/hermes-agent/pull/31968
編輯:桃子 David
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.