5月29日,基礎大模型創業公司階躍星辰正式發布并開源Step 3.7 Flash模型。這款面向生產級Agent場景設計的Flash模型,采用稀疏混合專家架構,總參數為1960億,配備18.8億參數的視覺編碼器ViT,激活參數僅為110億,最高生成速度可達每秒400個Token。
模型支持25.6萬Token上下文長度,提供三種推理層級,主要面向高頻、多輪、低延遲的智能體應用場景。
與今年2月開源的Step 3.5 Flash相比,3.7版本在Agent能力上進行了系統性強化。模型重點優化了四個關鍵能力:原生多模態理解與執行、聯網與視覺搜索增強、高可靠工具調用與編排以及Agent生態兼容性。
Step 3.7 Flash能夠直接處理UI界面、圖表、文檔、圖片以及各類應用界面,將復雜視覺信息轉化為結構化結果和可執行任務,并在信息不確定時主動發起搜索進行交叉驗證。工具調用方面,模型可在長程多輪工作流中穩定調用API、瀏覽器、終端、Office等外部系統。
基準測試方面,Step 3.7 Flash在ClawEval 1.1自主任務執行評測中得分67.1%,在考察多工具協同的Toolathlon上得分49.5%,在橫跨44種職業的GDPval上得分45.8%,在τ2-bench Telecom全難度通信任務測試中通過率均超過98%。
在代碼與工程能力上,模型在SimpleVQA Search視覺問答任務中得分79.2%,在V* Python視覺編程任務中得分95.3%,在SWE-Bench Pro軟件工程評測中得分56.3%,位列全球第二。
需注意的是,這些數據均由階躍星辰官方披露,尚未經由獨立第三方機構橫向驗證。
開源生態方面,Step 3.7 Flash采用Apache 2.0開源協議,已在Hugging Face和ModelScope平臺上線,權重和代碼均可直接下載。
模型對Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流開發框架和工具調用協議進行了兼容優化,同時支持云端與本地部署。
在硬件適配層面,該模型可在Mac Studio M4 Max、DGX Spark以及AMD AI Max+395等本地設備上運行。
當前開源大模型領域競爭格局已較為激烈。2026年4月,DeepSeek發布了V4系列,包含旗艦版V4-Pro與輕量版V4-Flash,總參數分別達到1.6萬億和2840億,均支持百萬Token上下文,采用MIT開源協議。
2月,阿里開源了Qwen3.5-Plus,總參數3970億,激活170億參數,部署顯存占用較前代降低60%。4月,騰訊混元發布Hy3 preview并同步開源,同期還有月之暗面Kimi K2.6和智譜GLM-5.1相繼發布。
Step 3.7 Flash在參數規模上處于競品序列的中等水平,其核心差異在于明確聚焦Agent場景的工程化優化而非純參數競賽。模型在工具調用和任務執行方面的針對性設計,使其在特定Agent工作流中具備差異化競爭力,但在通用推理能力和極致性能上尚需更多第三方評測驗證。
從行業趨勢看,國產大模型開源已形成密集迭代態勢。截至2025年12月,國產開源大模型全球累計下載量突破100億次。斯坦福大學2026年3月發布的AI指數報告顯示,先進閉源模型的整體表現僅比頂尖開源模型領先3.3個百分點。
OpenRouter平臺的用戶數據顯示,Step 3.5 Flash上線一個月后曾登頂該平臺OpenClaw調用量月榜全球第一,說明市場對高效Agent模型存在真實需求。
Step 3.7 Flash能否延續這一趨勢,將取決于其在實際部署中的穩定性、社區采納速度以及后續第三方獨立評測的反饋。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.