无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

這款國產模型登頂 Artificial Analysis 輸出速度榜榜首

0
分享至


作者 | 冬梅

全球權威大模型評測平臺 Artificial Analysis 最新 Output Speed 榜單顯示,階躍星辰(StepFun)最新開源基座模型 Step 3.7 Flash 以409 tokens/s的輸出速度位列主流模型第一,同時在端到端響應時長(End-to-End Response Time)、智能效率(Intelligence vs. Output Speed)與速度價格比(Output Speed vs. Price)等關鍵指標上均處于靠前位置。


該圖對比模型為 Artificial Analysis 官方默認選項


該圖為 Step 3.7 Flash 與其他同量級主流 Flash 模型進行對比


該圖對比模型為 Artificial Analysis 官方默認選項

隨著 Agent 應用逐漸從演示階段走向生產環境,大模型競爭的評價標準也在發生變化。

過去,行業更關注模型在基準測試中的分數,以及數學、代碼、推理等單項能力表現。但在 Agent 場景中,一個任務往往涉及網頁瀏覽、信息檢索、文檔處理、多輪推理、工具調用等多個環節,模型需要在較長時間內持續運行,并與外部系統頻繁交互。此時,決定用戶體驗和部署成本的因素,已經不再只是模型能力本身,還包括響應速度、推理成本、系統吞吐量以及穩定性等工程指標。

換句話說,Agent 時代考驗的不僅是模型能否完成任務,更是完成任務的效率和成本。

從這一角度看,近期發布的 Step 3.7 Flash 更像是一款面向 Agent 場景優化的模型。公開測試數據顯示,其重點并非追求極限能力,而是在模型性能、響應速度和推理成本之間尋求平衡。這類優化方向與當前行業需求高度相關:對于需要高頻調用、長時間運行的 Agent 系統而言,單次推理成本和響應時延往往比個別基準測試成績更直接影響實際落地效果。

事實上,這也是當前全球大模型發展的一個共同趨勢。無論是 OpenAI、Anthropic 還是 Google,近一年來發布的新模型都在強調推理效率、實時交互能力以及 Agent 執行能力,而不僅僅是參數規模或測試集成績。

模型競爭正在從“誰更聰明”逐步轉向“誰能以更低成本完成更多真實任務”。

從社區反饋來看,Step 3.7 Flash 發布后獲得了不少開發者關注,在 x 上,有開發者表示,“這就是為什么對于真正的人工智能產品而言,速度正變得與智能同等重要。對于智能任務而言,速度快、開放、服務成本低且性能稍弱的模型,可能比速度太慢或運行成本太高而無法大規模運行的智能模型更有用。”


對于中國開源模型生態而言,這類模型的意義或許不在于某一次榜單排名,而在于參與了新一輪 Agent 基礎設施能力的競爭。隨著企業開始部署越來越多具備自主執行能力的 Agent 系統,模型的成本效率、工程可用性以及生態兼容性,正在成為與模型能力同樣重要的指標。

未來決定 Agent 能否大規模落地的,或許不是最強模型,而是能夠在智能、速度和成本之間取得平衡的模型。

https://x.com/ArtificialAnlys/status/2062381047212638697


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
尹錫悅涉“無人機事件”一案一審被判有期徒刑30年

尹錫悅涉“無人機事件”一案一審被判有期徒刑30年

界面新聞
2026-06-12 10:02:05
我國最大遺憾!1994年將領土劃給俄羅斯,如今還能再收回來嗎?

我國最大遺憾!1994年將領土劃給俄羅斯,如今還能再收回來嗎?

談古論今歷史有道
2026-06-10 09:30:09
專家分析得出:一旦核戰爆發,中國3個地方可躲災難,一定要知道

專家分析得出:一旦核戰爆發,中國3個地方可躲災難,一定要知道

文史達觀
2024-06-14 21:35:17
“你洗洗腳吧!”寶媽精心打扮接孩子,用力過猛被嘲諷

“你洗洗腳吧!”寶媽精心打扮接孩子,用力過猛被嘲諷

蝴蝶花雨話教育
2026-06-05 00:05:19
鄭麗文走出機場那刻,怕是這輩子都沒見過這種陣仗。

鄭麗文走出機場那刻,怕是這輩子都沒見過這種陣仗。

果媽聊娛樂
2026-06-07 09:51:32
比亞迪一建廠項目暫停!

比亞迪一建廠項目暫停!

電動內參
2026-06-12 18:49:58
“幾十年的血沒清洗過,您覺得干凈嗎?”

“幾十年的血沒清洗過,您覺得干凈嗎?”

中國新聞周刊
2026-06-11 07:22:08
中方接到日媒消息,高市已找上巴基斯坦,要跟中國主張打擂臺

中方接到日媒消息,高市已找上巴基斯坦,要跟中國主張打擂臺

狗子的快樂
2026-06-13 06:31:17
姆巴佩女友是西班牙超美女星,高級氣質讓人一眼淪陷

姆巴佩女友是西班牙超美女星,高級氣質讓人一眼淪陷

草莓解說體育
2026-06-13 01:39:11
離婚15年后再看謝暉,他的選擇有多正確

離婚15年后再看謝暉,他的選擇有多正確

小柨拍客在北漂
2026-06-09 12:55:49
“鵝腿阿姨”塌房:CBD不相信人設

“鵝腿阿姨”塌房:CBD不相信人設

一刻talks丨硬科技趣思想
2026-06-12 21:00:47
武漢通報昌盛泡花堿廠有關問題調查處理情況

武漢通報昌盛泡花堿廠有關問題調查處理情況

界面新聞
2026-06-12 17:32:40
錯判+漏判!勝率99.6%都輸了!阿奴諾比封蓋沒問題,登上FMVP榜首

錯判+漏判!勝率99.6%都輸了!阿奴諾比封蓋沒問題,登上FMVP榜首

Haviven聊球
2026-06-12 22:46:21
20%回撤之后,黃金迎來一場大變局

20%回撤之后,黃金迎來一場大變局

鳳凰網財經
2026-06-13 08:40:21
我與父親斷絕關系10年,他去世我沒去他葬禮,三天后他戰友找上門

我與父親斷絕關系10年,他去世我沒去他葬禮,三天后他戰友找上門

千秋文化
2026-06-10 20:43:44
凌晨全線暴漲!美伊局勢大反轉,美股芯片油價行情大變

凌晨全線暴漲!美伊局勢大反轉,美股芯片油價行情大變

魏家東
2026-06-12 14:57:11
滬女點外賣備注“牛蛙不燒”,商家害怕差評送活娃應對!

滬女點外賣備注“牛蛙不燒”,商家害怕差評送活娃應對!

咸魚金腦袋
2026-06-12 22:06:53
普京指責烏軍無人機襲擊制造恐慌,承認俄能源設施遭打擊

普京指責烏軍無人機襲擊制造恐慌,承認俄能源設施遭打擊

桂系007
2026-06-13 06:14:14
相比于印度的高溫,真正要命的是,全國快被渴死了

相比于印度的高溫,真正要命的是,全國快被渴死了

獨舞獨舞
2026-06-13 04:09:00
悲痛!甘肅一特警大隊長執行任務過程中不幸因公犧牲,年僅44歲

悲痛!甘肅一特警大隊長執行任務過程中不幸因公犧牲,年僅44歲

紅星新聞
2026-06-12 23:41:10
2026-06-13 09:27:00
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
12524文章數 51943關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

47歲泰國長公主去世 70多歲泰王現繼承危機

頭條要聞

47歲泰國長公主去世 70多歲泰王現繼承危機

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

房產
旅游
家居
手機
數碼

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

旅游要聞

這個夏天,在鄭州這些地方可以看“海”

家居要聞

空間微調 移形換境

手機要聞

三星官網公布Galaxy A27 5G手機參數,搭載驍龍6 Gen 3芯片

數碼要聞

喬思伯TM-280 AIO水冷首發499元:3.95英寸鋁飾板冷頭

無障礙瀏覽 進入關懷版