Meta Muse Spark 引入并行推理智能體與多模態 AI,聲稱效率提升達十倍。
![]()
Meta 已正式推出 Muse Spark,這款全新人工智能模型標志著其 AI 戰略的重新調整。
該模型是 Meta 超級智能實驗室發布的首款成果,融合了多模態推理能力與智能體式任務執行方式。
此次發布正值各大科技公司競相定義聊天機器人之后 AI 的下一階段。
與此前模型不同,Muse Spark 能夠在單一框架內同時處理文本、圖像及工具調用。
該系統還首次引入多個推理智能體并行運作的機制。
Meta 表示,這一設計能提升解決復雜問題的表現,不過公司也承認目前仍存在不足。
Muse Spark 折射出更廣泛的行業轉向——即構建能夠解讀并依據視覺與現實世界數據采取行動的系統。
該模型可分析圖像、解答視覺類 STEM 問題,并能結合上下文理解來識別物體。它還能對視覺輸入進行逐步推理,Meta 將此功能描述為“視覺思維鏈”。這些能力支撐起更具實用性的應用場景。
用戶可讓系統排查家電故障,或借助帶標注的視覺指引完成操作步驟。模型還可生成交互式內容,包括基于用戶提示構建的簡易小游戲。不過,此類功能在行業內仍表現參差不齊。
盡管各公司都在強調多模態方面的進步,但穩定的真實世界表現依然落后于受控基準測試結果。
并行智能體,更高風險
Meta 引入的一項關鍵功能名為“沉思模式”。該模式可讓多個推理智能體并行運行,旨在更有效地處理更困難的任務。
此舉與競爭對手通過在推理階段增加算力投入以擴展推理能力的做法相呼應。
據 Meta 披露,Muse Spark 在“人類終極考試”基準上得分為 58%,在“前沿科學研究”任務上得分為 38%。
這些基準旨在評估模型應對復雜推理問題的表現。
然而,由于各家評估方法不同,此類分數在不同模型間難以直接比較。
公司表示,該系統在未降低回應多樣性的前提下提升了可靠性。
并稱其在訓練數據覆蓋范圍之外的任務上同樣取得增益。針對這些說法的獨立驗證仍然有限。
規模效率成為焦點
本次發布背后是一輪更大規模的基礎設施調整。Meta 稱在過去九個月內重構了訓練流程,重點聚焦模型設計、優化與數據篩選。
公司宣稱,這些改動使 Muse Spark 在達到相近性能水平時所需的計算量遠低于此前系統。
根據 Meta 說法,相較于其前代 Llama 4 Maverick 模型,Muse Spark 用不足十分之一的算力便實現了可比的成果。
若該數據準確無誤,這一效率提升有望降低開發更大型 AI 系統的成本。
強化學習仍是該方法的核心。
Meta 報告稱,隨著訓練規模的擴大,模型在訓練任務與評估任務上均持續穩步提升。公司認為這表明相較于早期方法常見的性能不穩定問題,當前進展更具可預測性。
Meta 將 Muse Spark 定位為實現所謂“個人超級智能”的早期一步。該愿景的核心是讓 AI 系統理解用戶所處環境并提供個性化輔助。
健康領域是首批重點方向之一,相關訓練數據與醫生合作開發,旨在優化醫學解釋能力。
Muse Spark 現已在 Meta 的 AI 平臺上線,并向開發者提供有限的 API 訪問權限。
此次發布凸顯出 AI 競爭焦點的轉移。企業不再僅僅打造更聰明的模型,而是在構建旨在真實世界中運作的系統——即便可靠性與驗證仍是懸而未決的問題。
如果朋友們喜歡,敬請關注“知新了了”!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.