鳳凰網科技訊 6月2日,今日凌晨,通義實驗室正式發布Qwen3.7-Plus多模態智能體模型。該模型在Qwen3.7文本與Agent能力基礎上深度融合視覺能力,主打“能看、能想、能動手”——可看懂圖形界面、操作應用、生成代碼并交付結果,實現GUI操作、CLI調用、代碼生成與自我驗證的端到端閉環。
![]()
在實測中,基于Qwen3.7-Plus構建的Hybrid-Agent系統連續穩定運行11小時以上,自主完成一款英語單詞學習APP的完整研發閉環:累計生成超10000行代碼,觸發超1000次調用,覆蓋需求文檔生成、代碼編寫、自動部署、測試用例創建、GUI自動化測試及版本迭代全流程。
在桌面應用場景中,該模型可自主交互macOS原生Stocks應用并理解UI布局與功能細節,自動生成SwiftUI源碼,接入LongBridge真實行情API獲取實時數據,自動編譯構建并啟動復刻應用。隨后自主執行10項功能驗證測試并全部通過,最終完整復現原生Stocks應用的暗色主題、分欄布局與實時行情交互體驗。
![]()
此外,Qwen3.7-Plus還支持多模態推理(可解析地鐵線路圖等復雜視覺信息)、搜索增強視覺問答、圖像/視頻轉SVG矢量代碼、視覺驅動的網頁設計等功能,并在瀏覽器Agent場景中可自動完成ECS云服務器采購、運維鏈路閉環等任務。模型在BabyVision、MathVision、ScreenSpot Pro、AndroidWorld等多項高難度基準上表現強勁。目前Qwen3.7-Plus已在阿里云百煉平臺上線,支持OpenAI兼容API與Anthropic協議調用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.