![]()
整理 | 華衛
“我們現在已經基本追平了幾個月前的最先進水平。”在 Build 大會前夕,微軟 AI 執行副總裁兼 CEO Mustafa Suleyman 在采訪中表示。
昨日,微軟在 Build 大會上發布了一系列自研的 AI 模型。這標志著微軟在模型研發上的一次重要推進,去年該公司才推出了首批自研模型,在此之前微軟還主要依賴 OpenAI 的模型。甚至有一些觀察人士,將本次大會稱為微軟的“AI 獨立日”。
同時,Suleyman 也登臺說明了公司在 AI 發展上的思考。他強調,微軟的 AI 工作始終致力于支持人類員工和用戶,而非取代他們,微軟希望打造的是一種被稱為“人本主義超級智能(humanist superintelligence)”的體系。
整體來看,這次 Build 大會的核心信號非常明確:微軟正在從“AI 應用整合者”,轉向“全棧 AI 基礎設施與模型提供者”。
完全從零開始訓練,
微軟推出首個高級推理模型
微軟新模型家族的核心是 MAI-Thinking-1,這是微軟首個高級推理模型。
據介紹,MAI-Thinking-1 是一款“中等規模模型”,擁有 350 億活躍參數和 128K 上下文窗口,總參數規模約 1 萬億,在效率與性能之間取得平衡,同時強調低 token 成本。微軟開發者市場負責人兼 GitHub 首席運營官 Kyle Daigle 在主題演講前的媒體溝通會上表示,“MAI-Thinking-1 的設計目標,是擅長處理復雜的多步驟指令、長上下文推理以及代碼生成。”
在過去一年中,推理模型這一類別主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本,以及 Anthropic 的 Claude 擴展思考模式所主導,另有開源權重陣營的 DeepSeek R1 在 2025 年初一度撼動了這一格局。
MAI-Thinking-1 是微軟在這一賽道的新入局產品。在關鍵的軟件工程基準測試中,它可以對標行業領先模型;在 SWE Bench Pro 編程基準上,其表現與 Claude Opus 4.6 持平。同時,該模型展現出先進的數學推理能力;MAI-Thinking-1 在 AIME 2025 中達到 97.0%,在 AIME 2026 中達到 94.5%。在微軟進行的盲測人工對比評估中,用戶對它的偏好甚至超過了 Anthropic 的 Claude Sonnet 4.6。
![]()
目前,微軟尚未披露具體的訓練方法,例如是否采用了“可驗證獎勵強化學習”(類似 OpenAI o1 的技術路徑)、過程獎勵建模或其他方案。但他們明確了一點“否定信息”:模型的訓練數據中不包含任何其他已訓練 AI 系統的概率分布或輸出序列。
微軟強調,MAI-Thinking-1 完全從零開始訓練,使用的是企業級、干凈且具備合規商業授權的數據,并且在預訓練階段排除了 AI 生成內容,也沒有使用來自第三方模型的蒸餾數據,這迫使“模型真正學會任務本身”。
而這一“獨立訓練”的主張,或成為 MAI-Thinking-1 面向企業客戶的差異化賣點。對于那些需要“干凈知識產權來源”的企業來說,這一點甚至比模型能力本身更關鍵。對初創公司或非監管場景的開發者而言,這種差異可能顯得抽象。但對部署在醫療、金融、國防或任何需要合規采購與數據治理的場景中的 AI 來說,這很可能會變成采購流程中的一個“必選勾選項”。
MAI 模型家族:
一個多模態生態系統
微軟還發布了另外六款 MAI 系列模型,覆蓋圖像生成、語音轉寫、語音合成和編程等方向。
其中,MAI-Code-1-Flash 是一款推理效率極高的智能體編程模型,專為并深度集成于 GitHub Copilot、Visual Studio Code 以及微軟整體技術棧而打造。其參數規模為 50 億(5B),性能可對標 Haiku,但成本更低。
MAI-Image-2.5(包括其超高效的 Flash 版本)同時支持世界級的文生圖與圖像編輯能力,其 Arena 評分已超過 Nano Banana Pro。MAI Transcribe-1.5 是當前全球最強的語音轉錄模型之一,達到 SOTA(最先進水平)準確率。它的速度是同類模型的 5 倍,并內置支持 43 種語言的領域專有術語。MAI-Voice-2 提供覆蓋 15 種語言的高質量、自然語音生成能力,并支持通過短語音樣本進行聲音適配,同時具備完善的濫用防護機制。其更高性價比版本 MAI-Voice-2-Flash 也即將推出。
未來,這些模型都將統一接入 Foundry 以及一個新的專用環境 MAI Playground。除了在 Azure AI Foundry 上分發并針對微軟一方產品(1P)優化之外,這些模型還將面向開發者廣泛開放,并支持在更多平臺上使用。首次,開發者將可以對模型權重進行自定義調優。
值得一提的是,所有這些模型都建立在同一個基礎之上:從零開始“向上爬升”(hill-climbing),不依賴任何蒸餾方法,共享一致的數據規范、訓練基礎設施和評估體系。
“升級版 OpenClaw”來了:
首日用就能被信任?
2026 年初,OpenClaw 席卷 AI 圈。現在,微軟推出了 Scout,這是一款基于 OpenClaw 框架構建的 AI 智能體,可以全天候自主運行,在 Microsoft 365 應用之間獨立完成任務。據介紹,Scout 可以連接 Teams、Outlook、OneDrive 和 SharePoint 等應用,并訪問聊天、郵件、日歷和聯系人數據。用戶可通過 Teams 調用它,它還可以與用戶的瀏覽器交互,并通過模型上下文協議(MCP)連接外部應用。該工具可在云端、桌面端和網頁端運行。
“該智能體會在后臺持續運行,理解你的各類應用和系統中工作的運作方式,并在不需要每次提示的情況下主動采取行動。”微軟企業副總裁 Omar Shahine 在一篇博客中表示,這類智能體會以用戶的身份執行操作,并擁有受治理的 Entra 身份。作為微軟資深員工,Shahine 近期還宣布將領導一個新團隊,把基于 OpenClaw 的個人助手引入 Microsoft 365 應用。
Shahine 表示,Scout 可以減少辦公人員面對的重復性任務,例如與同事協調和安排會議時間,或根據即將到來的工作安排自動在日歷中預留時間。“它還可以發現風險,例如決策停滯,從而讓你在問題演變成阻礙之前及時處理。”
值得注意的是,由于明顯存在安全漏洞,OpenClaw 一度受到審查,但微軟承諾 Scout 具備“企業級安全與控制能力,從第一天起就可以在組織中被信任使用”。微軟還表示,將向開源 OpenClaw 項目進行上游貢獻。
目前,Scout 以“實驗性版本”的形式向其 Frontier 項目客戶開放,并需要通過 Intune 策略配置以及“主動選擇確認(opt-in attestation)”。定價方面,微軟暫未公布更多細節,尚不清楚 Scout 是否會包含在 Microsoft 365 Copilot 訂閱中,還是作為單獨產品收費。
盡管微軟大力推進 AI,其仍在努力說服企業客戶相信 Microsoft 365 Copilot 的附加費用是值得的。該產品面向大型企業定價為每位用戶每月 30 美元。今年 1 月,微軟表示約有 3% 的 Microsoft 365 客戶為該附加訂閱付費,總計約 1500 萬付費用戶。上月,微軟宣布該數字已增長至 2000 萬。Scout 是微軟在 Microsoft 365 中推出的一系列智能體工具中的最新一項,這些工具還包括 Agent Mode(用戶可在 Word、Excel 等應用中與 Microsoft 365 Copilot 交互生成內容)以及 Copilot Cowork(微軟版的 Anthropic Claude Cowork 智能體,可獨立完成任務)。
https://microsoft.ai/news/microsoft-build-2026-mai-keynote-transcript/
https://www.semafor.com/article/06/02/2026/microsofts-ai-chief-on-the-greatest-game-of-catchup-ever-played
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
企業級 Agent 落地,繞不開 4 個真實的工程問題!如何在 Agent 安全性和可用性之間找到平衡點?Agent 需要什么樣的記憶系統才能真正理解上下文?如何通過算法壓榨實現智力增量與成本控制的極致平衡?多 Agent 協作,如何做到可觀測、可治理、可控制?6.26-27 AICon 上海站,國內頭部公司的 Agent 實踐,一次說透。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.