網易首頁 > 網易號 > 正文申請入駐

拒絕蒸餾！微軟發布自研MAI-Thinking-1追平Claude Opus 4.6：完全從零訓練，不沾任何第三方模型輸出

2026-06-03 13:11:45　來源: AI前線

北京舉報

分享至

整理 | 華衛

“我們現在已經基本追平了幾個月前的最先進水平。”在 Build 大會前夕，微軟 AI 執行副總裁兼 CEO Mustafa Suleyman 在采訪中表示。

昨日，微軟在 Build 大會上發布了一系列自研的 AI 模型。這標志著微軟在模型研發上的一次重要推進，去年該公司才推出了首批自研模型，在此之前微軟還主要依賴 OpenAI 的模型。甚至有一些觀察人士，將本次大會稱為微軟的“AI 獨立日”。

同時，Suleyman 也登臺說明了公司在 AI 發展上的思考。他強調，微軟的 AI 工作始終致力于支持人類員工和用戶，而非取代他們，微軟希望打造的是一種被稱為“人本主義超級智能（humanist superintelligence）”的體系。

整體來看，這次 Build 大會的核心信號非常明確：微軟正在從“AI 應用整合者”，轉向“全棧 AI 基礎設施與模型提供者”。

完全從零開始訓練，

微軟推出首個高級推理模型

微軟新模型家族的核心是 MAI-Thinking-1，這是微軟首個高級推理模型。

據介紹，MAI-Thinking-1 是一款“中等規模模型”，擁有 350 億活躍參數和 128K 上下文窗口，總參數規模約 1 萬億，在效率與性能之間取得平衡，同時強調低 token 成本。微軟開發者市場負責人兼 GitHub 首席運營官 Kyle Daigle 在主題演講前的媒體溝通會上表示，“MAI-Thinking-1 的設計目標，是擅長處理復雜的多步驟指令、長上下文推理以及代碼生成。”

在過去一年中，推理模型這一類別主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本，以及 Anthropic 的 Claude 擴展思考模式所主導，另有開源權重陣營的 DeepSeek R1 在 2025 年初一度撼動了這一格局。

MAI-Thinking-1 是微軟在這一賽道的新入局產品。在關鍵的軟件工程基準測試中，它可以對標行業領先模型；在 SWE Bench Pro 編程基準上，其表現與 Claude Opus 4.6 持平。同時，該模型展現出先進的數學推理能力；MAI-Thinking-1 在 AIME 2025 中達到 97.0%，在 AIME 2026 中達到 94.5%。在微軟進行的盲測人工對比評估中，用戶對它的偏好甚至超過了 Anthropic 的 Claude Sonnet 4.6。

目前，微軟尚未披露具體的訓練方法，例如是否采用了“可驗證獎勵強化學習”（類似 OpenAI o1 的技術路徑）、過程獎勵建模或其他方案。但他們明確了一點“否定信息”：模型的訓練數據中不包含任何其他已訓練 AI 系統的概率分布或輸出序列。

微軟強調，MAI-Thinking-1 完全從零開始訓練，使用的是企業級、干凈且具備合規商業授權的數據，并且在預訓練階段排除了 AI 生成內容，也沒有使用來自第三方模型的蒸餾數據，這迫使“模型真正學會任務本身”。

而這一“獨立訓練”的主張，或成為 MAI-Thinking-1 面向企業客戶的差異化賣點。對于那些需要“干凈知識產權來源”的企業來說，這一點甚至比模型能力本身更關鍵。對初創公司或非監管場景的開發者而言，這種差異可能顯得抽象。但對部署在醫療、金融、國防或任何需要合規采購與數據治理的場景中的 AI 來說，這很可能會變成采購流程中的一個“必選勾選項”。

MAI 模型家族：

一個多模態生態系統

微軟還發布了另外六款 MAI 系列模型，覆蓋圖像生成、語音轉寫、語音合成和編程等方向。

其中，MAI-Code-1-Flash 是一款推理效率極高的智能體編程模型，專為并深度集成于 GitHub Copilot、Visual Studio Code 以及微軟整體技術棧而打造。其參數規模為 50 億（5B），性能可對標 Haiku，但成本更低。

MAI-Image-2.5（包括其超高效的 Flash 版本）同時支持世界級的文生圖與圖像編輯能力，其 Arena 評分已超過 Nano Banana Pro。MAI Transcribe-1.5 是當前全球最強的語音轉錄模型之一，達到 SOTA（最先進水平）準確率。它的速度是同類模型的 5 倍，并內置支持 43 種語言的領域專有術語。MAI-Voice-2 提供覆蓋 15 種語言的高質量、自然語音生成能力，并支持通過短語音樣本進行聲音適配，同時具備完善的濫用防護機制。其更高性價比版本 MAI-Voice-2-Flash 也即將推出。

未來，這些模型都將統一接入 Foundry 以及一個新的專用環境 MAI Playground。除了在 Azure AI Foundry 上分發并針對微軟一方產品（1P）優化之外，這些模型還將面向開發者廣泛開放，并支持在更多平臺上使用。首次，開發者將可以對模型權重進行自定義調優。

值得一提的是，所有這些模型都建立在同一個基礎之上：從零開始“向上爬升”（hill-climbing），不依賴任何蒸餾方法，共享一致的數據規范、訓練基礎設施和評估體系。

“升級版 OpenClaw”來了：

首日用就能被信任？

2026 年初，OpenClaw 席卷 AI 圈。現在，微軟推出了 Scout，這是一款基于 OpenClaw 框架構建的 AI 智能體，可以全天候自主運行，在 Microsoft 365 應用之間獨立完成任務。據介紹，Scout 可以連接 Teams、Outlook、OneDrive 和 SharePoint 等應用，并訪問聊天、郵件、日歷和聯系人數據。用戶可通過 Teams 調用它，它還可以與用戶的瀏覽器交互，并通過模型上下文協議（MCP）連接外部應用。該工具可在云端、桌面端和網頁端運行。

“該智能體會在后臺持續運行，理解你的各類應用和系統中工作的運作方式，并在不需要每次提示的情況下主動采取行動。”微軟企業副總裁 Omar Shahine 在一篇博客中表示，這類智能體會以用戶的身份執行操作，并擁有受治理的 Entra 身份。作為微軟資深員工，Shahine 近期還宣布將領導一個新團隊，把基于 OpenClaw 的個人助手引入 Microsoft 365 應用。

Shahine 表示，Scout 可以減少辦公人員面對的重復性任務，例如與同事協調和安排會議時間，或根據即將到來的工作安排自動在日歷中預留時間。“它還可以發現風險，例如決策停滯，從而讓你在問題演變成阻礙之前及時處理。”

值得注意的是，由于明顯存在安全漏洞，OpenClaw 一度受到審查，但微軟承諾 Scout 具備“企業級安全與控制能力，從第一天起就可以在組織中被信任使用”。微軟還表示，將向開源 OpenClaw 項目進行上游貢獻。

目前，Scout 以“實驗性版本”的形式向其 Frontier 項目客戶開放，并需要通過 Intune 策略配置以及“主動選擇確認（opt-in attestation）”。定價方面，微軟暫未公布更多細節，尚不清楚 Scout 是否會包含在 Microsoft 365 Copilot 訂閱中，還是作為單獨產品收費。

盡管微軟大力推進 AI，其仍在努力說服企業客戶相信 Microsoft 365 Copilot 的附加費用是值得的。該產品面向大型企業定價為每位用戶每月 30 美元。今年 1 月，微軟表示約有 3% 的 Microsoft 365 客戶為該附加訂閱付費，總計約 1500 萬付費用戶。上月，微軟宣布該數字已增長至 2000 萬。Scout 是微軟在 Microsoft 365 中推出的一系列智能體工具中的最新一項，這些工具還包括 Agent Mode（用戶可在 Word、Excel 等應用中與 Microsoft 365 Copilot 交互生成內容）以及 Copilot Cowork（微軟版的 Anthropic Claude Cowork 智能體，可獨立完成任務）。

https://microsoft.ai/news/microsoft-build-2026-mai-keynote-transcript/

https://www.semafor.com/article/06/02/2026/microsofts-ai-chief-on-the-greatest-game-of-catchup-ever-played

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

企業級 Agent 落地，繞不開 4 個真實的工程問題！如何在 Agent 安全性和可用性之間找到平衡點？Agent 需要什么樣的記憶系統才能真正理解上下文？如何通過算法壓榨實現智力增量與成本控制的極致平衡？多 Agent 協作，如何做到可觀測、可治理、可控制？6.26-27 AICon 上海站，國內頭部公司的 Agent 實踐，一次說透。

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.