硬嘮編輯部原創
![]()
圖片
2026年3月12日。 在全行業競逐“極速響應”和“毫秒級端到端交互”的浪潮中。 陳天橋在社交媒體上發布了一個產品。 那是一個極其“緩慢”的 AI 代理:MiroThinker-1.7。
這個被定位為“深度研究”的模型,在面對一個復雜的金融預測請求時,并沒有秒回答案。 在用戶端的交互界面上,它保持了長達三分鐘的“思考”狀態。
在這三分鐘里,系統后臺跳動的數據顯示,它完成了 342 次工具調用。
這是一個足以讓產品經理感到焦慮的數字。 在通行的 AI 產品邏輯中,過多的工具調用意味著冗余、成本失控和用戶流失。
但當進度條走完,屏幕上彈出的 BrowseComp 基準測試分數為 88.2。 這個數字刷新了期在該榜單的記錄。
表象:重回“慢時代”
![]()
圖片
“Conversation is easy for AI. Solving real problems is not.” ——陳天橋(2026年3月12日,社交平臺)
大多數人對 AI 的認知停留在“對話”層面。 只要能流暢地接話,就被認為具備了智慧。 但在 MiroThinker 的邏輯里,這種流暢往往是幻覺的溫床。
它被設計成一個“慢思考者”。 它寧愿在后臺進行數百次的反復檢索、代碼運行和自我驗證。 它絕不允許給出一個未經證實的直接推論。
在 MiroMind 的研發日記中,這種特性被稱為“交互縮放(Interactive Scaling)”。 它將 AI 的性能提升從單純的參數堆砌,轉向了對交互深度的極致壓榨。
在 MiroThinker 發布之前,AI 工業界的信條一直是:大就是好。 從 2023 年到 2025 年,主流廠商的選擇是不斷增加模型參數。 人們相信,只要 AI 一次性“記住”足夠長的資料,智能就會涌現。
第一層真相:研究員的“縮放”
但陳天橋解剖出的真相是:單純的“記憶”和“容量”正在觸碰邊際效應。 MiroThinker 的技術白皮書里提出了一個反直覺的公式。
性能 ∝ 交互深度 × 驗證頻率。
這就是交互縮放。 如果把傳統大模型比作一個博聞強識但從不下地的“狀元”。 那么 MiroThinker 更像是一個在實驗室里不斷動手操作、失敗后再調整的“研究員”。
它并不試圖在 256K 的窗口里塞進整個互聯網。 而是利用有限的空間,記錄下每一次“行動”與“觀察”的反饋循環。 技術細節顯示,MiroThinker-1.7-mini 僅擁有 30B 的參數量。
在 2026 年,這個體量甚至不足以進入大模型的第一梯隊。 但在處理需要長鏈條推理的任務時,它通過多達數百次的工具調用跑贏了對手。 它不斷地去搜索引擎驗證、去跑代碼、對比信源。
它最終贏過了那些參數量是它十倍以上的“巨無霸”模型。 這意味著,AI 的進化邏輯正在發生質變。 搜索不再只是為了尋找答案,而是成為了推理過程的一部分。
第二層真相:驗證優于生成
如果說“交互縮放”給了 AI 動手的機會。 那么“驗證中心架構”則是給它裝上了一雙審視自己的眼睛。 在解剖運作機制時,最令人意外的發現是它的“記憶管理”。
在處理超長鏈條推理時,傳統的 AI 往往會產生“記憶漂移”。 這最終會導致邏輯崩塌。 MiroThinker 采取了一種近乎冷酷的過濾策略。
在它 256K 的有限窗口里,它被訓練去保留所有的思維鏈(Chain of Thought)。 但它會果斷地丟棄絕大部分工具返回的原始結果。
系統只保留最近的 5 步核心工具輸出。
這意味著,AI 不再試圖背下整個搜索結果。 它只記住“經過驗證的結論”和“被排除的假設”。 這種機制在內部被稱為“結構化內存(Structured Memory)”。
它將上下文分為三層:局部上下文、跨步上下文、全局上下文。 為了保證每一步的正確性,內部還運行著一個獨立邏輯審核員。 這個組件名為 ChainChecker。
它不負責尋找答案,只負責糾錯。 它會檢測 AI 是否在“編造”代碼修復。 或者是否在搜索過程中被某個網頁的錯誤信息誤導。
這種設計揭示了陳天橋對 AGI 的核心觀點。 智能不等于生成(Generation),智能等同于驗證(Verification)。 這種“驗證優先”的邏輯,讓模型在面對虛假信息或復雜數據時具備了免疫力。
它更像是一個經驗老到的刑警。 在數百條線索中反復穿插、對質。 直到拼湊出唯一經得起推敲的真相。
最終邏輯:陳天橋的執念
![]()
圖片
從盛大退隱后,陳天橋向天橋腦科學研究院(TCCI)投入了數十億美元。 這種對“大腦如何產生意識”的近乎執著的探索,找到了出口。 MiroThinker 與其他 Agent 最大的不同在于它對“主體性”的強調。
““AI 離真正的 Agent 還差一個‘主體意識’,它們只有計算邏輯,沒有責任身份。” ——陳天橋(2025年9月)
在陳天橋看來,如果 AI 只是在進行統計學上的概率模擬,就無法產生科研突破。 科研需要的是“主體意識”。 即研究者在面對失敗時,能夠基于過往記憶調整策略。
在面對海量噪音時,能夠堅守最初的目標。 這解釋了為什么 MiroThinker 如此癡迷于“驗證”。 驗證不是為了讓回答更漂亮,而是為了讓 AI 擁有“對自己行為負責”的能力。
在內部測試中,被賦予了“長期研究員”身份的 AI 表現出了類似人類專家的韌性。 這不再是一場關于大模型參數的軍備競賽。 而是一場關于“硅基主體”的進化實驗。
陳天橋并沒有回歸互聯網。 他只是把當年的《傳奇》戰場,搬到了人類最深邃的思維迷宮之中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.