无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

陳天橋發布新模型:靠“縮放”挑戰AI幻覺

0
分享至

硬嘮編輯部原創


圖片

2026年3月12日。 在全行業競逐“極速響應”和“毫秒級端到端交互”的浪潮中。 陳天橋在社交媒體上發布了一個產品。 那是一個極其“緩慢”的 AI 代理:MiroThinker-1.7。

這個被定位為“深度研究”的模型,在面對一個復雜的金融預測請求時,并沒有秒回答案。 在用戶端的交互界面上,它保持了長達三分鐘的“思考”狀態。

在這三分鐘里,系統后臺跳動的數據顯示,它完成了 342 次工具調用。

這是一個足以讓產品經理感到焦慮的數字。 在通行的 AI 產品邏輯中,過多的工具調用意味著冗余、成本失控和用戶流失。

但當進度條走完,屏幕上彈出的 BrowseComp 基準測試分數為 88.2。 這個數字刷新了期在該榜單的記錄。

表象:重回“慢時代”


圖片

“Conversation is easy for AI. Solving real problems is not.” ——陳天橋(2026年3月12日,社交平臺)

大多數人對 AI 的認知停留在“對話”層面。 只要能流暢地接話,就被認為具備了智慧。 但在 MiroThinker 的邏輯里,這種流暢往往是幻覺的溫床。

它被設計成一個“慢思考者”。 它寧愿在后臺進行數百次的反復檢索、代碼運行和自我驗證。 它絕不允許給出一個未經證實的直接推論。

在 MiroMind 的研發日記中,這種特性被稱為“交互縮放(Interactive Scaling)”。 它將 AI 的性能提升從單純的參數堆砌,轉向了對交互深度的極致壓榨。

在 MiroThinker 發布之前,AI 工業界的信條一直是:大就是好。 從 2023 年到 2025 年,主流廠商的選擇是不斷增加模型參數。 人們相信,只要 AI 一次性“記住”足夠長的資料,智能就會涌現。

第一層真相:研究員的“縮放”

但陳天橋解剖出的真相是:單純的“記憶”和“容量”正在觸碰邊際效應。 MiroThinker 的技術白皮書里提出了一個反直覺的公式。

性能 ∝ 交互深度 × 驗證頻率。

這就是交互縮放。 如果把傳統大模型比作一個博聞強識但從不下地的“狀元”。 那么 MiroThinker 更像是一個在實驗室里不斷動手操作、失敗后再調整的“研究員”。

它并不試圖在 256K 的窗口里塞進整個互聯網。 而是利用有限的空間,記錄下每一次“行動”與“觀察”的反饋循環。 技術細節顯示,MiroThinker-1.7-mini 僅擁有 30B 的參數量。

在 2026 年,這個體量甚至不足以進入大模型的第一梯隊。 但在處理需要長鏈條推理的任務時,它通過多達數百次的工具調用跑贏了對手。 它不斷地去搜索引擎驗證、去跑代碼、對比信源。

它最終贏過了那些參數量是它十倍以上的“巨無霸”模型。 這意味著,AI 的進化邏輯正在發生質變。 搜索不再只是為了尋找答案,而是成為了推理過程的一部分。

第二層真相:驗證優于生成

如果說“交互縮放”給了 AI 動手的機會。 那么“驗證中心架構”則是給它裝上了一雙審視自己的眼睛。 在解剖運作機制時,最令人意外的發現是它的“記憶管理”。

在處理超長鏈條推理時,傳統的 AI 往往會產生“記憶漂移”。 這最終會導致邏輯崩塌。 MiroThinker 采取了一種近乎冷酷的過濾策略。

在它 256K 的有限窗口里,它被訓練去保留所有的思維鏈(Chain of Thought)。 但它會果斷地丟棄絕大部分工具返回的原始結果。

系統只保留最近的 5 步核心工具輸出。

這意味著,AI 不再試圖背下整個搜索結果。 它只記住“經過驗證的結論”和“被排除的假設”。 這種機制在內部被稱為“結構化內存(Structured Memory)”。

它將上下文分為三層:局部上下文、跨步上下文、全局上下文。 為了保證每一步的正確性,內部還運行著一個獨立邏輯審核員。 這個組件名為 ChainChecker。

它不負責尋找答案,只負責糾錯。 它會檢測 AI 是否在“編造”代碼修復。 或者是否在搜索過程中被某個網頁的錯誤信息誤導。

這種設計揭示了陳天橋對 AGI 的核心觀點。 智能不等于生成(Generation),智能等同于驗證(Verification)。 這種“驗證優先”的邏輯,讓模型在面對虛假信息或復雜數據時具備了免疫力。

它更像是一個經驗老到的刑警。 在數百條線索中反復穿插、對質。 直到拼湊出唯一經得起推敲的真相。

最終邏輯:陳天橋的執念


圖片

從盛大退隱后,陳天橋向天橋腦科學研究院(TCCI)投入了數十億美元。 這種對“大腦如何產生意識”的近乎執著的探索,找到了出口。 MiroThinker 與其他 Agent 最大的不同在于它對“主體性”的強調。

““AI 離真正的 Agent 還差一個‘主體意識’,它們只有計算邏輯,沒有責任身份。” ——陳天橋(2025年9月)

在陳天橋看來,如果 AI 只是在進行統計學上的概率模擬,就無法產生科研突破。 科研需要的是“主體意識”。 即研究者在面對失敗時,能夠基于過往記憶調整策略。

在面對海量噪音時,能夠堅守最初的目標。 這解釋了為什么 MiroThinker 如此癡迷于“驗證”。 驗證不是為了讓回答更漂亮,而是為了讓 AI 擁有“對自己行為負責”的能力。

在內部測試中,被賦予了“長期研究員”身份的 AI 表現出了類似人類專家的韌性。 這不再是一場關于大模型參數的軍備競賽。 而是一場關于“硅基主體”的進化實驗。

陳天橋并沒有回歸互聯網。 他只是把當年的《傳奇》戰場,搬到了人類最深邃的思維迷宮之中。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

醉臥浮生
2026-06-13 06:20:14
“鵝腿阿姨”塌房:CBD不相信人設

“鵝腿阿姨”塌房:CBD不相信人設

一刻talks丨硬科技趣思想
2026-06-12 21:00:47
妻子出軌,丈夫將15公分蠟燭塞進妻子的陰道內

妻子出軌,丈夫將15公分蠟燭塞進妻子的陰道內

胖胖侃咖
2025-04-13 08:00:08
“衩都開到大腿根了,不怕丟人嗎?”高三家長旗袍送考,反被群嘲

“衩都開到大腿根了,不怕丟人嗎?”高三家長旗袍送考,反被群嘲

怪味歷史連連看
2026-06-10 17:37:26
香珀特說“那根本不算蓋帽”:為福克斯發聲,裁判報告卻另有說法

香珀特說“那根本不算蓋帽”:為福克斯發聲,裁判報告卻另有說法

綠茵狂熱者
2026-06-13 00:50:48
醫生總問“有沒有性生活”?根本不是查隱私!很多人都誤解

醫生總問“有沒有性生活”?根本不是查隱私!很多人都誤解

太極本草
2026-06-07 13:19:18
1943 年主將拒交兵權,拒不赴延安進修,還加害接任將領

1943 年主將拒交兵權,拒不赴延安進修,還加害接任將領

嘮叨說歷史
2026-05-25 11:46:11
劉家成執掌北控大權,敲定首筆交易,王少杰買斷加盟廣東成定局!

劉家成執掌北控大權,敲定首筆交易,王少杰買斷加盟廣東成定局!

體育見習官
2026-06-13 11:24:31
伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

黑鷹觀軍事
2026-06-12 16:10:40
在韓國上班的華人感慨:不要信媒體,韓國已經相當于我國二線城市

在韓國上班的華人感慨:不要信媒體,韓國已經相當于我國二線城市

商業財經風向
2026-06-13 12:06:38
證監會:全面推進實施新一輪資本市場改革開放

證監會:全面推進實施新一輪資本市場改革開放

新浪財經
2026-06-13 08:05:21
高考后2天花光母親2萬元的女生被網暴,真的值得同情嗎?

高考后2天花光母親2萬元的女生被網暴,真的值得同情嗎?

燈錦年
2026-06-13 13:41:02
陪睡只是入門!認干爹、舔手指,背地里的陰暗面完全藏不住了...

陪睡只是入門!認干爹、舔手指,背地里的陰暗面完全藏不住了...

芳華青年
2026-05-18 13:07:54
黃金跌了價,2026年6月13日,中國黃金新價格、人民幣黃金新價格

黃金跌了價,2026年6月13日,中國黃金新價格、人民幣黃金新價格

說故事的阿襲
2026-06-13 08:21:02
中方通告全球,不許配合美封殺華為芯片,黃仁勛:美國已經失敗

中方通告全球,不許配合美封殺華為芯片,黃仁勛:美國已經失敗

可樂愛微笑
2026-06-12 19:14:13
阿里高層這次真的生氣了

阿里高層這次真的生氣了

一見財經
2026-06-12 11:11:21
71年,高崗妻子特意申請去圖書館工作,毛主席拒絕:必須教育部

71年,高崗妻子特意申請去圖書館工作,毛主席拒絕:必須教育部

歷史龍元閣
2026-06-13 08:10:27
正式確定!內線新星離開廣東宏遠,加入遼寧男籃

正式確定!內線新星離開廣東宏遠,加入遼寧男籃

體壇瞎白話
2026-06-13 07:38:22
悲痛!甘肅一特警大隊長執行任務過程中不幸因公犧牲,年僅44歲

悲痛!甘肅一特警大隊長執行任務過程中不幸因公犧牲,年僅44歲

紅星新聞
2026-06-12 23:41:10
高考中出現的“神仙卷面”,閱卷老師都不忍扣分,值得大家學習!

高考中出現的“神仙卷面”,閱卷老師都不忍扣分,值得大家學習!

悅動教育屋
2026-06-13 08:11:39
2026-06-13 14:23:00
硬嘮intalk incentive-icons
硬嘮intalk
聊點硬的,嘮點橫的
22文章數 1關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

美國4比1大勝 美國主導比賽巴拉圭疲于奔命讓人意外

頭條要聞

美國4比1大勝 美國主導比賽巴拉圭疲于奔命讓人意外

體育要聞

東道主三戰不敗!美墨開門紅加拿大零的突破

娛樂要聞

12年情懷碎一地!跑男接連翻車

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

2026重慶車展 長城炮Hi4-T正式上市售14.98萬起

態度原創

數碼
游戲
時尚
教育
房產

數碼要聞

619元!飛利浦發布27E2N1500LS顯示器:低藍光與Easy Read模式 適配辦公護眼場景

2.5D動作肉鴿《墨西哥忍者》Demo即將上線

參加高考被吐槽“耍大牌”,她真的有錯嗎?

教育要聞

“連天氣都這么配合,肯定能發揮好!”2026成都中考今日開考

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

無障礙瀏覽 進入關懷版