无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

陳天橋發布新模型：靠“縮放”挑戰AI幻覺

2026-03-13 15:32:05　來源: 硬嘮intalk

北京舉報

0

分享至

硬嘮編輯部原創

圖片

2026年3月12日。在全行業競逐“極速響應”和“毫秒級端到端交互”的浪潮中。陳天橋在社交媒體上發布了一個產品。那是一個極其“緩慢”的 AI 代理：MiroThinker-1.7。

這個被定位為“深度研究”的模型，在面對一個復雜的金融預測請求時，并沒有秒回答案。在用戶端的交互界面上，它保持了長達三分鐘的“思考”狀態。

在這三分鐘里，系統后臺跳動的數據顯示，它完成了 342 次工具調用。

這是一個足以讓產品經理感到焦慮的數字。在通行的 AI 產品邏輯中，過多的工具調用意味著冗余、成本失控和用戶流失。

但當進度條走完，屏幕上彈出的 BrowseComp 基準測試分數為 88.2。這個數字刷新了期在該榜單的記錄。

表象：重回“慢時代”

圖片

“Conversation is easy for AI. Solving real problems is not.” ——陳天橋（2026年3月12日，社交平臺）

大多數人對 AI 的認知停留在“對話”層面。只要能流暢地接話，就被認為具備了智慧。但在 MiroThinker 的邏輯里，這種流暢往往是幻覺的溫床。

它被設計成一個“慢思考者”。它寧愿在后臺進行數百次的反復檢索、代碼運行和自我驗證。它絕不允許給出一個未經證實的直接推論。

在 MiroMind 的研發日記中，這種特性被稱為“交互縮放（Interactive Scaling）”。它將 AI 的性能提升從單純的參數堆砌，轉向了對交互深度的極致壓榨。

在 MiroThinker 發布之前，AI 工業界的信條一直是：大就是好。從 2023 年到 2025 年，主流廠商的選擇是不斷增加模型參數。人們相信，只要 AI 一次性“記住”足夠長的資料，智能就會涌現。

第一層真相：研究員的“縮放”

但陳天橋解剖出的真相是：單純的“記憶”和“容量”正在觸碰邊際效應。 MiroThinker 的技術白皮書里提出了一個反直覺的公式。

性能 ∝ 交互深度 × 驗證頻率。

這就是交互縮放。如果把傳統大模型比作一個博聞強識但從不下地的“狀元”。那么 MiroThinker 更像是一個在實驗室里不斷動手操作、失敗后再調整的“研究員”。

它并不試圖在 256K 的窗口里塞進整個互聯網。而是利用有限的空間，記錄下每一次“行動”與“觀察”的反饋循環。技術細節顯示，MiroThinker-1.7-mini 僅擁有 30B 的參數量。

在 2026 年，這個體量甚至不足以進入大模型的第一梯隊。但在處理需要長鏈條推理的任務時，它通過多達數百次的工具調用跑贏了對手。它不斷地去搜索引擎驗證、去跑代碼、對比信源。

它最終贏過了那些參數量是它十倍以上的“巨無霸”模型。這意味著，AI 的進化邏輯正在發生質變。搜索不再只是為了尋找答案，而是成為了推理過程的一部分。

第二層真相：驗證優于生成

如果說“交互縮放”給了 AI 動手的機會。那么“驗證中心架構”則是給它裝上了一雙審視自己的眼睛。在解剖運作機制時，最令人意外的發現是它的“記憶管理”。

在處理超長鏈條推理時，傳統的 AI 往往會產生“記憶漂移”。這最終會導致邏輯崩塌。 MiroThinker 采取了一種近乎冷酷的過濾策略。

在它 256K 的有限窗口里，它被訓練去保留所有的思維鏈（Chain of Thought）。但它會果斷地丟棄絕大部分工具返回的原始結果。

系統只保留最近的 5 步核心工具輸出。

這意味著，AI 不再試圖背下整個搜索結果。它只記住“經過驗證的結論”和“被排除的假設”。這種機制在內部被稱為“結構化內存（Structured Memory）”。

它將上下文分為三層：局部上下文、跨步上下文、全局上下文。為了保證每一步的正確性，內部還運行著一個獨立邏輯審核員。這個組件名為 ChainChecker。

它不負責尋找答案，只負責糾錯。它會檢測 AI 是否在“編造”代碼修復。或者是否在搜索過程中被某個網頁的錯誤信息誤導。

這種設計揭示了陳天橋對 AGI 的核心觀點。智能不等于生成（Generation），智能等同于驗證（Verification）。這種“驗證優先”的邏輯，讓模型在面對虛假信息或復雜數據時具備了免疫力。

它更像是一個經驗老到的刑警。在數百條線索中反復穿插、對質。直到拼湊出唯一經得起推敲的真相。

最終邏輯：陳天橋的執念

圖片

從盛大退隱后，陳天橋向天橋腦科學研究院（TCCI）投入了數十億美元。這種對“大腦如何產生意識”的近乎執著的探索，找到了出口。 MiroThinker 與其他 Agent 最大的不同在于它對“主體性”的強調。

““AI 離真正的 Agent 還差一個‘主體意識’，它們只有計算邏輯，沒有責任身份。” ——陳天橋（2025年9月）

在陳天橋看來，如果 AI 只是在進行統計學上的概率模擬，就無法產生科研突破。科研需要的是“主體意識”。即研究者在面對失敗時，能夠基于過往記憶調整策略。

在面對海量噪音時，能夠堅守最初的目標。這解釋了為什么 MiroThinker 如此癡迷于“驗證”。驗證不是為了讓回答更漂亮，而是為了讓 AI 擁有“對自己行為負責”的能力。

在內部測試中，被賦予了“長期研究員”身份的 AI 表現出了類似人類專家的韌性。這不再是一場關于大模型參數的軍備競賽。而是一場關于“硅基主體”的進化實驗。

陳天橋并沒有回歸互聯網。他只是把當年的《傳奇》戰場，搬到了人類最深邃的思維迷宮之中。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

00后小孩哥10天AI編程，陳天橋24小時砸3000萬！靠大四作業當上CEO

36氪 2026-03-08 17:24:08
26 跟貼 26
Transformer解決計算問題？人大團隊指出上限取決于上下文管理

機器之心Pro 2026-06-12 12:58:06
0 跟貼 0

谷歌創始人承認：入場代碼編程晚了，但押注AI的自我改進飛輪

DeepTech深科技 2026-06-13 13:25:10
0 跟貼 0

當Agent大規模落地，IT部門將成為下一個HR部門？

虎嗅APP 2026-06-12 21:00:12
1 跟貼 1
入圍CVPR 2026最佳論文決選，ViT3突破Transformer復雜度瓶頸

機器之心Pro 2026-06-12 17:09:54
0 跟貼 0

當「龍蝦」走進編輯部，媒體工作流如何被AI重構？

36氪 2026-05-29 14:36:54
0 跟貼 0

智源黃鐵軍：人類與AI就是父母與孩子的關系

經濟觀察報 2026-06-13 13:11:03
0 跟貼 0
Anthropic 5.2萬人調查大曝光！美國人對AI已達成共識

新智元 2026-06-13 12:33:36
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
“AI領域最被濫用的術語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0
剛剛，GPT-5.5被中國純血AI反超了！

新智元 2026-06-13 12:32:52
0 跟貼 0
代碼面試正在被行為面取代？2026技術招聘的信號斷裂

我是一個養蝦人 2026-06-13 02:01:27
0 跟貼 0
惡臭!上海一別墅區傳出高頻尖叫,居民不堪其擾

看看新聞Knews 2026-06-12 22:37:03
9413 跟貼 9413
領導讓你提一杯，你該怎么說？高段位敬酒萬能公式

全嘻嘻 2026-06-12 18:00:00
13 跟貼 13
Agent OS來了！鴻蒙HarmonyOS 7發布，華為重新定義OS

雷科技 2026-06-13 00:05:33
5 跟貼 5
張家輝的胡楓演唱會后臺花絮：當你上臺前少少緊張，同事們都來鼓勵你是什么體驗？

觀象視頻 2026-06-09 10:22:49
70 跟貼 70
大廠Token不再“管夠”：騰訊開始限額，字節可部分報銷

經濟觀察報 2026-06-13 12:39:27
0 跟貼 0
師傅在河里打撈廢鐵，結果吸到了鋼架構柱子上，技術不到位

鳥姐談笑 2026-06-12 09:53:41
0 跟貼 0
AI自己寫代碼，訓出1B端側「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
我花了一下午玩這個把股票曲線變越野賽道的網頁游戲

菜但癮大第一名 2026-06-13 09:38:14
0 跟貼 0
竇文濤對談：想瘦？真正瘦下來的底層邏輯不是少睡！

小腦袋鍋 2026-06-13 09:50:50
0 跟貼 0
全網后臺最硬的狗子，養了三個娃不是燙頭就是紋身，沒一個省心的

通勤崩潰觀察員 2026-06-12 13:49:32
0 跟貼 0
英語的東拼西湊 vs 漢語的嚴謹邏輯：外國博主狂贊中文的先進性

狂戰獠牙 2026-06-13 05:56:57
0 跟貼 0
美國4比1大勝美國主導比賽巴拉圭疲于奔命讓人意外

澎湃新聞 2026-06-13 11:06:27
0 跟貼 0
《置身釘內》深度解剖：三個核心概念揭開釘釘的底層基因

數碼科技測評 2026-06-12 08:38:05
0 跟貼 0
加拿大開幕式充氣的大世界杯模型沒100%撐起來，然后就萎了！

臺海大林 2026-06-13 07:48:16
94 跟貼 94
質疑小米，理解小米，最終成為小米！

新浪財經 2026-06-12 04:44:57
26 跟貼 26
嘴上踩死美國，桌上主動讓步：伊朗的矛盾，從來不止對手太強

斯德哥爾摩的帕金森 2026-06-13 11:22:36
1 跟貼 1
AI定義汽車：AIVA的造車邏輯革命丨甲子光年

甲子光年 2026-06-13 13:03:19
0 跟貼 0
小獵豹被拋棄后，一直被狗狗保護，長大后成最硬后臺

羊羊動物圈 2026-06-11 16:40:11
2 跟貼 2
買了個汽車模型，居然有40邁的速度，這時候多么希望它變大！

能把人笑沒社 2026-06-12 16:03:33
1 跟貼 1
夏天冰淇淋萬能公式五分鐘搞定4種口味冰淇淋

叫我土豆包呀 2026-06-12 13:44:08
1 跟貼 1
冠軍之選！零跑官宣WSBK車手瓦倫丁·德比斯成為Lafa5歐洲首位車主

大象新聞 2026-06-12 18:09:02
227 跟貼 227
公開征求意見！廣州擬繼續在全市所有道路禁止機動車鳴喇叭

南方都市報 2026-06-12 19:04:34
401 跟貼 401
定了 | 天津市中心這塊地盤活！最新公示！

天津廣播 2026-06-13 11:23:36
4 跟貼 4
“張雪機車”獲得WSBK艾米利亞-羅馬涅站桿位賽第三名

極目新聞 2026-06-12 23:00:07
265 跟貼 265
日媒：韓國決定申請加入CPTPP

參考消息 2026-06-13 12:18:28
3 跟貼 3
水果店員工用嘴給水果噴水？高校通報：屬實，店鋪已關停！

上觀新聞 2026-06-12 21:14:48
1334 跟貼 1334
寶馬7系用車體驗在商場買到喜歡的機甲模型體驗后排的舒享功能

SuperStreet超級街 2026-06-09 09:15:13
0 跟貼 0

阿奴諾比升FMVP榜首！或復刻伊戈達拉模式皮爾斯：直接給他頒獎

阿奴諾比升FMVP榜首！或復刻伊戈達拉模式皮爾斯：直接給他頒獎

醉臥浮生

2026-06-13 06:20:14

“鵝腿阿姨”塌房：CBD不相信人設

“鵝腿阿姨”塌房：CBD不相信人設

一刻talks丨硬科技趣思想

2026-06-12 21:00:47

妻子出軌，丈夫將15公分蠟燭塞進妻子的陰道內

妻子出軌，丈夫將15公分蠟燭塞進妻子的陰道內

胖胖侃咖

2025-04-13 08:00:08

“衩都開到大腿根了，不怕丟人嗎？”高三家長旗袍送考，反被群嘲

“衩都開到大腿根了，不怕丟人嗎？”高三家長旗袍送考，反被群嘲

怪味歷史連連看

2026-06-10 17:37:26

香珀特說“那根本不算蓋帽”：為福克斯發聲，裁判報告卻另有說法

香珀特說“那根本不算蓋帽”：為福克斯發聲，裁判報告卻另有說法

綠茵狂熱者

2026-06-13 00:50:48

醫生總問“有沒有性生活”？根本不是查隱私！很多人都誤解

醫生總問“有沒有性生活”？根本不是查隱私！很多人都誤解

太極本草

2026-06-07 13:19:18

1943 年主將拒交兵權，拒不赴延安進修，還加害接任將領

1943 年主將拒交兵權，拒不赴延安進修，還加害接任將領

嘮叨說歷史

2026-05-25 11:46:11

劉家成執掌北控大權，敲定首筆交易，王少杰買斷加盟廣東成定局！

劉家成執掌北控大權，敲定首筆交易，王少杰買斷加盟廣東成定局！

體育見習官

2026-06-13 11:24:31

伊朗用中國導彈擊落美國F-15戰機，引發美中關系動蕩，深度分析

伊朗用中國導彈擊落美國F-15戰機，引發美中關系動蕩，深度分析

黑鷹觀軍事

2026-06-12 16:10:40

在韓國上班的華人感慨：不要信媒體，韓國已經相當于我國二線城市

在韓國上班的華人感慨：不要信媒體，韓國已經相當于我國二線城市

商業財經風向

2026-06-13 12:06:38

證監會：全面推進實施新一輪資本市場改革開放

證監會：全面推進實施新一輪資本市場改革開放

新浪財經

2026-06-13 08:05:21

高考后2天花光母親2萬元的女生被網暴，真的值得同情嗎？

高考后2天花光母親2萬元的女生被網暴，真的值得同情嗎？

燈錦年

2026-06-13 13:41:02

陪睡只是入門！認干爹、舔手指，背地里的陰暗面完全藏不住了...

陪睡只是入門！認干爹、舔手指，背地里的陰暗面完全藏不住了...

芳華青年

2026-05-18 13:07:54

黃金跌了價，2026年6月13日，中國黃金新價格、人民幣黃金新價格

黃金跌了價，2026年6月13日，中國黃金新價格、人民幣黃金新價格

說故事的阿襲

2026-06-13 08:21:02

中方通告全球，不許配合美封殺華為芯片，黃仁勛：美國已經失敗

中方通告全球，不許配合美封殺華為芯片，黃仁勛：美國已經失敗

可樂愛微笑

2026-06-12 19:14:13

阿里高層這次真的生氣了

一見財經

2026-06-12 11:11:21

71年，高崗妻子特意申請去圖書館工作，毛主席拒絕：必須教育部

71年，高崗妻子特意申請去圖書館工作，毛主席拒絕：必須教育部

歷史龍元閣

2026-06-13 08:10:27

正式確定！內線新星離開廣東宏遠，加入遼寧男籃

正式確定！內線新星離開廣東宏遠，加入遼寧男籃

體壇瞎白話

2026-06-13 07:38:22

悲痛！甘肅一特警大隊長執行任務過程中不幸因公犧牲，年僅44歲

悲痛！甘肅一特警大隊長執行任務過程中不幸因公犧牲，年僅44歲

紅星新聞

2026-06-12 23:41:10

高考中出現的“神仙卷面”，閱卷老師都不忍扣分，值得大家學習！

高考中出現的“神仙卷面”，閱卷老師都不忍扣分，值得大家學習！

悅動教育屋

2026-06-13 08:11:39

聊點硬的，嘮點橫的

22文章數 1關注度

往期回顧全部

科技要聞

SpaceX上市首日破2萬億美元，馬斯克再封神

頭條要聞

美國4比1大勝美國主導比賽巴拉圭疲于奔命讓人意外

頭條要聞

美國4比1大勝美國主導比賽巴拉圭疲于奔命讓人意外

體育要聞

東道主三戰不敗！美墨開門紅加拿大零的突破

娛樂要聞

12年情懷碎一地！跑男接連翻車

財經要聞

梁文鋒向左，楊植麟向右

汽車要聞

2026重慶車展長城炮Hi4-T正式上市售14.98萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

游戲

時尚

教育

房產

數碼要聞

619元！飛利浦發布27E2N1500LS顯示器：低藍光與Easy Read模式適配辦公護眼場景

2.5D動作肉鴿《墨西哥忍者》Demo即將上線

參加高考被吐槽“耍大牌”，她真的有錯嗎？

教育要聞

“連天氣都這么配合，肯定能發揮好！”2026成都中考今日開考

房產要聞

海南最賺錢行業曝光！最快4年半，海口全款買三房！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版