網易首頁 > 網易號 > 正文申請入駐

Loop世界模型論文登頂Hugging Face，來自中國一家初創

2026-07-01 15:26:45　來源: 量子位

河北舉報

分享至

允中發自凹非寺
量子位 | 公眾號 QbitAI

Prompt還沒退場，Loop已經開始接管AI敘事。

這兩周，硅谷開發者圈最熱的詞之一，是Loop Engineering

它講的是一件很“Agent時代”的事：別再手動一輪輪prompt模型了，去設計一個循環系統，讓AI自己執行、檢查、修正、繼續跑，直到任務完成。

傳統模式以prompt為核心，現在開始轉向以工作流為核心，這也是它突然爆紅的原因。

而就在大家熱議“怎么讓AI自己跑起來”時，另一條更硬的線也在快速升溫：Looped World Models（循環世界模型），簡稱LoopWM

如果說Loop Engineering解決的是“AI怎么持續干活”，那LoopWM更像是在回答一個上限更高的問題：

AI在持續干活時，能不能做到持續理解、修正、推演它所面對的世界。

這也是為什么，它雖然名字里也有“Loop”，但其展現出的技術含金量和想象空間，明顯不是一個量級。

它登上了Hugging Face Papers當日Top1，現已進入了AI社區更廣泛的公共討論。

Loop Engineering為什么突然火了

Loop Engineering為什么會火，其實很好理解。

因為單次對話適合問答，不適合復雜任務。

真要讓AI去寫代碼、調試、調工具、看結果、修bug、再驗證，它必須進入一個“行動—觀察—推理—繼續行動”的閉環。

換句話說，AI不再只是“答你一句”，而是開始“圍繞目標持續推進”

這正是今天Agent熱的底層邏輯之一。

Google Chrome工程負責人Addy Osmani，引用過一個挺直白的判斷：

你不該再親自prompt agent，而該去設計那個prompt agent的loop。

在這套敘事里，人從“親自操作模型的人”，變成“設計自動化系統的人”

這也是Loop Engineering特別像硅谷熱詞的地方：它不是一個技巧，是一次身份遷移。

人從提示者，變成了系統設計者。

但問題也隨之出現。會循環，不等于會理解。

一個Agent可以不斷調接口、讀日志、改參數、反復試錯，但如果它對環境狀態、動態變化、因果關系沒有更穩定的建模能力，它仍然更像一個“更勤奮的自動執行器”，而不是真正具備世界理解能力的系統。

也正因此，LoopWM才顯得格外關鍵和重要，它是在重寫“AI如何反復推演世界”

這件事，被一家中國叫臉譜心智的初創公司做了

接下來，讓我們深扒一下是誰做了這件事：

論文作者FaceMind Research Asia（臉譜心智），是這篇文章的通訊機構。

據了解，公司已完成數千萬元Pre-A輪融資，投資方為星連資本，老股東360超額跟投，陸奇的奇績創壇也參股了。

公司由95后博士陸弘遠韋怡然創立，團隊早期從端側全模態模型切入，隨后將重心轉向更底層的世界模型研究。

相比只會生成內容的大模型，世界模型更強調對環境、界面與任務過程的持續理解和預測，這也被視為AI走向GUI Agent、具身智能與機器人場景的重要基礎。

圍繞這一方向，臉譜心智正通過循環迭代、參數高效的模型架構，提升模型在長時序預測、屏幕理解和具身任務中的穩定性，并已在仿真具身環境、GUI Agent環境和真機機械臂環境中展開驗證。

一家年輕公司，正在試著把“理解世界”這件事，做成下一代AI基礎設施的一部分。

對此，星連資本合伙人李文玨表示，臉譜心智團隊最突出的特點，是兼具扎實的研究能力和復雜工程落地能力

團隊核心成員長期深耕人工智能底層技術，既能對前沿方向形成獨立判斷，也能快速將研究成果放入真實場景中驗證。“我們看好的是一支人才密度高、技術判斷前瞻、執行能力很強的團隊。”

在李文玨看來，陸弘遠身上兼具年輕研究者的探索欲和創業者的行動力，能夠帶領團隊持續挑戰高難度問題，并將技術判斷轉化為明確的研發方向。

△臉譜心智Founder陸弘遠

這種創始人特質和團隊凝聚力，是星連資本決定投資的重要原因。

臉譜心智的投資方360集團投前負責人向其奇表示：“陸博士是我見過最頂尖的年輕AI研究者之一。”

在他看來，陸弘遠關注的并非局部優化，而是模型底層原理和架構創新

當行業還在討論世界模型概念時，臉譜心智已經從零訓練世界模型，并在多種benchmarking上得到了行業SOTA級別成果。

此后，陸弘遠提出的Adam’s Law受到海外頭部模型廠商Anthropic的關注和驗證，團隊最新提出的Loop循環架構則進一步探索世界模型長時序訓練問題。

“迭代速度驚人。每次溝通前，我都會先去看他們最新發布的論文和技術報告。”向其奇感慨，從他們身上真正體會到了什么叫做“一次投資，終生學習”。

關于為什么是一家中國的初創公司能做出這樣一項工作，陸弘遠回答：

中國現在是一個高密度AI人才的國家，這是我們能做出一篇劃時代的世界模型工作的主要原因之一。

FaceMind未來也會被更多的國際視野所捕捉，就像他們的工作前幾周剛剛在X上被Anthropic/Facebook的投資人Accel點贊了。

論文到底做了什么？

說得直白一點，LoopWM干的事是：

不再讓模型一次前向傳播就把世界狀態“猜完”，而是讓它通過共享參數的Transformer模塊，對潛在環境狀態做反復迭代細化。

這背后有個很實際的矛盾。

要做高質量、長時程的環境模擬，計算必須足夠深；但模型一旦做深，參數量和推理成本就會一起飆升。

而且rollout越長，誤差越容易層層累積，最后把整個模擬拖垮。

論文里的原話是：

faithful long-horizon simulation demands deep computation, but deeper models are expensive to deploy and prone to compounding errors。（高保真的長時程模擬需要深度計算，但模型越深，部署代價越高，誤差累積的風險也隨之上升。）

LoopWM的思路是，把“深度”從一次性堆疊，改成循環式復用

它不用每加深一點能力就新增一大堆參數，而是通過共享參數的transformer block，對同一個latent state（潛空間表示）反復做refinement（細化）。

簡單場景少跑幾輪，復雜場景多跑幾輪，計算深度開始跟隨任務復雜度動態變化。

論文把這件事概括成一條新的scaling axis（擴展維度）：iterative latent depth（迭代潛空間深度），獨立于模型規模和訓練數據之外。

世界模型變強，以后未必只能靠“更大”，也可以靠“更會反復想”

數字是最有說服力的部分。論文給出的結論包括：

參數效率最高可實現100×提升
對于簡單狀態轉移，單步推理FLOPs可減少約25×
在長時程rollout中，整體計算節省最高可達兩個數量級

這些都不是“說法上的優化”，而是直接指向部署成本、推理效率和長程穩定性的核心指標。

根據論文報告，在ScienceWorld基準測試上，LoopWM能在world modelling垂類任務上，比肩參數量高出兩個數量級的更大模型。

這意味著它不是“用更大的模型贏了”，而是用更聰明的計算方式贏了部分關鍵任務

這不只是Agent升級，是AI認知層在換擋

AI社區里有一種正在變清晰的焦慮：

光會說話不夠，光會調工具也不夠，真正難的是在長鏈路、動態環境、復雜反饋里，維持穩定的推演能力

Loop Engineering對此給出的答案是閉環，讓AI能自己推進。

LoopWM走得更遠一步：給AI一套機制，讓它在推進過程中對世界狀態進行反復、穩定、按需的計算

X上關于LoopWM的討論，也從側面說明了這件事的分量

社區的注意力沒有停在“100×參數效率”這個口號上，而是落在幾個更本質的技術詞匯：

shared transformer block（共享Transformer模塊）、adaptive compute（自適應計算）、spectral stability（譜穩定性）、deferred decoding（延遲解碼）、iterative latent depth（迭代潛空間深度）……

這些詞背后指向同一個判斷：世界模型可能終于找到了一條比“繼續堆參數”更優雅的進化路徑

過去一年，Agent最大的變化，是讓AI從“回答工具”變成“執行工具”。

LoopWM指向的變化，則更進一步，是從“執行系統”往“世界建模系統”邁一步。

前者解決效率問題：怎么少點人工、多點自動化。

后者解決的是上限問題：

當AI真正進入機器人、仿真訓練、空間交互這類復雜環境，它靠什么維持對世界的連續理解。

李飛飛談到空間智能時說，今天的大語言模型擅長處理語言，卻缺乏對物理世界真正扎根的理解；而世界模型，正是通向這種空間與物理理解的重要基礎設施。

LoopWM的意義就在這條線上：它把Loop這個原本屬于Agent工作流的概念，第一次明確推進到了world model本體里，換的是一套增長邏輯，不是修修補補。

硅谷先聊熱的是Loop Engineering——貼近開發者體驗，也更符合“讓AI自己跑起來”的敘事。

但把時間拉長，真正值得反復看的，可能反而是Looped World Models這類工作。

因為它試圖回答的是，AI在自動運行中，能不能真正理解世界。這一點決定了系統明天能不能長大。

Prompt Engineering定義了AI如何回應人，Loop Engineering定義了AI如何持續做事，而Looped World Models定義的，可能是AI如何在做事時真正理解世界

論文鏈接：https://arxiv.org/abs/2606.18208

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.