允中 發自 凹非寺
量子位 | 公眾號 QbitAI
Prompt還沒退場,Loop已經開始接管AI敘事。
這兩周,硅谷開發者圈最熱的詞之一,是Loop Engineering
它講的是一件很“Agent時代”的事:別再手動一輪輪prompt模型了,去設計一個循環系統,讓AI自己執行、檢查、修正、繼續跑,直到任務完成。
傳統模式以prompt為核心,現在開始轉向以工作流為核心,這也是它突然爆紅的原因。
而就在大家熱議“怎么讓AI自己跑起來”時,另一條更硬的線也在快速升溫:Looped World Models(循環世界模型),簡稱LoopWM
如果說Loop Engineering解決的是“AI怎么持續干活”,那LoopWM更像是在回答一個上限更高的問題:
AI在持續干活時,能不能做到持續理解、修正、推演它所面對的世界。
這也是為什么,它雖然名字里也有“Loop”,但其展現出的技術含金量和想象空間,明顯不是一個量級。
它登上了Hugging Face Papers當日Top1,現已進入了AI社區更廣泛的公共討論。
![]()
Loop Engineering為什么突然火了
Loop Engineering為什么會火,其實很好理解。
因為單次對話適合問答,不適合復雜任務。
真要讓AI去寫代碼、調試、調工具、看結果、修bug、再驗證,它必須進入一個“行動—觀察—推理—繼續行動”的閉環。
換句話說,AI不再只是“答你一句”,而是開始“圍繞目標持續推進”
這正是今天Agent熱的底層邏輯之一。
Google Chrome工程負責人Addy Osmani,引用過一個挺直白的判斷:
你不該再親自prompt agent,而該去設計那個prompt agent的loop。
在這套敘事里,人從“親自操作模型的人”,變成“設計自動化系統的人”
這也是Loop Engineering特別像硅谷熱詞的地方:它不是一個技巧,是一次身份遷移。
人從提示者,變成了系統設計者。
但問題也隨之出現。會循環,不等于會理解。
一個Agent可以不斷調接口、讀日志、改參數、反復試錯,但如果它對環境狀態、動態變化、因果關系沒有更穩定的建模能力,它仍然更像一個“更勤奮的自動執行器”,而不是真正具備世界理解能力的系統。
也正因此,LoopWM才顯得格外關鍵和重要,它是在重寫“AI如何反復推演世界”
這件事,被一家中國叫臉譜心智的初創公司做了
接下來,讓我們深扒一下是誰做了這件事:
論文作者FaceMind Research Asia(臉譜心智),是這篇文章的通訊機構。
![]()
據了解,公司已完成數千萬元Pre-A輪融資,投資方為星連資本,老股東360超額跟投,陸奇的奇績創壇也參股了。
公司由95后博士陸弘遠韋怡然創立,團隊早期從端側全模態模型切入,隨后將重心轉向更底層的世界模型研究。
相比只會生成內容的大模型,世界模型更強調對環境、界面與任務過程的持續理解和預測,這也被視為AI走向GUI Agent、具身智能與機器人場景的重要基礎。
圍繞這一方向,臉譜心智正通過循環迭代、參數高效的模型架構,提升模型在長時序預測、屏幕理解和具身任務中的穩定性,并已在仿真具身環境、GUI Agent環境和真機機械臂環境中展開驗證。
一家年輕公司,正在試著把“理解世界”這件事,做成下一代AI基礎設施的一部分。
對此,星連資本合伙人李文玨表示,臉譜心智團隊最突出的特點,是兼具扎實的研究能力和復雜工程落地能力
團隊核心成員長期深耕人工智能底層技術,既能對前沿方向形成獨立判斷,也能快速將研究成果放入真實場景中驗證。“我們看好的是一支人才密度高、技術判斷前瞻、執行能力很強的團隊。”
在李文玨看來,陸弘遠身上兼具年輕研究者的探索欲和創業者的行動力,能夠帶領團隊持續挑戰高難度問題,并將技術判斷轉化為明確的研發方向。
![]()
△臉譜心智Founder陸弘遠
這種創始人特質和團隊凝聚力,是星連資本決定投資的重要原因。
臉譜心智的投資方360集團投前負責人向其奇表示:“陸博士是我見過最頂尖的年輕AI研究者之一。”
在他看來,陸弘遠關注的并非局部優化,而是模型底層原理和架構創新
當行業還在討論世界模型概念時,臉譜心智已經從零訓練世界模型,并在多種benchmarking上得到了行業SOTA級別成果。
此后,陸弘遠提出的Adam’s Law受到海外頭部模型廠商Anthropic的關注和驗證,團隊最新提出的Loop循環架構則進一步探索世界模型長時序訓練問題。
![]()
“迭代速度驚人。每次溝通前,我都會先去看他們最新發布的論文和技術報告。”向其奇感慨,從他們身上真正體會到了什么叫做“一次投資,終生學習”。
關于為什么是一家中國的初創公司能做出這樣一項工作,陸弘遠回答:
中國現在是一個高密度AI人才的國家,這是我們能做出一篇劃時代的世界模型工作的主要原因之一。
FaceMind未來也會被更多的國際視野所捕捉,就像他們的工作前幾周剛剛在X上被Anthropic/Facebook的投資人Accel點贊了。
論文到底做了什么?
說得直白一點,LoopWM干的事是:
不再讓模型一次前向傳播就把世界狀態“猜完”,而是讓它通過共享參數的Transformer模塊,對潛在環境狀態做反復迭代細化。
![]()
這背后有個很實際的矛盾。
要做高質量、長時程的環境模擬,計算必須足夠深;但模型一旦做深,參數量和推理成本就會一起飆升。
而且rollout越長,誤差越容易層層累積,最后把整個模擬拖垮。
論文里的原話是:
faithful long-horizon simulation demands deep computation, but deeper models are expensive to deploy and prone to compounding errors。(高保真的長時程模擬需要深度計算,但模型越深,部署代價越高,誤差累積的風險也隨之上升。)
LoopWM的思路是,把“深度”從一次性堆疊,改成循環式復用
它不用每加深一點能力就新增一大堆參數,而是通過共享參數的transformer block,對同一個latent state(潛空間表示)反復做refinement(細化)。
簡單場景少跑幾輪,復雜場景多跑幾輪,計算深度開始跟隨任務復雜度動態變化。
論文把這件事概括成一條新的scaling axis(擴展維度):iterative latent depth(迭代潛空間深度),獨立于模型規模和訓練數據之外。
世界模型變強,以后未必只能靠“更大”,也可以靠“更會反復想”
數字是最有說服力的部分。論文給出的結論包括:
- 參數效率最高可實現100×提升
- 對于簡單狀態轉移,單步推理FLOPs可減少約25×
- 在長時程rollout中,整體計算節省最高可達兩個數量級
這些都不是“說法上的優化”,而是直接指向部署成本、推理效率和長程穩定性的核心指標。
根據論文報告,在ScienceWorld基準測試上,LoopWM能在world modelling垂類任務上,比肩參數量高出兩個數量級的更大模型。
這意味著它不是“用更大的模型贏了”,而是用更聰明的計算方式贏了部分關鍵任務
這不只是Agent升級,是AI認知層在換擋
AI社區里有一種正在變清晰的焦慮:
光會說話不夠,光會調工具也不夠,真正難的是在長鏈路、動態環境、復雜反饋里,維持穩定的推演能力
Loop Engineering對此給出的答案是閉環,讓AI能自己推進。
LoopWM走得更遠一步:給AI一套機制,讓它在推進過程中對世界狀態進行反復、穩定、按需的計算
X上關于LoopWM的討論,也從側面說明了這件事的分量
社區的注意力沒有停在“100×參數效率”這個口號上,而是落在幾個更本質的技術詞匯:
shared transformer block(共享Transformer模塊)、adaptive compute(自適應計算)、spectral stability(譜穩定性)、deferred decoding(延遲解碼)、iterative latent depth(迭代潛空間深度)……
這些詞背后指向同一個判斷:世界模型可能終于找到了一條比“繼續堆參數”更優雅的進化路徑
過去一年,Agent最大的變化,是讓AI從“回答工具”變成“執行工具”。
LoopWM指向的變化,則更進一步,是從“執行系統”往“世界建模系統”邁一步。
前者解決效率問題:怎么少點人工、多點自動化。
后者解決的是上限問題:
當AI真正進入機器人、仿真訓練、空間交互這類復雜環境,它靠什么維持對世界的連續理解。
李飛飛談到空間智能時說,今天的大語言模型擅長處理語言,卻缺乏對物理世界真正扎根的理解;而世界模型,正是通向這種空間與物理理解的重要基礎設施。
LoopWM的意義就在這條線上:它把Loop這個原本屬于Agent工作流的概念,第一次明確推進到了world model本體里,換的是一套增長邏輯,不是修修補補。
硅谷先聊熱的是Loop Engineering——貼近開發者體驗,也更符合“讓AI自己跑起來”的敘事。
但把時間拉長,真正值得反復看的,可能反而是Looped World Models這類工作。
因為它試圖回答的是,AI在自動運行中,能不能真正理解世界。這一點決定了系統明天能不能長大。
Prompt Engineering定義了AI如何回應人,Loop Engineering定義了AI如何持續做事,而Looped World Models定義的,可能是AI如何在做事時真正理解世界
論文鏈接:https://arxiv.org/abs/2606.18208
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.