![]()
全文約 4448 字
預計閱讀 12 分鐘
Context engineering、harness engineering、environment engineering……AI 圈,概念的更新速度多少有些「通詞膨脹」了。
回憶一下這令人眩暈的加速度吧:
2022 年底 ChatGPT 發布至 2024 年,我們研究的都還是 prompt engineering,四處探尋那句能「點石成金」的咒語,通過優化每次的指令來獲得更好的模型輸出。
2025 年 6 月,Shopify CEO Tobi Lütke 提出 context engineering,并得到 Andrej Karpathy 的贊同,為模型提供任務所需的恰到好處的上下文信息,開始成為新的焦點。
五個月后,Anthropic 在報告《Effective harnesses for long-running agents》中帶來了 harness 的概念,通過上下文管理、工具調用、進程管理等方法提升 agent 的運行時間和成功率。八個月后,今年 2 月,HashiCorp 聯合創始人 Mitchell Hashimoto 提出了 harness engineering 的概念,OpenAI 和 Anthropic 都緊接著發布了各自在 harness 方面的研究進展和實驗報告,harness engineering 成為了 agent 圈的新共識。
當本土開發者還在熱切地討論 harness engineering 時,沒出一個月,硅谷已經傳來一種截然不同的聲音——「Harness 將死,未來屬于 environment engineering。」
Weilun Chen 指出,底層大模型正在以 API 的形式瘋狂吞噬掉開發者熬夜寫出的編排邏輯;同時,以 Anthropic MCP 和 Claude Code 為代表的實踐證明:只要把系統的「環境接口」重寫成對 Agent 友好的結構化形態,模型根本不需要復雜的 harness 就能展現出驚人的能力。
這些不斷被制造出來的新詞匯和新概念,核心是在探討一個更根本的問題:在這個 AI Native 時代,一家新興公司的價值應該如何構建?能做的事有很多,關鍵的是該做什么?所謂「該做」,就是有長期價值、能形成壁壘,甚至具有未來價值擴展性的事。
雖然這些概念的快速變化搞得人很煩,但嘗試理解和構建一種未來的「世界觀」確實是有意義的。「世界觀」決定了寶貴的資源——創始人的時間、團隊的精力、投資人的資本——會被投向何方。
所以,咱們嘗試花一些時間把它梳理清楚些。
正在發生的未來,與一個危險的錯覺
對 Harness 的唱衰,并非空穴來風。
向下看,底層模型正在無情地「基建化」。
此前,開發者需要寫幾百行代碼來實現重試機制、JSON 格式約束、長文本的上下文壓縮。而今天,OpenAI 的結構化輸出、上下文緩存、原生工具調用甚至推理長度控制,直接把這些復雜的機制變成了 API 請求里的幾個參數。
那些僅僅封裝了「Prompt 鏈」和「基礎執行循環」的套殼框架,確實正在被底層模型無情地降維打擊。
向上看,environment engineering 展現出了可觀的杠桿率。
Anthropic 的一個實驗證明了這一點:他們將 Claude 放在一個高度結構化的數字環境里,提供有限且被清晰定義的 API 工具。結果發現,在一個友好的環境中,agent 的表現遠超在真實終端的混亂環境中的發揮。這揭示了,很多時候,agent 表現不佳,并非「腦子」不夠好,而是「世界」太難懂。重塑環境接口(修路)的收益,看上去大于打磨駕馭工程(訓練司機)。
如果推演到此為止,得出的結論就會是:擁抱模型廠 API,放棄自研控制層,轉去做環境工程的建設。
但harness engineering 真的沒有長期價值嗎?
概率系統與確定性商業的矛盾
將 harness engineering 類比為「終將被吞掉的中間件」,對了一部分。但如果因此推導出現實的商業世界只需要「模型 API + 環境」,則是極其危險的技術線性外推。它忽略了大模型時代最根本的工程悖論:
大語言模型本質上是一個基于概率的非確定性系統,而真實的商業世界要求的卻是確定性結果。
企業需要可觀測性,需要知道某個 agent 為什么做了這個決策,它的推理軌跡能否被完整回溯審計,需要成本與路由網關,需要把握如何在幾十個模型間動態路由,保證既聰明又省錢。需要系統級容錯,當 API 不穩定或產生幻覺時,系統能夠進行確定性的干預并閉環。
這些商業世界的鐵律,注定了harness 的本質從來不是「封裝邏輯的中間件」,而是復雜系統的「控制平面」與「策略層」。
API可以吞噬「機制」,但替代不了「策略」。
API 可以包攬工具該怎么調用、記憶格式該怎么存儲、基礎推理與行動循環怎么跑。但 API 無法決定: 什么時候該觸發降級方案、如何在有限的 Token 預算下動態切分任務、多個不同能力的 Agent 發生決策沖突時該聽誰的、以及如何保證輸出結果符合特定行業的合規性。
在概率與確定性的鴻溝之間,harness 不僅是 agent 的方向盤,更是防止 AI 系統在商業環境中造成災難的「安全氣囊與剎車」。
環境工程的「烏托邦邊界」
那么,沿著 environment engineering 一路狂奔,把全世界重構成「agent 友好」的接口,是一門好生意嗎?
在代碼開發、本地文件管理等「天然數字化且高度結構化」的場景中,收益是可觀的。這也是為什么 Coding 是進展最快的原因。
然而,一旦進入傳統商業場景,環境工程就會撞上一堵名為「隱性知識與遺留系統」的嘆息之墻。
企業協作、供應鏈流轉、法律審查中的海量判斷依據,散落在非結構化的郵件、歷史長文本甚至人類專家的直覺中,它們無法被簡單地改寫成完美的 API。
想象一下,讓 AI 優化一家工廠的供應鏈。它需要理解的「環境」可能包括:一套運行了 20 年的、文檔不全的 ERP 系統;幾位老師傅基于「聽機器聲音」判斷故障的經驗;以及分散在無數 Excel 和郵件里的、充滿歧義的訂單備注。將這個混亂的現實「重構」成 AI 友好的 API 接口,其成本和難度是勸退工程師和客戶的。
同時,商業世界具有極強的慣性。大多數企業難以為了讓 agent 跑得更順暢,就輕易重構耗資千萬、運行了十年的核心業務系統。
這意味著,環境工程在商業落地上存在明顯的局限性——它是局部的、垂直的,很難形成統一的標準平臺。絕大多數時候,不是世界去適應 agent,而是 agent 必須學會在充滿噪音、混亂且非結構化的現實泥沼中生存。這會再次將聚光燈拉回到 harness engineering 系統架構能力上。
AI 產業價值階段推演
如果 harness 的價值不會清零,環境工程極具價值也有挑戰和局限,那么 AI 創業公司應該如何看待產業的演進,并找到自己的位置?價值鏈的重構可能會分三個階段上演。
第一階段:模型為王(2023-2025)
這是 AI 的「蠻荒時代」。每次模型的 SOTA 直接定義了 AI 能力的天花板。
在這個階段,價值公式極為簡單:
AI 應用能力 ≈ 模型能力
OpenAI、Anthropic 等模型廠手握最核心的生產資料,擁有最高的行業話語權。每次模型更新就會抹平一大片應用層的探索和建設。
第二階段:Harness 為王(2025-2028,大幕方啟)
我們正處在這一階段的初期。隨著基礎模型的能力趨于穩定,業界痛苦地發現:僅靠調用強大的模型API,無法直接構建出達到企業級可用標準的 Agent。任務成功率的瓶頸凸顯,成本和安全問題成為重要卡點。
此時,價值公式演變為:
AI 應用能力 = 模型能力 × Harness 效率
這個乘數效應是驚人的。一個基座模型,在粗糙的腳本驅動下,面對復雜研發任務的成功率可能只有 20%;但在一個為特定任務深度優化的 harness 驅動下,成功率可以躍升至 70% 以上。
此前被扣上「套殼產品」帽子的 Devin、Cursor 和 Manus 這類項目的核心壁壘,正在于那個被看低的「殼」,今天我們所說的 harness engineering。它們不擁有獨家的超級模型,但是構建起了一套 harness 系統,包含了精密的任務規劃與分解、代碼執行與沙箱、持續學習與反思、以及針對性的錯誤修正邏輯。
在這個階段,競爭的焦點會從「誰的模型更強」轉向「誰的控制層更優」。
第三階段:數據與環境為王(2028+,終局之戰)
當模型成為水電煤,各種高階的 Harness 系統也逐漸成熟并趨于標準化后,終極護城河才會成形。屆時,AI 的能力公式將會演進為:
AI 終極能力 = (模型能力 × Harness 效率)(數據 × 環境)
Environment engineering,其實是在提前押注第三階段。最強大的 AI 系統,將是那些能將模型和控制層深度嵌入到真實業務場景中,并重構了環境交互接口的公司。
Agent 在被重構的真實環境中執行任務,會產生獨一無二的交互數據,成功的捷徑、失敗的教訓、人類的微調修正。這些閉環數據反過來不僅可以微調模型,還能夠優化 Harness 的決策邏輯,從而形成一個自我進化的閉環。
例如微軟的 Microsoft 365 Copilot,依托 Office 全場景生態,打通并掌控了個人與企業最核心的業務環境——從 Outlook 郵件、Teams 會話到文檔、表格、會議等全鏈路數據與操作接口。Copilot 底層的 orchestrator,本質就是面向辦公場景的標準化 Harness 系統,在高度結構化的真實環境中調度模型能力,完成總結、撰寫、分析、執行等復雜任務。
用戶每一次采納、修改、反饋,都會形成高價值的閉環數據,持續反哺 orchestrator 策略優化與模型迭代,讓(模型 × Harness)與(數據 × 環境)形成指數級放大的正向循環。這正是第三階段核心競爭力的完整體現。
屆時,擁有海量真實場景和閉環數據流的企業,將擁有指數級優勢。
由此,如果你的團隊還在花大量時間手寫基礎的 prompt、基礎的記憶存儲,就把這些交給模型廠吧。不要在注定會成為基礎設施的地方建名存實亡的壁壘。
Agent 時代的下一場戰役,既不單純屬于逐漸基建化的大模型 API,也不完全屬于理想化的環境接口重構。
當下及未來的 2~3 年,做深特定領域的 Harness 系統架構會是一個有價值的創業切入點。
在云計算時代,AWS 吞掉了很多底層技術,但提供可觀測性的 Datadog 和 Snowflake 依然長成了千億巨頭,因為他們掌握著企業的「運營控制層」。這同樣是 AI 時代的財富密碼。
Environment engineering 是長期目標,而不是短期捷徑。提前布局,但不要幻想能一步到位。今天構建的強大 harness,正是你未來撬動環境改造、構建數據飛輪的唯一杠桿。
可做的事很多,該做什么才是更關鍵的。在新概念的浪潮中形成你自己的原生世界觀,然后,扎進去,把該干的干到最好,可能就是今天最值得做的事情。
![]()
轉載請聯系極客君微信 geekparkGO
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.