網易首頁 > 網易號 > 正文申請入駐

Harness 還是 Environment? 這波 Agent 創業還有護城河嗎？

2026-04-01 16:40:39　來源: 張鵬科技商業觀察

北京舉報

分享至

全文約 4448 字

預計閱讀 12 分鐘

Context engineering、harness engineering、environment engineering……AI 圈，概念的更新速度多少有些「通詞膨脹」了。

回憶一下這令人眩暈的加速度吧：

2022 年底 ChatGPT 發布至 2024 年，我們研究的都還是 prompt engineering，四處探尋那句能「點石成金」的咒語，通過優化每次的指令來獲得更好的模型輸出。

2025 年 6 月，Shopify CEO Tobi Lütke 提出 context engineering，并得到 Andrej Karpathy 的贊同，為模型提供任務所需的恰到好處的上下文信息，開始成為新的焦點。

五個月后，Anthropic 在報告《Effective harnesses for long-running agents》中帶來了 harness 的概念，通過上下文管理、工具調用、進程管理等方法提升 agent 的運行時間和成功率。八個月后，今年 2 月，HashiCorp 聯合創始人 Mitchell Hashimoto 提出了 harness engineering 的概念，OpenAI 和 Anthropic 都緊接著發布了各自在 harness 方面的研究進展和實驗報告，harness engineering 成為了 agent 圈的新共識。

當本土開發者還在熱切地討論 harness engineering 時，沒出一個月，硅谷已經傳來一種截然不同的聲音——「Harness 將死，未來屬于 environment engineering。」

Weilun Chen 指出，底層大模型正在以 API 的形式瘋狂吞噬掉開發者熬夜寫出的編排邏輯；同時，以 Anthropic MCP 和 Claude Code 為代表的實踐證明：只要把系統的「環境接口」重寫成對 Agent 友好的結構化形態，模型根本不需要復雜的 harness 就能展現出驚人的能力。

這些不斷被制造出來的新詞匯和新概念，核心是在探討一個更根本的問題：在這個 AI Native 時代，一家新興公司的價值應該如何構建？能做的事有很多，關鍵的是該做什么？所謂「該做」，就是有長期價值、能形成壁壘，甚至具有未來價值擴展性的事。

雖然這些概念的快速變化搞得人很煩，但嘗試理解和構建一種未來的「世界觀」確實是有意義的。「世界觀」決定了寶貴的資源——創始人的時間、團隊的精力、投資人的資本——會被投向何方。

所以，咱們嘗試花一些時間把它梳理清楚些。

正在發生的未來，與一個危險的錯覺

對 Harness 的唱衰，并非空穴來風。

向下看，底層模型正在無情地「基建化」。

此前，開發者需要寫幾百行代碼來實現重試機制、JSON 格式約束、長文本的上下文壓縮。而今天，OpenAI 的結構化輸出、上下文緩存、原生工具調用甚至推理長度控制，直接把這些復雜的機制變成了 API 請求里的幾個參數。

那些僅僅封裝了「Prompt 鏈」和「基礎執行循環」的套殼框架，確實正在被底層模型無情地降維打擊。

向上看，environment engineering 展現出了可觀的杠桿率。

Anthropic 的一個實驗證明了這一點：他們將 Claude 放在一個高度結構化的數字環境里，提供有限且被清晰定義的 API 工具。結果發現，在一個友好的環境中，agent 的表現遠超在真實終端的混亂環境中的發揮。這揭示了，很多時候，agent 表現不佳，并非「腦子」不夠好，而是「世界」太難懂。重塑環境接口（修路）的收益，看上去大于打磨駕馭工程（訓練司機）。

如果推演到此為止，得出的結論就會是：擁抱模型廠 API，放棄自研控制層，轉去做環境工程的建設。

但harness engineering 真的沒有長期價值嗎？

概率系統與確定性商業的矛盾

將 harness engineering 類比為「終將被吞掉的中間件」，對了一部分。但如果因此推導出現實的商業世界只需要「模型 API + 環境」，則是極其危險的技術線性外推。它忽略了大模型時代最根本的工程悖論：

大語言模型本質上是一個基于概率的非確定性系統，而真實的商業世界要求的卻是確定性結果。

企業需要可觀測性，需要知道某個 agent 為什么做了這個決策，它的推理軌跡能否被完整回溯審計，需要成本與路由網關，需要把握如何在幾十個模型間動態路由，保證既聰明又省錢。需要系統級容錯，當 API 不穩定或產生幻覺時，系統能夠進行確定性的干預并閉環。

這些商業世界的鐵律，注定了harness 的本質從來不是「封裝邏輯的中間件」，而是復雜系統的「控制平面」與「策略層」。

API可以吞噬「機制」，但替代不了「策略」。

API 可以包攬工具該怎么調用、記憶格式該怎么存儲、基礎推理與行動循環怎么跑。但 API 無法決定：什么時候該觸發降級方案、如何在有限的 Token 預算下動態切分任務、多個不同能力的 Agent 發生決策沖突時該聽誰的、以及如何保證輸出結果符合特定行業的合規性。

在概率與確定性的鴻溝之間，harness 不僅是 agent 的方向盤，更是防止 AI 系統在商業環境中造成災難的「安全氣囊與剎車」。

環境工程的「烏托邦邊界」

那么，沿著 environment engineering 一路狂奔，把全世界重構成「agent 友好」的接口，是一門好生意嗎？

在代碼開發、本地文件管理等「天然數字化且高度結構化」的場景中，收益是可觀的。這也是為什么 Coding 是進展最快的原因。

然而，一旦進入傳統商業場景，環境工程就會撞上一堵名為「隱性知識與遺留系統」的嘆息之墻。

企業協作、供應鏈流轉、法律審查中的海量判斷依據，散落在非結構化的郵件、歷史長文本甚至人類專家的直覺中，它們無法被簡單地改寫成完美的 API。

想象一下，讓 AI 優化一家工廠的供應鏈。它需要理解的「環境」可能包括：一套運行了 20 年的、文檔不全的 ERP 系統；幾位老師傅基于「聽機器聲音」判斷故障的經驗；以及分散在無數 Excel 和郵件里的、充滿歧義的訂單備注。將這個混亂的現實「重構」成 AI 友好的 API 接口，其成本和難度是勸退工程師和客戶的。

同時，商業世界具有極強的慣性。大多數企業難以為了讓 agent 跑得更順暢，就輕易重構耗資千萬、運行了十年的核心業務系統。

這意味著，環境工程在商業落地上存在明顯的局限性——它是局部的、垂直的，很難形成統一的標準平臺。絕大多數時候，不是世界去適應 agent，而是 agent 必須學會在充滿噪音、混亂且非結構化的現實泥沼中生存。這會再次將聚光燈拉回到 harness engineering 系統架構能力上。

AI 產業價值階段推演

如果 harness 的價值不會清零，環境工程極具價值也有挑戰和局限，那么 AI 創業公司應該如何看待產業的演進，并找到自己的位置？價值鏈的重構可能會分三個階段上演。

第一階段：模型為王（2023-2025）

這是 AI 的「蠻荒時代」。每次模型的 SOTA 直接定義了 AI 能力的天花板。

在這個階段，價值公式極為簡單：

AI 應用能力 ≈ 模型能力

OpenAI、Anthropic 等模型廠手握最核心的生產資料，擁有最高的行業話語權。每次模型更新就會抹平一大片應用層的探索和建設。

第二階段：Harness 為王（2025-2028，大幕方啟）

我們正處在這一階段的初期。隨著基礎模型的能力趨于穩定，業界痛苦地發現：僅靠調用強大的模型API，無法直接構建出達到企業級可用標準的 Agent。任務成功率的瓶頸凸顯，成本和安全問題成為重要卡點。

此時，價值公式演變為：

AI 應用能力 = 模型能力 × Harness 效率

這個乘數效應是驚人的。一個基座模型，在粗糙的腳本驅動下，面對復雜研發任務的成功率可能只有 20%；但在一個為特定任務深度優化的 harness 驅動下，成功率可以躍升至 70% 以上。

此前被扣上「套殼產品」帽子的 Devin、Cursor 和 Manus 這類項目的核心壁壘，正在于那個被看低的「殼」，今天我們所說的 harness engineering。它們不擁有獨家的超級模型，但是構建起了一套 harness 系統，包含了精密的任務規劃與分解、代碼執行與沙箱、持續學習與反思、以及針對性的錯誤修正邏輯。

在這個階段，競爭的焦點會從「誰的模型更強」轉向「誰的控制層更優」。

第三階段：數據與環境為王（2028+，終局之戰）

當模型成為水電煤，各種高階的 Harness 系統也逐漸成熟并趨于標準化后，終極護城河才會成形。屆時，AI 的能力公式將會演進為：

AI 終極能力 = (模型能力 × Harness 效率)(數據 × 環境)

Environment engineering，其實是在提前押注第三階段。最強大的 AI 系統，將是那些能將模型和控制層深度嵌入到真實業務場景中，并重構了環境交互接口的公司。

Agent 在被重構的真實環境中執行任務，會產生獨一無二的交互數據，成功的捷徑、失敗的教訓、人類的微調修正。這些閉環數據反過來不僅可以微調模型，還能夠優化 Harness 的決策邏輯，從而形成一個自我進化的閉環。

例如微軟的 Microsoft 365 Copilot，依托 Office 全場景生態，打通并掌控了個人與企業最核心的業務環境——從 Outlook 郵件、Teams 會話到文檔、表格、會議等全鏈路數據與操作接口。Copilot 底層的 orchestrator，本質就是面向辦公場景的標準化 Harness 系統，在高度結構化的真實環境中調度模型能力，完成總結、撰寫、分析、執行等復雜任務。

用戶每一次采納、修改、反饋，都會形成高價值的閉環數據，持續反哺 orchestrator 策略優化與模型迭代，讓（模型 × Harness）與（數據 × 環境）形成指數級放大的正向循環。這正是第三階段核心競爭力的完整體現。

屆時，擁有海量真實場景和閉環數據流的企業，將擁有指數級優勢。

由此，如果你的團隊還在花大量時間手寫基礎的 prompt、基礎的記憶存儲，就把這些交給模型廠吧。不要在注定會成為基礎設施的地方建名存實亡的壁壘。

Agent 時代的下一場戰役，既不單純屬于逐漸基建化的大模型 API，也不完全屬于理想化的環境接口重構。

當下及未來的 2～3 年，做深特定領域的 Harness 系統架構會是一個有價值的創業切入點。

在云計算時代，AWS 吞掉了很多底層技術，但提供可觀測性的 Datadog 和 Snowflake 依然長成了千億巨頭，因為他們掌握著企業的「運營控制層」。這同樣是 AI 時代的財富密碼。

Environment engineering 是長期目標，而不是短期捷徑。提前布局，但不要幻想能一步到位。今天構建的強大 harness，正是你未來撬動環境改造、構建數據飛輪的唯一杠桿。

可做的事很多，該做什么才是更關鍵的。在新概念的浪潮中形成你自己的原生世界觀，然后，扎進去，把該干的干到最好，可能就是今天最值得做的事情。

轉載請聯系極客君微信 geekparkGO

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.