无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Harness 還是 Environment? 這波 Agent 創業還有護城河嗎?

0
分享至


全文約 4448 字

預計閱讀 12 分鐘

Context engineering、harness engineering、environment engineering……AI 圈,概念的更新速度多少有些「通詞膨脹」了。

回憶一下這令人眩暈的加速度吧:

2022 年底 ChatGPT 發布至 2024 年,我們研究的都還是 prompt engineering,四處探尋那句能「點石成金」的咒語,通過優化每次的指令來獲得更好的模型輸出。

2025 年 6 月,Shopify CEO Tobi Lütke 提出 context engineering,并得到 Andrej Karpathy 的贊同,為模型提供任務所需的恰到好處的上下文信息,開始成為新的焦點。

五個月后,Anthropic 在報告《Effective harnesses for long-running agents》中帶來了 harness 的概念,通過上下文管理、工具調用、進程管理等方法提升 agent 的運行時間和成功率。八個月后,今年 2 月,HashiCorp 聯合創始人 Mitchell Hashimoto 提出了 harness engineering 的概念,OpenAI 和 Anthropic 都緊接著發布了各自在 harness 方面的研究進展和實驗報告,harness engineering 成為了 agent 圈的新共識。

當本土開發者還在熱切地討論 harness engineering 時,沒出一個月,硅谷已經傳來一種截然不同的聲音——「Harness 將死,未來屬于 environment engineering。

Weilun Chen 指出,底層大模型正在以 API 的形式瘋狂吞噬掉開發者熬夜寫出的編排邏輯;同時,以 Anthropic MCP 和 Claude Code 為代表的實踐證明:只要把系統的「環境接口」重寫成對 Agent 友好的結構化形態,模型根本不需要復雜的 harness 就能展現出驚人的能力。

這些不斷被制造出來的新詞匯和新概念,核心是在探討一個更根本的問題:在這個 AI Native 時代,一家新興公司的價值應該如何構建?能做的事有很多,關鍵的是該做什么?所謂「該做」,就是有長期價值、能形成壁壘,甚至具有未來價值擴展性的事。

雖然這些概念的快速變化搞得人很煩,但嘗試理解和構建一種未來的「世界觀」確實是有意義的。「世界觀」決定了寶貴的資源——創始人的時間、團隊的精力、投資人的資本——會被投向何方。

所以,咱們嘗試花一些時間把它梳理清楚些。

正在發生的未來,與一個危險的錯覺

對 Harness 的唱衰,并非空穴來風。

向下看,底層模型正在無情地「基建化」。

此前,開發者需要寫幾百行代碼來實現重試機制、JSON 格式約束、長文本的上下文壓縮。而今天,OpenAI 的結構化輸出、上下文緩存、原生工具調用甚至推理長度控制,直接把這些復雜的機制變成了 API 請求里的幾個參數。

那些僅僅封裝了「Prompt 鏈」和「基礎執行循環」的套殼框架,確實正在被底層模型無情地降維打擊。

向上看,environment engineering 展現出了可觀的杠桿率。

Anthropic 的一個實驗證明了這一點:他們將 Claude 放在一個高度結構化的數字環境里,提供有限且被清晰定義的 API 工具。結果發現,在一個友好的環境中,agent 的表現遠超在真實終端的混亂環境中的發揮。這揭示了,很多時候,agent 表現不佳,并非「腦子」不夠好,而是「世界」太難懂。重塑環境接口(修路)的收益,看上去大于打磨駕馭工程(訓練司機)。

如果推演到此為止,得出的結論就會是:擁抱模型廠 API,放棄自研控制層,轉去做環境工程的建設。

harness engineering 真的沒有長期價值嗎?

概率系統與確定性商業的矛盾

將 harness engineering 類比為「終將被吞掉的中間件」,對了一部分。但如果因此推導出現實的商業世界只需要「模型 API + 環境」,則是極其危險的技術線性外推。它忽略了大模型時代最根本的工程悖論:

大語言模型本質上是一個基于概率的非確定性系統,而真實的商業世界要求的卻是確定性結果。

企業需要可觀測性,需要知道某個 agent 為什么做了這個決策,它的推理軌跡能否被完整回溯審計,需要成本與路由網關,需要把握如何在幾十個模型間動態路由,保證既聰明又省錢。需要系統級容錯,當 API 不穩定或產生幻覺時,系統能夠進行確定性的干預并閉環。

這些商業世界的鐵律,注定了harness 的本質從來不是「封裝邏輯的中間件」,而是復雜系統的「控制平面」與「策略層」

API可以吞噬「機制」,但替代不了「策略」。

API 可以包攬工具該怎么調用、記憶格式該怎么存儲、基礎推理與行動循環怎么跑。但 API 無法決定: 什么時候該觸發降級方案、如何在有限的 Token 預算下動態切分任務、多個不同能力的 Agent 發生決策沖突時該聽誰的、以及如何保證輸出結果符合特定行業的合規性。

在概率與確定性的鴻溝之間,harness 不僅是 agent 的方向盤,更是防止 AI 系統在商業環境中造成災難的「安全氣囊與剎車」。

環境工程的「烏托邦邊界」

那么,沿著 environment engineering 一路狂奔,把全世界重構成「agent 友好」的接口,是一門好生意嗎?

在代碼開發、本地文件管理等「天然數字化且高度結構化」的場景中,收益是可觀的。這也是為什么 Coding 是進展最快的原因。

然而,一旦進入傳統商業場景,環境工程就會撞上一堵名為「隱性知識與遺留系統」的嘆息之墻。

企業協作、供應鏈流轉、法律審查中的海量判斷依據,散落在非結構化的郵件、歷史長文本甚至人類專家的直覺中,它們無法被簡單地改寫成完美的 API。

想象一下,讓 AI 優化一家工廠的供應鏈。它需要理解的「環境」可能包括:一套運行了 20 年的、文檔不全的 ERP 系統;幾位老師傅基于「聽機器聲音」判斷故障的經驗;以及分散在無數 Excel 和郵件里的、充滿歧義的訂單備注。將這個混亂的現實「重構」成 AI 友好的 API 接口,其成本和難度是勸退工程師和客戶的。

同時,商業世界具有極強的慣性。大多數企業難以為了讓 agent 跑得更順暢,就輕易重構耗資千萬、運行了十年的核心業務系統。

這意味著,環境工程在商業落地上存在明顯的局限性——它是局部的、垂直的,很難形成統一的標準平臺。絕大多數時候,不是世界去適應 agent,而是 agent 必須學會在充滿噪音、混亂且非結構化的現實泥沼中生存。這會再次將聚光燈拉回到 harness engineering 系統架構能力上。

AI 產業價值階段推演

如果 harness 的價值不會清零,環境工程極具價值也有挑戰和局限,那么 AI 創業公司應該如何看待產業的演進,并找到自己的位置?價值鏈的重構可能會分三個階段上演。

第一階段:模型為王(2023-2025)

這是 AI 的「蠻荒時代」。每次模型的 SOTA 直接定義了 AI 能力的天花板。

在這個階段,價值公式極為簡單:

AI 應用能力 ≈ 模型能力

OpenAI、Anthropic 等模型廠手握最核心的生產資料,擁有最高的行業話語權。每次模型更新就會抹平一大片應用層的探索和建設。

第二階段:Harness 為王(2025-2028,大幕方啟)

我們正處在這一階段的初期。隨著基礎模型的能力趨于穩定,業界痛苦地發現:僅靠調用強大的模型API,無法直接構建出達到企業級可用標準的 Agent。任務成功率的瓶頸凸顯,成本和安全問題成為重要卡點。

此時,價值公式演變為:

AI 應用能力 = 模型能力 × Harness 效率

這個乘數效應是驚人的。一個基座模型,在粗糙的腳本驅動下,面對復雜研發任務的成功率可能只有 20%;但在一個為特定任務深度優化的 harness 驅動下,成功率可以躍升至 70% 以上。

此前被扣上「套殼產品」帽子的 Devin、Cursor 和 Manus 這類項目的核心壁壘,正在于那個被看低的「殼」,今天我們所說的 harness engineering。它們不擁有獨家的超級模型,但是構建起了一套 harness 系統,包含了精密的任務規劃與分解、代碼執行與沙箱、持續學習與反思、以及針對性的錯誤修正邏輯。

在這個階段,競爭的焦點會從「誰的模型更強」轉向「誰的控制層更優」。

第三階段:數據與環境為王(2028+,終局之戰)

當模型成為水電煤,各種高階的 Harness 系統也逐漸成熟并趨于標準化后,終極護城河才會成形。屆時,AI 的能力公式將會演進為:

AI 終極能力 = (模型能力 × Harness 效率)(數據 × 環境)

Environment engineering,其實是在提前押注第三階段。最強大的 AI 系統,將是那些能將模型和控制層深度嵌入到真實業務場景中,并重構了環境交互接口的公司。

Agent 在被重構的真實環境中執行任務,會產生獨一無二的交互數據,成功的捷徑、失敗的教訓、人類的微調修正。這些閉環數據反過來不僅可以微調模型,還能夠優化 Harness 的決策邏輯,從而形成一個自我進化的閉環。

例如微軟的 Microsoft 365 Copilot,依托 Office 全場景生態,打通并掌控了個人與企業最核心的業務環境——從 Outlook 郵件、Teams 會話到文檔、表格、會議等全鏈路數據與操作接口。Copilot 底層的 orchestrator,本質就是面向辦公場景的標準化 Harness 系統,在高度結構化的真實環境中調度模型能力,完成總結、撰寫、分析、執行等復雜任務。

用戶每一次采納、修改、反饋,都會形成高價值的閉環數據,持續反哺 orchestrator 策略優化與模型迭代,讓(模型 × Harness)與(數據 × 環境)形成指數級放大的正向循環。這正是第三階段核心競爭力的完整體現。

屆時,擁有海量真實場景和閉環數據流的企業,將擁有指數級優勢。

由此,如果你的團隊還在花大量時間手寫基礎的 prompt、基礎的記憶存儲,就把這些交給模型廠吧。不要在注定會成為基礎設施的地方建名存實亡的壁壘。

Agent 時代的下一場戰役,既不單純屬于逐漸基建化的大模型 API,也不完全屬于理想化的環境接口重構。

當下及未來的 2~3 年,做深特定領域的 Harness 系統架構會是一個有價值的創業切入點。

在云計算時代,AWS 吞掉了很多底層技術,但提供可觀測性的 Datadog 和 Snowflake 依然長成了千億巨頭,因為他們掌握著企業的「運營控制層」。這同樣是 AI 時代的財富密碼。

Environment engineering 是長期目標,而不是短期捷徑。提前布局,但不要幻想能一步到位。今天構建的強大 harness,正是你未來撬動環境改造、構建數據飛輪的唯一杠桿。

可做的事很多,該做什么才是更關鍵的。在新概念的浪潮中形成你自己的原生世界觀,然后,扎進去,把該干的干到最好,可能就是今天最值得做的事情。


轉載請聯系極客君微信 geekparkGO

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
太無恥!具俊曄韓國節目又爆大S生前隱私,他的丑惡終于不藏了

太無恥!具俊曄韓國節目又爆大S生前隱私,他的丑惡終于不藏了

史鹷的生活科普
2026-06-16 17:56:49
蔣介石前妻赴京拜見周總理,初見就為女婿辯解,懷疑其是共產黨人

蔣介石前妻赴京拜見周總理,初見就為女婿辯解,懷疑其是共產黨人

磊子講史
2026-06-11 19:34:18
中際旭創總市值超茅臺,A股四大千元股齊創新高,兆易創新2連板,華虹宏力大漲12%

中際旭創總市值超茅臺,A股四大千元股齊創新高,兆易創新2連板,華虹宏力大漲12%

21世紀經濟報道
2026-06-18 14:40:27
李嘉誠預言要成真了?我國41.5%的城鎮家庭,或將面對這三個難題

李嘉誠預言要成真了?我國41.5%的城鎮家庭,或將面對這三個難題

阿尢說歷史
2026-06-14 13:30:57
亞洲再現巴拿馬危機,中方資產遭重創,40萬崗位被迫犧牲

亞洲再現巴拿馬危機,中方資產遭重創,40萬崗位被迫犧牲

一網打盡全球焦點
2026-06-18 17:01:40
NBA歷史最佳陣容出爐:杜蘭特3陣,庫里科比僅2陣,1陣無可替代

NBA歷史最佳陣容出爐:杜蘭特3陣,庫里科比僅2陣,1陣無可替代

林子說事
2026-06-18 01:13:59
上千噸香蕉爛在手里,菲律賓香蕉協會:中國斷了30萬蕉農的生計!

上千噸香蕉爛在手里,菲律賓香蕉協會:中國斷了30萬蕉農的生計!

楠楠自語
2026-05-05 21:48:09
胖東來透明粽子完勝,星巴克拉完了

胖東來透明粽子完勝,星巴克拉完了

Vista氫商業
2026-06-17 10:51:05
605376漲停!MLCC概念,集體飆升

605376漲停!MLCC概念,集體飆升

證券時報
2026-06-18 11:26:02
中方是否會參與美伊第二階段和平談判?外交部回應

中方是否會參與美伊第二階段和平談判?外交部回應

澎湃新聞
2026-06-18 15:48:26
全面開戰!49枚戰斧導彈轟炸,特朗普怒氣沖天,伊朗炸了以軍基地

全面開戰!49枚戰斧導彈轟炸,特朗普怒氣沖天,伊朗炸了以軍基地

面包夾知識
2026-06-13 17:23:39
特斯拉中國開始上架 FSD 自動駕駛頁面,真的要來了?

特斯拉中國開始上架 FSD 自動駕駛頁面,真的要來了?

XCiOS俱樂部
2026-06-18 13:25:22
對于下周一A股,我只說3句話:第一,4117點大概率是個高點!

對于下周一A股,我只說3句話:第一,4117點大概率是個高點!

趨勢清風俠
2026-06-18 17:52:46
因曾持股被英美制裁的陳志電詐集團,柬埔寨副總理花28.5萬美元請美國律師“未雨綢繆”

因曾持股被英美制裁的陳志電詐集團,柬埔寨副總理花28.5萬美元請美國律師“未雨綢繆”

紅星新聞
2026-06-18 16:26:52
紅軍為什么到了陜北,就安全了?原因很現實,五大原因

紅軍為什么到了陜北,就安全了?原因很現實,五大原因

海佑講史
2026-06-18 13:45:10
全國人民更應關注特奧多羅妻子參與經營對華農產品出口業務!

全國人民更應關注特奧多羅妻子參與經營對華農產品出口業務!

娛樂圈的筆娛君
2026-06-17 17:14:30
35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

35頁PPT瘋傳:洛陽女子1女談3男,每天卡時間,都已談婚論嫁

烈史
2026-05-30 13:23:41
柬埔寨對華免簽落地 首日即有老廣團出發

柬埔寨對華免簽落地 首日即有老廣團出發

新快報新聞
2026-06-16 08:19:02
中國女排1人嚴重被高估!37中8,成為“瘸腿”,球迷:不如王云蕗

中國女排1人嚴重被高估!37中8,成為“瘸腿”,球迷:不如王云蕗

削桐作琴
2026-06-18 17:36:24
開20年麻將館,我看透了:天天泡牌桌的人,終究逃不過這3種結局

開20年麻將館,我看透了:天天泡牌桌的人,終究逃不過這3種結局

千秋歷史
2026-05-28 19:29:11
2026-06-18 18:31:00
張鵬科技商業觀察 incentive-icons
張鵬科技商業觀察
聊科技,談商業
93文章數 142關注度
往期回顧 全部

財經要聞

沃什“首秀”:刻意的模糊?

頭條要聞

男子深夜拉車門盜走5萬元 作案前后向AI"求教":判多久

頭條要聞

男子深夜拉車門盜走5萬元 作案前后向AI"求教":判多久

體育要聞

波切蒂諾:我仍對西班牙有信心

娛樂要聞

39歲梅西不愧是人生贏家!

科技要聞

庫克承認扛不住了,蘋果漲價“不可避免”

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態度原創

教育
健康
親子
數碼
公開課

教育要聞

2026年太殘酷了,1290萬高中生+1270萬大學畢業生

營養師:粽子怎么吃美味又健康?

親子要聞

為什么你在家做霧化,治不好孩子的鼻竇炎?

數碼要聞

9999元起!摩爾線程MTT AICUBE家庭AI中樞開啟預售:搭載自研長江SoC芯片

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版