網易首頁 > 網易號 > 正文申請入駐

SaaS盡頭是AaaS：2B軟件行業如何憑Harness Engineering與FDE完成絕地反擊

2026-05-31 07:03:54　來源: PM熊叔

上海舉報

分享至

2026年2月3日，全球軟件行業遭遇了被稱為“軟件業黑色星期二”的估值清洗。

隨著Anthropic發布桌面智能體“Claude Cowork”和OpenAI推送“ChatGPT Agent Mode”，AI開始24小時無休止地接管人類鼠標和鍵盤。

SaaS行業三十年來賴以生存的"按人頭（Per-Seat）計費"基礎邏輯瞬間崩塌，萬億市值灰飛煙滅。

然而，在經歷了長達四個月的恐慌與低迷后，2026年5月底的財報季吹響了絕地反擊的號角——伴隨著驚人的業績公布，SaaS板塊接連飛升。

例如，數據云巨頭 Snowflake，本周公布的季度營收達到 13.9 億美元，單日股價轟出 +36.48% 的天量漲幅。

這場從"提供軟件工具"向"兜售賽博勞動力（Agent-as-a-Service, AaaS）"的商業重構已然跑通。而支撐頭部巨頭逆天改命的核心底牌，正是Agent Harness Engineering（智能體駕馭工程）。

一、企業里，多少崗位真的可以被Agent取代？

Agent到底能不能像員工一樣操作電腦完成任務？

前幾日，由UniPat-AI發布的SaaS-Bench提供了專門的測試標準——在23個真實SaaS系統中部署106個高難度專業工作流，到底有哪些模型能夠順利完成任務？

發現當前AI的致命軟肋：即便是最強的大模型，在真實企業端到端工作流中的成功率也不足4%。

Claude Opus 4.7端到端完全通過率 3.8%——106個任務，只完整跑通了4個。

Kimi K2.2.5 / Gemini 3.1 Pro完全通過率 0%——一個任務都沒走完。

SaaS-Bench 撕碎了"全自動辦公"的幻想。

SaaS-Bench進一步指出了Computer Use Agent四大失敗模式：

1.路徑衰減與失憶：超過100步的跨系統操作中，AI極易丟失上下文——在哪個節點停的、為什么停，全忘了

2. 錯誤級聯：早期步驟的一個小錯誤，會在后續流程中產生連鎖反應，導致后半程檢查點全部無法抵達

3. 閉環缺失：模型完成操作后不會主動核實，經常越權操作或產生了幻覺，還匯報“任務完成”

4. 平臺不穩定： SaaS界面的細微變化，或長流程中的任何波動，都會導致輸出劇烈抖動，同一任務多次執行結果不一

換句話說：大模型是智力引擎，但直接把它接進企業業務主干，就像讓盲人在高速公路上飆車——能跑，但隨時可能出事。

LLM和企業真實場景之間，存在一道鴻溝。這道鴻溝需要有人來填。

二、商業本質：Agent Harness Engineering 到底是什么？企業的SaaS系統是一個高度復雜的業務流程網絡，跨部門協作、跨軟件平臺、跨目標管理。即使是工作多年的資深員工，也需要花時間才能完全掌握。一個裸的大模型更難完成。SaaS巨頭們敏銳地捕捉到了這一痛點。它們意識到：SaaS向AaaS（Agent-as-a-Service）的演進，本質上已不再是出售軟件界面，而是向企業兜售“Agent Harness Engineering”（智能體駕馭工程）服務。核心公式：Agent = Harness + 大模型在AI時代，Harness是圍繞大模型構建的一整套基礎設施，其使命是確保AI能夠在真實的企業業務環境中安全、穩定、可控地執行任務。一個完整的企業級Harness包含五大核心支柱：

1.狀態錨定（State Grounding）：為AI外掛長期記憶，實時對接過去數年的業務狀態，避免模型“失憶”。

2. 編排層（Orchestration）：負責跨系統調度，處理網絡波動、接口異常等環境問題，將自然語言意圖轉化為可執行的系統調用。

3. 邊界防御與權限控制（Guardrails）：實施靜態權限隔離（Least Privilege），硬編碼攔截越權操作，防止核心數據被篡改或泄露。

4. 可觀測性與審計（Observability）：充當“黑匣子”，完整記錄智能體的每一次推理、決策與執行動作，確保合規與事后追責。

5. 人機協同切換（Handoff）：設定置信度閾值，在遇到邊緣復雜案例時自動暫停任務，無縫呼叫人類員工接管審批。

但光有腳手架還不夠，還得有人去現場搭建。

2026年，硅谷掀起了最瘋狂的搶人大戰——爭奪對象正是FDE（Foundational Deployment Engineer，基礎部署工程師）。

這些“AI泥水匠”年薪普遍在40萬至80萬美元，提著電腦、帶著睡袋長期駐扎在世界500強企業的機房里。他們需要：

徒手梳理20年前的遺留代碼尋找可用接口；
把客戶混亂的業務黑話翻譯成結構化的Harness適配器；
將嬌貴的大模型硬塞進企業古老的系統中，讓其真正跑通。

硅谷最新流行的一句話是：“沒有FDE弄臟雙手的AaaS，全都是PPT里空轉的廢紙。”

正因如此，ServiceNow憑借自建的全職FDE軍團，牢牢鎖定了大型企業客戶；而Snowflake高度依賴第三方外包，在落地壁壘上明顯薄弱。

2026年5月底的華爾街在財報之后，用真金白銀徹底打消了市場對“SaaS將被AI顛覆”的疑慮：誰能率先幫企業構建出穩定、可控、可計費的Agent Harness，誰就能把AI的能力轉化為持續的印鈔機。

三、行為鎖定：AaaS時代真正的護城河當基礎部署工程師（FDE）將Harness在企業環境中搭建完成后，真正的長期價值鎖定才剛剛開始。這就是AaaS最核心的競爭壁壘——行為鎖定（Behavioral Lock-in）

傳統數據可以導出，但AI Agent在長期運行中積累的“組織特異性知識”卻難以遷移。這些知識包括：特定經理的審批偏好、工單優先級處理邏輯、跨部門隱性協作規則等。經過18個月的持續運行后，Agent已深度適配企業的實際運作方式。

如果企業決定更換平臺，新引入的Agent需要經歷長達數月的“適應期”（黑燈探路期），才能達到原有系統的效能。這相當于失去了一位掌握大量隱性業務經驗的“資深員工”，切換成本顯著高于傳統SaaS時代。

三家公司在行為鎖定與Harness能力上的對比：

ServiceNow (NOW)：在Guardrails（邊界防御）和跨系統編排上具備顯著優勢。其AI Control Tower提供較強的強制性權限控制和成熟的人機切換機制，在強合規、ITSM和復雜運營場景中護城河較深。行為鎖定效果最為明顯。
Salesforce (CRM)：Agentforce在CRM、銷售和服務等前端工作流調度上表現強勁，已形成可觀的業務增量。但在治理深度和跨系統強制性上相對ServiceNow仍有差距，整體處于穩健過渡階段。
Snowflake (SNOW)：作為數據平臺，在數據密集型分析和單點洞察任務中優勢突出，但缺乏原生的復雜工作流引擎和跨系統編排能力。因此，其行為鎖定相對較弱，更適合作為數據后端與其他平臺組合使用。

Harness本身只是基礎，真正決定長期競爭力的，是企業能否將技術框架與實際業務深度融合，以及部署團隊的執行能力。

五、后人頭費時代的生存法則

對于企業買家：

評估供應商時，不要只看技術參數。最有效的驗證方式——拿一個真實業務場景讓供應商跑一遍，看中途斷點在哪里、出了問題誰能接管、ROI怎么算。

對于SaaS從業者：

思考自己的產品在AaaS時代的定位——是提供工具，還是提供能力？如果能提供Harness層以上的"AI在特定場景中按我的規矩辦事"的能力，定價權才會真正轉移到你這邊。

對于創業者：

Harness Engineering的基礎設施層，現在還存在大量空白。狀態管理、跨系統上下文傳遞、權限邊界配置、審計日志標準化——這些"苦活累活"恰恰是大廠不屑于做、但企業剛需的東西。

2026年這場大洗牌，完成了軟件業的一次物種進化。AI能力正在不可逆地商品化，而基于復雜業務場景的Harness能力，正在變得稀缺且昂貴。

誰能率先掌握并定義Harness的行為邊界，誰就能在這場變局中握住新的商業權柄。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.