2026年2月3日,全球軟件行業遭遇了被稱為“軟件業黑色星期二”的估值清洗。
隨著Anthropic發布桌面智能體“Claude Cowork”和OpenAI推送“ChatGPT Agent Mode”,AI開始24小時無休止地接管人類鼠標和鍵盤。
![]()
SaaS行業三十年來賴以生存的"按人頭(Per-Seat)計費"基礎邏輯瞬間崩塌,萬億市值灰飛煙滅。
然而,在經歷了長達四個月的恐慌與低迷后,2026年5月底的財報季吹響了絕地反擊的號角——伴隨著驚人的業績公布,SaaS板塊接連飛升。
例如,數據云巨頭 Snowflake,本周公布的季度營收達到 13.9 億美元,單日股價轟出 +36.48% 的天量漲幅。
![]()
這場從"提供軟件工具"向"兜售賽博勞動力(Agent-as-a-Service, AaaS)"的商業重構已然跑通。而支撐頭部巨頭逆天改命的核心底牌,正是Agent Harness Engineering(智能體駕馭工程)。
一、企業里,多少崗位真的可以被Agent取代?
Agent到底能不能像員工一樣操作電腦完成任務?
前幾日,由UniPat-AI發布的SaaS-Bench提供了專門的測試標準——在23個真實SaaS系統中部署106個高難度專業工作流,到底有哪些模型能夠順利完成任務?
發現當前AI的致命軟肋:即便是最強的大模型,在真實企業端到端工作流中的成功率也不足4%。
Claude Opus 4.7端到端完全通過率 3.8%——106個任務,只完整跑通了4個。
Kimi K2.2.5 / Gemini 3.1 Pro完全通過率 0%——一個任務都沒走完。
SaaS-Bench 撕碎了"全自動辦公"的幻想。
SaaS-Bench進一步指出了Computer Use Agent四大失敗模式:
1.路徑衰減與失憶: 超過100步的跨系統操作中,AI極易丟失上下文——在哪個節點停的、為什么停,全忘了
2. 錯誤級聯: 早期步驟的一個小錯誤,會在后續流程中產生連鎖反應,導致后半程檢查點全部無法抵達
3. 閉環缺失: 模型完成操作后不會主動核實,經常越權操作或產生了幻覺,還匯報“任務完成”
4. 平臺不穩定: SaaS界面的細微變化,或長流程中的任何波動,都會導致輸出劇烈抖動,同一任務多次執行結果不一
換句話說:大模型是智力引擎,但直接把它接進企業業務主干,就像讓盲人在高速公路上飆車——能跑,但隨時可能出事。
LLM和企業真實場景之間,存在一道鴻溝。這道鴻溝需要有人來填。
二、商業本質:Agent Harness Engineering 到底是什么?企業的SaaS系統是一個高度復雜的業務流程網絡,跨部門協作、跨軟件平臺、跨目標管理。即使是工作多年的資深員工,也需要花時間才能完全掌握。一個裸的大模型更難完成。SaaS巨頭們敏銳地捕捉到了這一痛點。它們意識到:SaaS向AaaS(Agent-as-a-Service)的演進,本質上已不再是出售軟件界面,而是向企業兜售“Agent Harness Engineering”(智能體駕馭工程)服務。核心公式:Agent = Harness + 大模型在AI時代,Harness是圍繞大模型構建的一整套基礎設施,其使命是確保AI能夠在真實的企業業務環境中安全、穩定、可控地執行任務。一個完整的企業級Harness包含五大核心支柱:
1.狀態錨定(State Grounding):為AI外掛長期記憶,實時對接過去數年的業務狀態,避免模型“失憶”。
2. 編排層(Orchestration):負責跨系統調度,處理網絡波動、接口異常等環境問題,將自然語言意圖轉化為可執行的系統調用。
3. 邊界防御與權限控制(Guardrails):實施靜態權限隔離(Least Privilege),硬編碼攔截越權操作,防止核心數據被篡改或泄露。
4. 可觀測性與審計(Observability):充當“黑匣子”,完整記錄智能體的每一次推理、決策與執行動作,確保合規與事后追責。
5. 人機協同切換(Handoff):設定置信度閾值,在遇到邊緣復雜案例時自動暫停任務,無縫呼叫人類員工接管審批。
但光有腳手架還不夠,還得有人去現場搭建。
2026年,硅谷掀起了最瘋狂的搶人大戰——爭奪對象正是FDE(Foundational Deployment Engineer,基礎部署工程師)。
這些“AI泥水匠”年薪普遍在40萬至80萬美元,提著電腦、帶著睡袋長期駐扎在世界500強企業的機房里。他們需要:
徒手梳理20年前的遺留代碼尋找可用接口;
把客戶混亂的業務黑話翻譯成結構化的Harness適配器;
將嬌貴的大模型硬塞進企業古老的系統中,讓其真正跑通。
硅谷最新流行的一句話是:“沒有FDE弄臟雙手的AaaS,全都是PPT里空轉的廢紙。”
正因如此,ServiceNow憑借自建的全職FDE軍團,牢牢鎖定了大型企業客戶;而Snowflake高度依賴第三方外包,在落地壁壘上明顯薄弱。
2026年5月底的華爾街在財報之后,用真金白銀徹底打消了市場對“SaaS將被AI顛覆”的疑慮:誰能率先幫企業構建出穩定、可控、可計費的Agent Harness,誰就能把AI的能力轉化為持續的印鈔機。
三、行為鎖定:AaaS時代真正的護城河當基礎部署工程師(FDE)將Harness在企業環境中搭建完成后,真正的長期價值鎖定才剛剛開始。這就是AaaS最核心的競爭壁壘——行為鎖定(Behavioral Lock-in)
傳統數據可以導出,但AI Agent在長期運行中積累的“組織特異性知識”卻難以遷移。這些知識包括:特定經理的審批偏好、工單優先級處理邏輯、跨部門隱性協作規則等。經過18個月的持續運行后,Agent已深度適配企業的實際運作方式。
如果企業決定更換平臺,新引入的Agent需要經歷長達數月的“適應期”(黑燈探路期),才能達到原有系統的效能。這相當于失去了一位掌握大量隱性業務經驗的“資深員工”,切換成本顯著高于傳統SaaS時代。
三家公司在行為鎖定與Harness能力上的對比:
ServiceNow (NOW):在Guardrails(邊界防御)和跨系統編排上具備顯著優勢。其AI Control Tower提供較強的強制性權限控制和成熟的人機切換機制,在強合規、ITSM和復雜運營場景中護城河較深。行為鎖定效果最為明顯。
Salesforce (CRM):Agentforce在CRM、銷售和服務等前端工作流調度上表現強勁,已形成可觀的業務增量。但在治理深度和跨系統強制性上相對ServiceNow仍有差距,整體處于穩健過渡階段。
Snowflake (SNOW):作為數據平臺,在數據密集型分析和單點洞察任務中優勢突出,但缺乏原生的復雜工作流引擎和跨系統編排能力。因此,其行為鎖定相對較弱,更適合作為數據后端與其他平臺組合使用。
Harness本身只是基礎,真正決定長期競爭力的,是企業能否將技術框架與實際業務深度融合,以及部署團隊的執行能力。
五、后人頭費時代的生存法則
對于企業買家:
評估供應商時,不要只看技術參數。最有效的驗證方式——拿一個真實業務場景讓供應商跑一遍,看中途斷點在哪里、出了問題誰能接管、ROI怎么算。
對于SaaS從業者:
思考自己的產品在AaaS時代的定位——是提供工具,還是提供能力?如果能提供Harness層以上的"AI在特定場景中按我的規矩辦事"的能力,定價權才會真正轉移到你這邊。
對于創業者:
Harness Engineering的基礎設施層,現在還存在大量空白。狀態管理、跨系統上下文傳遞、權限邊界配置、審計日志標準化——這些"苦活累活"恰恰是大廠不屑于做、但企業剛需的東西。
2026年這場大洗牌,完成了軟件業的一次物種進化。AI能力正在不可逆地商品化,而基于復雜業務場景的Harness能力,正在變得稀缺且昂貴。
誰能率先掌握并定義Harness的行為邊界,誰就能在這場變局中握住新的商業權柄。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.