網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

這家Agent 公司從 Claude 切到 DeepSeek v4：一年省下數(shù)百萬美元，遷移工作量卻是預(yù)期的 100 倍

2026-06-22 17:10:20　來源: AI前線

北京舉報(bào)

分享至

作者 | Paul Sawers

譯者 | 平川

策劃 | Tina

本文最初發(fā)布于博客 TheNewStack。

初創(chuàng)公司 Lindy 將其全部 AI 代理流量從 Anthropic 轉(zhuǎn)移到了 DeepSeek v4，每年可以節(jié)省數(shù)百萬美元的推理成本。首席執(zhí)行官 Flo Crivello 解釋了為什么遷移工作比預(yù)期多出許多。

圖片來自 Unsplash+，由用戶 Space Stock 提供

推理成本已經(jīng)成為可持續(xù) AI 部署的最大障礙。最近，GitHub放棄了其 Copilot 訂閱的統(tǒng)一費(fèi)率，轉(zhuǎn)而采用基于使用的計(jì)費(fèi)方式，因?yàn)榇砭幋a會話的成本超出了固定月費(fèi)能夠覆蓋的范圍——一些訂閱者醒來時發(fā)現(xiàn)，他們的賬單比之前高出數(shù)倍。與此同時，在短短四個月內(nèi)，Uber 就燒光了 2026 年整年的 AI 預(yù)算，主要是在 Claude Code 上。這讓首席運(yùn)營官產(chǎn)生了質(zhì)疑，他們所獲得的回報(bào)是否值得這筆支出。

為應(yīng)對這一更廣泛的行業(yè)反思，Linux 基金會成立了 Tokenomics 基金會，得到了谷歌、微軟、IBM、Salesforce 等企業(yè)的支持。該基金會旨在圍繞 AI Token 成本建立一個開放的標(biāo)準(zhǔn)。這一舉措表明，業(yè)界已經(jīng)意識到，企業(yè)目前尚無統(tǒng)一的方法來衡量或控制這方面的支出。

轉(zhuǎn) 型

對于大量運(yùn)行 AI 代理的公司來說，前沿模型的經(jīng)濟(jì)性已經(jīng)成為一個幾乎關(guān)乎生存的問題。

Flo Crivello（前 Uber 工程師兼產(chǎn)品負(fù)責(zé)人）是 Lindy 的創(chuàng)始人兼首席執(zhí)行官。Lindy 是一個無代碼 AI 代理平臺，可以自動化日常工作任務(wù)——從電子郵件分類和會議安排到 CRM 管理。作為 Teamflow 的轉(zhuǎn)型舉措，Crivello 在 2023 年創(chuàng)立了 Lindy。前者是一個他之前籌集了 5200 萬美元的資金創(chuàng)辦的一家虛擬辦公室初創(chuàng)公司。這些資本現(xiàn)在被用于支持 Lindy 的發(fā)展。

Lindy

上周，Crivello 在社交媒體上宣布，Lindy 已經(jīng)將其整個模型基礎(chǔ)設(shè)施從 Anthropic 切換到了 DeepSeek。

Crivello 在 X 上寫道，“今天我們扣動了扳機(jī)，將 100% 的 Lindy 流量從 Anthropic 模型切換到了 DeepSeek v4。這每年能為我們節(jié)省數(shù)百萬美元，而且，我們在許多核心用例上看到了性能提升。對業(yè)務(wù)來說，這是變革性的。”

實(shí)際上，Crivello 早在幾個月前就暗示過他的意圖。4 月份的時候，他曾經(jīng) 在 X 上寫道，推理是 Lindy 占比最高的單項(xiàng)支出（超過了工資單），并且只用了一年時間，開源大模型就從“遠(yuǎn)不及閉源模型”發(fā)展到了“在大多數(shù)使用場景中都躋身前沿水平”。他說，當(dāng)時 Lindy 差點(diǎn)將 Kimi K2.5（來自中國 AI 公司 Moonshot AI 的一個模型）作為其默認(rèn)設(shè)置，不過后來他們轉(zhuǎn)向了總部位于北京的 Zhipu AI 開發(fā)的 GLM-5.1。

最終，這家公司選擇了 DeepSeek v4，這是中國 AI 研究公司 DeepSeek 的一個旗艦開源模型。

當(dāng)然，在全面投入生產(chǎn)的情況下從一家模型供應(yīng)商切換到另一家絕非易事。Crivello 告訴 The New Stack，完成這一過程所需的時間取決于從何時開始計(jì)算。但無論如何，這都是一項(xiàng)艱巨的任務(wù)。

Crivello 解釋道，“我們一直在考慮進(jìn)行這次轉(zhuǎn)型，并評估新的開源軟件（OSS）方案已有 6 到 9 個月的時間，而 DeepSeek 自發(fā)布以來，我們也一直在關(guān)注它，大約有 2 個月了”。

值得注意的是，遷移工作比 Crivello 最初的預(yù)期要繁重許多。他說，“比我們想象的工作要多 100 倍”。評估（在現(xiàn)實(shí)世界的任務(wù)中系統(tǒng)性地測試新模型，驗(yàn)證它能否媲美甚或超過 Anthropic 模型的性能）是其中的一個重要部分。

Flo Crivello，Lindy 創(chuàng)始人兼首席執(zhí)行官

Crivello 說，“模型評估的工作量很大，包括在線評估、離線評估，還有大量‘氛圍評估’。[隨后我們] 分階段上線了在線評估，同時觀察其對用戶留存率的影響；[接著] 針對新模型調(diào)整了提示詞。”

僅看成本節(jié)省這一項(xiàng)，還不足以證明這項(xiàng)工作的合理性。但性能結(jié)果給了 Crivello 更多的信心，特別是在其核心用例上，包括電子郵件收件箱分類和根據(jù)用戶的反饋預(yù)先起草回復(fù)。

Crivello 解釋說，“正是在那些任務(wù)中，我們看到了 DeepSeek 所帶來的驚人的性能提升。”不過他也指出，在一些復(fù)雜的自動化任務(wù)上，DeepSeek 仍然落后于 Anthropic。

他說，“在工作流自動化方面，它仍然不如 Sonnet，不過，這對我們來說并不重要。”

DeepSeek 時刻

要理解 Lindy 的轉(zhuǎn)型為何如此重要，了解 DeepSeek 在 AI 行業(yè)中所代表的意義會有所幫助。

2025 年 1 月，DeepSeek 公司在硅谷引起了軒然大波：其 R1 模型以極低的成本達(dá)到了與美國頂尖前沿模型相當(dāng)?shù)男阅芩健＿@使得英偉達(dá)的股價出現(xiàn)了一輪短暫但劇烈的拋售，投資者開始質(zhì)疑關(guān)于 AI 計(jì)算需求的基本假設(shè)。此后，該公司接連發(fā)布新產(chǎn)品，不斷縮小與前沿領(lǐng)域的差距。

2026 年 4 月發(fā)布的 DeepSeek V4 預(yù)覽版標(biāo)志著又一次重大飛躍，而且不僅僅體現(xiàn)在價格上。在 LinkedIn 上，瑞士洛桑聯(lián)邦理工學(xué)院（EPFL）教授、EPFL 人工智能中心聯(lián)合主任 Marcel Salathe 指出，從地緣政治的角度來看，V4 有著更深遠(yuǎn)的意義：這是首次出現(xiàn)從芯片、框架到模型完全由中國自主研發(fā)的尖端 AI 技術(shù)棧。據(jù)悉，DeepSeek 耗時數(shù)月重寫了 v4 版本，使其能在 CANN（華為版 Nvidia CUDA）上運(yùn)行，從而降低了對美國芯片基礎(chǔ)設(shè)施的依賴。

這種地緣政治格局的轉(zhuǎn)變帶來了直接的商業(yè)影響。正如 The New Stack 此前報(bào)道的那樣，以中國人工智能實(shí)驗(yàn)室為主的廉價開放權(quán)重模型的出現(xiàn)，將 AI 模型市場一分為二：一端是 OpenAI 和 Anthropic 等公司推出的超高端前沿模型，另一端則是價格大幅降低的開放權(quán)重替代方案，而原本舒適的中間地帶正在逐漸萎縮。數(shù)據(jù)印證了這一趨勢：作為連接應(yīng)用程序與 AI 服務(wù)提供商的中介平臺，Vercel 的 AI Gateway 數(shù)據(jù)顯示，DeepSeek 在 5 月單月內(nèi)的 Token 交易量份額從不足 1% 躍升至 17%，而其實(shí)際支出份額仍維持在 1% 左右，這恰恰反映出這些 Token 的實(shí)際成本有多么低廉。

對于像 Lindy 這樣大規(guī)模運(yùn)行代理的公司而言，這種兩極分化迫使他們不得不認(rèn)真思考該選擇哪種商業(yè)模式。對于 Lindy 的創(chuàng)始人來說，由于推理成本已經(jīng)超過薪資支出，這個問題其實(shí)只是時間早晚的問題。

Lindy 最終選擇了 Atlas Cloud——這家總部位于美國的推理服務(wù)提供商在美國本土托管 DeepSeek v4 模型。鑒于圍繞中國開發(fā)模型的數(shù)據(jù)主權(quán)問題往往備受關(guān)注，這一點(diǎn)尤為重要。在回應(yīng) X 平臺上一位評論者的提問時，Crivello 直接談及了此事。他指出，該模型由一家美國服務(wù)商在美國境內(nèi)托管，并且在評估了“所有主要供應(yīng)商”后，Atlas脫穎而出。值得一提的是，自主托管從未被列入他們的考慮范圍。

他說，“我們沒有認(rèn)真考慮過[自托管]，不，那看起來會分散我們很大的注意力。”

發(fā)展前景和未來計(jì)劃

雖然 Crivello 表示，此次轉(zhuǎn)型最終為 Lindy 節(jié)省了數(shù)百萬美元，但對于一家風(fēng)險投資支持的公司來說，這對其發(fā)展前景的影響非常深遠(yuǎn)。

但具體有多少呢？Crivello 說，”很多“。

至于這一舉措是否是永久性的，Crivello 并沒有明確表態(tài)。他說，“世上沒有什么是永恒的。如果 Anthropic 的下一次發(fā)布能讓他們重新贏得我們的業(yè)務(wù)，我也不會感到驚訝，但他們需要大幅降價。”

同樣值得注意的是，Lindy 仍然是 Anthropic 的客戶，只是不是其核心產(chǎn)品。該公司仍然在內(nèi)部使用 Claude，因?yàn)橛嗛喎桨傅慕?jīng)濟(jì)性使其變得可行。

Crivello 說，“我們內(nèi)部使用的是 Max plan。如果沒有它，那么我們就必須支付完整的 Token 價格，要是這樣的話，我們會轉(zhuǎn)向其他東西”。

關(guān)于 Lindy 最終是否可能被迫在其外部產(chǎn)品中重新采用 Anthropic 模型，在回應(yīng) Amp CEO 兼創(chuàng)始人 Quinn Slack 的問題時，Crivello 暗示這并非完全不可能。他寫道，“當(dāng)我們檢測到 Lindy 在任務(wù)中失敗時，我們可能仍然會升級到 Opus，但那將是少數(shù)情況。”

Crivello 的觀點(diǎn)是，像 Lindy 這樣的公司（大型 Token 消費(fèi)者）別無選擇，只能采取行動。他說，“像我們這樣在 Token 上花很多錢的公司，100% 要行動。不這么做將是不負(fù)責(zé)任的。其他公司要看具體情況，但我認(rèn)為很多人只是認(rèn)品牌。”

https://thenewstack.io/lindy-deepseek-anthropic-switch/

聲明：本文為 InfoQ 翻譯，未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

AICon 上海站 4 大核心看點(diǎn)：Keynote 前瞻洞見、Agent 工程化專題拆解、前沿技術(shù) + 產(chǎn)業(yè)落地全覆蓋，Google Cloud 專家實(shí)操帶練。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 13269078023 進(jìn)行咨詢。

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.