![]()
作者 | Paul Sawers
譯者 | 平川
策劃 | Tina
本文最初發(fā)布于博客 TheNewStack。
初創(chuàng)公司 Lindy 將其全部 AI 代理流量從 Anthropic 轉(zhuǎn)移到了 DeepSeek v4,每年可以節(jié)省數(shù)百萬美元的推理成本。首席執(zhí)行官 Flo Crivello 解釋了為什么遷移工作比預(yù)期多出許多。
![]()
圖片來自 Unsplash+,由用戶 Space Stock 提供
推理成本 已經(jīng)成為可持續(xù) AI 部署的最大障礙。最近,GitHub放棄 了其 Copilot 訂閱的統(tǒng)一費(fèi)率,轉(zhuǎn)而采用基于使用的計(jì)費(fèi)方式,因?yàn)榇砭幋a會話的成本超出了固定月費(fèi)能夠覆蓋的范圍——一些訂閱者醒來時發(fā)現(xiàn),他們的賬單比之前高出數(shù)倍。與此同時,在短短四個月內(nèi),Uber 就燒光了 2026 年整年的 AI 預(yù)算,主要是在 Claude Code 上。這讓首席運(yùn)營官產(chǎn)生了質(zhì)疑,他們所獲得的回報(bào)是否值得這筆支出。
為應(yīng)對這一更廣泛的行業(yè)反思,Linux 基金會成立了 Tokenomics 基金會, 得到了谷歌、微軟、IBM、Salesforce 等企業(yè)的支持。該基金會旨在圍繞 AI Token 成本建立一個開放的標(biāo)準(zhǔn)。這一舉措表明,業(yè)界已經(jīng)意識到,企業(yè)目前尚無統(tǒng)一的方法來衡量或控制這方面的支出。
轉(zhuǎn) 型
對于大量運(yùn)行 AI 代理的公司來說,前沿模型的經(jīng)濟(jì)性已經(jīng)成為一個幾乎關(guān)乎生存的問題。
Flo Crivello(前 Uber 工程師兼產(chǎn)品負(fù)責(zé)人)是 Lindy 的創(chuàng)始人兼首席執(zhí)行官。Lindy 是一個無代碼 AI 代理平臺,可以自動化日常工作任務(wù)——從電子郵件分類和會議安排到 CRM 管理。作為 Teamflow 的轉(zhuǎn)型舉措,Crivello 在 2023 年創(chuàng)立了 Lindy。前者是一個他之前籌集了 5200 萬美元 的資金創(chuàng)辦的一家虛擬辦公室初創(chuàng)公司。這些資本現(xiàn)在被用于支持 Lindy 的發(fā)展。
![]()
Lindy
上周,Crivello 在社交媒體上 宣布,Lindy 已經(jīng)將其整個模型基礎(chǔ)設(shè)施從 Anthropic 切換到了 DeepSeek。
Crivello 在 X 上寫道,“今天我們扣動了扳機(jī),將 100% 的 Lindy 流量從 Anthropic 模型切換到了 DeepSeek v4。這每年能為我們節(jié)省數(shù)百萬美元,而且,我們在許多核心用例上看到了性能提升。對業(yè)務(wù)來說,這是變革性的。”
實(shí)際上,Crivello 早在幾個月前就 暗示過他的意圖。4 月份的時候,他曾經(jīng) 在 X 上寫道,推理是 Lindy 占比最高的單項(xiàng)支出(超過了工資單),并且只用了一年時間,開源大模型就從“遠(yuǎn)不及閉源模型”發(fā)展到了“在大多數(shù)使用場景中都躋身前沿水平”。他說,當(dāng)時 Lindy 差點(diǎn)將 Kimi K2.5(來自中國 AI 公司 Moonshot AI 的一個模型)作為其默認(rèn)設(shè)置,不過后來他們轉(zhuǎn)向了總部位于北京的 Zhipu AI 開發(fā)的 GLM-5.1。
最終,這家公司選擇了 DeepSeek v4,這是中國 AI 研究公司 DeepSeek 的一個旗艦開源模型。
當(dāng)然,在全面投入生產(chǎn)的情況下從一家模型供應(yīng)商切換到另一家絕非易事。Crivello 告訴 The New Stack,完成這一過程所需的時間取決于從何時開始計(jì)算。但無論如何,這都是一項(xiàng)艱巨的任務(wù)。
Crivello 解釋道,“我們一直在考慮進(jìn)行這次轉(zhuǎn)型,并評估新的開源軟件(OSS)方案已有 6 到 9 個月的時間,而 DeepSeek 自發(fā)布以來,我們也一直在關(guān)注它,大約有 2 個月了”。
值得注意的是,遷移工作比 Crivello 最初的預(yù)期要繁重許多。他說,“比我們想象的工作要多 100 倍”。評估(在現(xiàn)實(shí)世界的任務(wù)中系統(tǒng)性地測試新模型,驗(yàn)證它能否媲美甚或超過 Anthropic 模型的性能)是其中的一個重要部分。
![]()
Flo Crivello,Lindy 創(chuàng)始人兼首席執(zhí)行官
Crivello 說,“模型評估的工作量很大,包括在線評估、離線評估,還有大量‘氛圍評估’。[隨后我們] 分階段上線了在線評估,同時觀察其對用戶留存率的影響;[接著] 針對新模型調(diào)整了提示詞。”
僅看成本節(jié)省這一項(xiàng),還不足以證明這項(xiàng)工作的合理性。但性能結(jié)果給了 Crivello 更多的信心,特別是在其核心用例上,包括電子郵件收件箱分類和根據(jù)用戶的反饋預(yù)先起草回復(fù)。
Crivello 解釋說,“正是在那些任務(wù)中,我們看到了 DeepSeek 所帶來的驚人的性能提升。”不過他也指出,在一些復(fù)雜的自動化任務(wù)上,DeepSeek 仍然落后于 Anthropic。
他說,“在工作流自動化方面,它仍然不如 Sonnet,不過,這對我們來說并不重要。”
DeepSeek 時刻
要理解 Lindy 的轉(zhuǎn)型為何如此重要,了解 DeepSeek 在 AI 行業(yè)中所代表的意義會有所幫助。
2025 年 1 月,DeepSeek 公司在硅谷引起了軒然大波:其 R1 模型以極低的成本達(dá)到了與美國頂尖前沿模型相當(dāng)?shù)男阅芩健_@使得英偉達(dá)的股價出現(xiàn)了 一輪短暫但劇烈的拋售,投資者開始質(zhì)疑關(guān)于 AI 計(jì)算需求的基本假設(shè)。此后,該公司接連發(fā)布新產(chǎn)品,不斷縮小與前沿領(lǐng)域的差距。
2026 年 4 月發(fā)布的 DeepSeek V4 預(yù)覽版 標(biāo)志著又一次重大飛躍,而且不僅僅體現(xiàn)在價格上。在 LinkedIn 上,瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)教授、EPFL 人工智能中心聯(lián)合主任 Marcel Salathe 指出,從地緣政治的角度來看,V4 有著更深遠(yuǎn)的意義:這是首次出現(xiàn)從芯片、框架到模型完全由中國自主研發(fā)的尖端 AI 技術(shù)棧。據(jù)悉,DeepSeek 耗時數(shù)月重寫了 v4 版本,使其能在 CANN(華為版 Nvidia CUDA)上運(yùn)行,從而 降低了對美國芯片基礎(chǔ)設(shè)施的依賴。
這種地緣政治格局的轉(zhuǎn)變帶來了直接的商業(yè)影響。正如 The New Stack 此前報(bào)道 的那樣,以中國人工智能實(shí)驗(yàn)室為主的廉價開放權(quán)重模型的出現(xiàn),將 AI 模型市場一分為二:一端是 OpenAI 和 Anthropic 等公司推出的超高端前沿模型,另一端則是價格大幅降低的開放權(quán)重替代方案,而原本舒適的中間地帶正在逐漸萎縮。數(shù)據(jù)印證了這一趨勢:作為連接應(yīng)用程序與 AI 服務(wù)提供商的中介平臺,Vercel 的 AI Gateway 數(shù)據(jù)顯示,DeepSeek 在 5 月單月內(nèi)的 Token 交易量份額從不足 1% 躍升至 17%,而其實(shí)際支出份額仍維持在 1% 左右,這恰恰反映出這些 Token 的實(shí)際成本有多么低廉。
對于像 Lindy 這樣大規(guī)模運(yùn)行代理的公司而言,這種兩極分化迫使他們不得不認(rèn)真思考該選擇哪種商業(yè)模式。對于 Lindy 的創(chuàng)始人來說,由于推理成本已經(jīng)超過薪資支出,這個問題其實(shí)只是時間早晚的問題。
Lindy 最終選擇了 Atlas Cloud——這家總部位于美國的推理服務(wù)提供商在美國本土托管 DeepSeek v4 模型。鑒于圍繞中國開發(fā)模型的數(shù)據(jù)主權(quán)問題往往備受關(guān)注,這一點(diǎn)尤為重要。在回應(yīng) X 平臺上一位評論者 的提問時,Crivello 直接談及了此事。他指出,該模型由一家美國服務(wù)商在美國境內(nèi)托管,并且在評估了“所有主要供應(yīng)商”后,Atlas脫穎而出。值得一提的是,自主托管從未被列入他們的考慮范圍。
他說,“我們沒有認(rèn)真考慮過[自托管],不,那看起來會分散我們很大的注意力。”
發(fā)展前景和未來計(jì)劃
雖然 Crivello 表示,此次轉(zhuǎn)型最終為 Lindy 節(jié)省了數(shù)百萬美元,但對于一家風(fēng)險投資支持的公司來說,這對其發(fā)展前景的影響非常深遠(yuǎn)。
但具體有多少呢?Crivello 說,”很多“。
至于這一舉措是否是永久性的,Crivello 并沒有明確表態(tài)。他說,“世上沒有什么是永恒的。如果 Anthropic 的下一次發(fā)布能讓他們重新贏得我們的業(yè)務(wù),我也不會感到驚訝,但他們需要大幅降價。”
同樣值得注意的是,Lindy 仍然是 Anthropic 的客戶,只是不是其核心產(chǎn)品。該公司仍然在內(nèi)部使用 Claude,因?yàn)橛嗛喎桨傅慕?jīng)濟(jì)性使其變得可行。
Crivello 說,“我們內(nèi)部使用的是 Max plan。如果沒有它,那么我們就必須支付完整的 Token 價格,要是這樣的話,我們會轉(zhuǎn)向其他東西”。
關(guān)于 Lindy 最終是否可能被迫在其外部產(chǎn)品中重新采用 Anthropic 模型,在回應(yīng) Amp CEO 兼創(chuàng)始人 Quinn Slack 的 問題 時,Crivello 暗示這并非完全不可能。他 寫道,“當(dāng)我們檢測到 Lindy 在任務(wù)中失敗時,我們可能仍然會升級到 Opus,但那將是少數(shù)情況。”
Crivello 的觀點(diǎn)是,像 Lindy 這樣的公司(大型 Token 消費(fèi)者)別無選擇,只能采取行動。他說,“像我們這樣在 Token 上花很多錢的公司,100% 要行動。不這么做將是不負(fù)責(zé)任的。其他公司要看具體情況,但我認(rèn)為很多人只是認(rèn)品牌。”
https://thenewstack.io/lindy-deepseek-anthropic-switch/
聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。
會議推薦
AICon 上海站 4 大核心看點(diǎn):Keynote 前瞻洞見、Agent 工程化專題拆解、前沿技術(shù) + 產(chǎn)業(yè)落地全覆蓋,Google Cloud 專家實(shí)操帶練。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 13269078023 進(jìn)行咨詢。
今日薦文
![]()
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.