![]()
如今,每個(gè)人都感覺(jué) AI “ 特別厲害 ”、“ 特別有用 ”。
但實(shí)際上,我們應(yīng)該警惕一件事:AI 產(chǎn)品很容易給工作帶來(lái)一種 “ 虛假的生產(chǎn)力膨脹 ” 。
在開(kāi)發(fā)者群體中,AI 編程已經(jīng)有了很高的采用率。比如據(jù) IDC 2025 年 6 月發(fā)布的《 中國(guó)市場(chǎng)代碼生成產(chǎn)品評(píng)估,1H25 》,彼時(shí)美國(guó)已有 91% 的開(kāi)發(fā)者使用 AI 工具,而中國(guó)開(kāi)發(fā)者的 AI 覆蓋率在 30% 。
但另一方面,有一個(gè)核心指標(biāo)卻鮮被提及,這個(gè)指標(biāo)其實(shí)更加接近個(gè)人和企業(yè)是否接受 AI 的核心目標(biāo),也就是 ROI 的提升。
這個(gè)指標(biāo)叫采納率。
采納率是指,AI 生成的所有內(nèi)容中,人類(lèi)最終采納的內(nèi)容量的比例。比如 AI 生成了 1000 行代碼,人類(lèi)采納了其中 300 行,那采納率就是 30% 。
對(duì)內(nèi)容量的量化方式可以有很多種,可以是最精細(xì)的 Token 級(jí)別,可以是代碼行數(shù),也可以是程序員在使用 AI IDE 時(shí) Tab 鍵采納數(shù)的占比,甚至是代碼庫(kù)中由 AI 生成的功能模塊數(shù)的占比等等。
比如,基于 Zoominfo 2024 年 11-12 月的內(nèi)部調(diào)研顯示( 團(tuán)隊(duì)涉及 400 多名開(kāi)發(fā)者 ),他們對(duì) GitHub Copilot 生成的代碼的平均采納率為 20%( 按接受代碼行數(shù)衡量 )。
![]()
圖源:https://arxiv.org/abs/2501.13282
基于 SoftDoc 2025 年上半年的內(nèi)部調(diào)研顯示,該公司的 AI 生成代碼建議被接受比例在 13% 到 21% 之間( 按接受代碼行數(shù)衡量 )。
![]()
圖源:https://softdocs.com/blog/measuring-generative-ai-coding-adoption-in-softdocs-engineering
最新數(shù)據(jù)由 DX AI 提供,他們發(fā)布的《 AI-assisted engineering: Q4 impact report 》( 對(duì) 13.5 萬(wàn)多名開(kāi)發(fā)人員的分析 )顯示,合并代碼中有 22% 是由 AI 編寫(xiě)的。
所以,按照目前公開(kāi)數(shù)據(jù)顯示,雖然從 24 年至今大家覺(jué)得 AI 一直在變強(qiáng),但 AI 編程工具的輸出采納率總體還是偏低的,在 20% 左右。
并且,目前關(guān)于 AI 輸出采納率的相關(guān)數(shù)據(jù)極少。
知危接觸并詢(xún)問(wèn)國(guó)內(nèi)一些大模型廠商的工作人員,未能得到相關(guān)數(shù)據(jù)。并且不管是使用方還是供應(yīng)商,都認(rèn)為這個(gè)指標(biāo)是不容易衡量和獲取的。
這一點(diǎn)不難理解,如果每一個(gè)用戶(hù)都回顧一下自己長(zhǎng)期使用 AI 的經(jīng)歷,肯定能感受到自己在很多場(chǎng)景下對(duì) AI 輸出的采納率其實(shí)并不高,但 AI 即時(shí)反饋的特性、類(lèi)似抽盲盒的體驗(yàn)簡(jiǎn)直讓人上癮,使得人們醉心于跟 AI 來(lái)回糾纏或大量抽卡,很難注意到實(shí)際采納率。
至此,AI 輸出內(nèi)容的采納率實(shí)際上成了 “ 房間里的大象 ” 一般的存在,它很重要且不容忽視,但由于大家對(duì) AI 的狂熱,人們選擇性的忽視掉了這個(gè)問(wèn)題。
![]()
AI 產(chǎn)品設(shè)計(jì)師 John 告訴知危,“ AI 輸出采納率是需要被行業(yè)重視的,因?yàn)楝F(xiàn)在網(wǎng)絡(luò)充斥著大量 AI 生成的低質(zhì)量?jī)?nèi)容,很多發(fā)布者不關(guān)心內(nèi)容是否對(duì)用戶(hù)有價(jià)值。但 ‘ 是否提供價(jià)值 ’ 應(yīng)該是所有產(chǎn)品需要面對(duì)的問(wèn)題,也包括 AI 產(chǎn)品。”
“ 如果繼續(xù)靠點(diǎn)贊、點(diǎn)踩這種方式,本身的邊際效益已經(jīng)很低,在現(xiàn)有的 AI 產(chǎn)品交互方式下,用戶(hù)很少去做這種反饋。”
John 認(rèn)為,采納率指標(biāo)對(duì)衡量 AI 賦能程度、采用 AI 的實(shí)際 ROI、資源浪費(fèi)程度、合理使用 AI 的重要性非常高,“ 并且不僅是采納率本身,更是要在意定義 ‘ 采納 ’ 的邏輯,即 ‘ 我因?yàn)槭裁炊X(jué)得這個(gè)結(jié)果有用 ’。”
“AI 產(chǎn)品很容易給工作帶來(lái)虛假的生產(chǎn)力膨脹,無(wú)論是因?yàn)榇蟓h(huán)境的 FOMO,還是因?yàn)檫^(guò)于放任 AI 自主執(zhí)行導(dǎo)致項(xiàng)目失控的沉默成本,有許多的 ‘ 采納 ’ 其實(shí)是個(gè)體為了迎合自己的某種情緒而做的,或是為了 ‘ 采納的結(jié)果 ’ 而制造出來(lái)的問(wèn)題。做的越多一定會(huì)產(chǎn)生更多要解決的問(wèn)題,不想清楚的話(huà)就會(huì)在解決這些新問(wèn)題的 ‘ 動(dòng)作 ’ 里麻痹自己。”
當(dāng)然,采納率指標(biāo)本身不能直接代表最終的目標(biāo),“ 單從采納率這一個(gè)角度很容易迎合越來(lái)越多的 ‘ 生產(chǎn)力似乎提升了 ’( 采納高 ),但是人越來(lái)越忙且沒(méi)真正帶來(lái)什么改變。這時(shí),實(shí)際 ROI 和資源浪費(fèi)程度等指標(biāo)就是一些很重要的客觀補(bǔ)充視角。”
對(duì)于 AI 產(chǎn)品企業(yè)而言,需要更多意識(shí)到,采納率最終會(huì)極大影響用戶(hù)付費(fèi)意愿。
“ 我經(jīng)常對(duì)某知名通用型 Agent 產(chǎn)品有一個(gè)評(píng)價(jià):如果它的 Token 價(jià)格能便宜 10 倍,它其實(shí)有機(jī)會(huì)成為團(tuán)隊(duì)內(nèi)部做 Web Demo 的主流工具。”
“ 當(dāng)然這句話(huà)還需要加很多前置定語(yǔ),除了成本太高,它在使用過(guò)程中也需要大量試錯(cuò),采納率低,而這些消耗其實(shí)和最終的交付物并不直接相關(guān),更多是Debug、潛在的網(wǎng)絡(luò)崩潰等問(wèn)題。”
“ 對(duì)于很多個(gè)人項(xiàng)目而言,它們往往是個(gè)人對(duì)現(xiàn)有的解決方案有些不滿(mǎn)的地方,想要做出一個(gè)完美適配自己使用需求的體驗(yàn)。但這些 ‘ 不滿(mǎn)的地方 ’ 往往沒(méi)有那么疼,價(jià)值有限。尤其是假設(shè)我們把這種場(chǎng)景從小部分懂技術(shù)的極客推向大眾的時(shí)候( 所謂用動(dòng)態(tài)定制 App 代替?zhèn)鹘y(tǒng)靜態(tài) App),Vibe Coding 所帶來(lái)的不確定終點(diǎn)的 Token 投入 ( 產(chǎn)品往往都沒(méi)有一個(gè)預(yù)算估計(jì),可能上百美元 )、潛在的時(shí)間與情緒投入,很容易就讓人放棄個(gè)人的小需求,向現(xiàn)有產(chǎn)品妥協(xié)。”
另一方面,從模型角度,采納率取決于模型在上限和下限的突破。宣傳上大家一般更強(qiáng)調(diào)上限,但保證了下限才能讓模型真正成為生產(chǎn)力,這其中的典型是代碼生成領(lǐng)域的 Claude,圖像生成領(lǐng)域的 Nano Banana,以及視頻生成領(lǐng)域的 Seedance 2.0,實(shí)際上這幾款模型也是用戶(hù)付費(fèi)意愿在第一梯隊(duì)的。
John補(bǔ)充道,“這里需要?jiǎng)澐謩趧?wù)型(Labor Work)產(chǎn)品和信息型( Informative ) 產(chǎn)品。對(duì)于勞務(wù)型產(chǎn)品,比如編程類(lèi) Agent,穩(wěn)定性和可用性肯定是最基本的決定因素。我不可能為了一個(gè)不穩(wěn)定的產(chǎn)品付費(fèi)或者時(shí)間。”
“ 對(duì)于信息型的產(chǎn)品,比如問(wèn)答或 AI 搜索,我是可以接受不穩(wěn)定但可能會(huì)有極限表現(xiàn)的產(chǎn)品的,雖然不一定會(huì)付費(fèi),但因?yàn)椴幌駝趧?wù)型產(chǎn)品一個(gè)方向只用一款,信息型我永遠(yuǎn)會(huì)用好幾個(gè)產(chǎn)品來(lái)豐富視角和信源。所以我會(huì)把這樣的產(chǎn)品盡可能加到我的‘信息池’里,不采納也沒(méi)關(guān)系。”
下文中,知危也將展示從不同企業(yè)零星地獲得的一些相關(guān)數(shù)據(jù),這些數(shù)據(jù)和上述公開(kāi)數(shù)據(jù)相去甚遠(yuǎn),或偏高或偏低,或者只能定性描述,卻也值得注意。畢竟大模型發(fā)展太快,一個(gè)驗(yàn)證可行的場(chǎng)景真正的核心影響因素也還沒(méi)被探索明白,以及還有大量未被驗(yàn)證的場(chǎng)景。
![]()
在個(gè)體體感上來(lái)講,一名字節(jié)員工程磊( 化名 )告訴知危,其用 AI 寫(xiě)代碼的采納率基本上是 100%,即便有些微不足,也會(huì)用 Agent 來(lái)修改,“ 今年年后我已經(jīng)沒(méi)有印象自己親手寫(xiě)過(guò)代碼了。”
在程磊看來(lái),采納率本質(zhì)上依賴(lài)模型能力,另外也取決于公司( 或員工自己 )肯不肯給員工花錢(qián)用最新最可靠的模型來(lái)完成任務(wù),“ 我現(xiàn)在用的模型是 Claude Opus 4.6 + GLM5 + Kimi2.5,都是最新的、最貴的,會(huì)用在所有寫(xiě)代碼場(chǎng)景。當(dāng)然目前 AI 的視覺(jué)模態(tài)還不行,比如無(wú)法準(zhǔn)確地操作和測(cè)試 GUI。” 而從當(dāng)前行業(yè)更一般的認(rèn)知看來(lái),采納率的主要影響因素不只是模型能力本身,還有企業(yè)的流程成熟度、信息化基礎(chǔ)、管理模式等。
白鯨開(kāi)源 CEO 郭煒則配合知危對(duì)公司內(nèi)部員工使用 AI 編程的采納率做了初步的調(diào)查,其中使用場(chǎng)景分為問(wèn)答和 Agent。
數(shù)據(jù)顯示,對(duì)于問(wèn)答場(chǎng)景,主要使用 ChatGPT,調(diào)用失敗率幾乎為零,低復(fù)雜場(chǎng)景下 AI 輸出采納率( 只看答案是否帶來(lái)信息增益 )接近 100%,中等復(fù)雜場(chǎng)景約 80%,高復(fù)雜場(chǎng)景約 60%,其中,三種復(fù)雜度場(chǎng)景的任務(wù)量占比為 1:7:2 。
![]()
郭煒表示,“ 問(wèn)答場(chǎng)景還是簡(jiǎn)單的,一般是問(wèn)產(chǎn)品相關(guān)問(wèn)題以及寫(xiě)文章等場(chǎng)景,不要求結(jié)果,給我一些提示,我做就行。”
對(duì)于 Agent 場(chǎng)景,主要使用 Claude Code,并且會(huì)有一定的調(diào)用失敗率,低復(fù)雜場(chǎng)景( 比如算法題、日志清洗、爬蟲(chóng)、API 封裝等 )為5%,中等復(fù)雜場(chǎng)景( 比如用戶(hù)系統(tǒng)、風(fēng)控規(guī)則、緩存優(yōu)化等 )為 10%,高復(fù)雜場(chǎng)景( 比如分布式數(shù)據(jù)庫(kù)、云平臺(tái)、模型訓(xùn)練等 )為 20%;低復(fù)雜場(chǎng)景下 AI 輸出采納率( 基于接受代碼行數(shù) )也是接近 100%,中等復(fù)雜場(chǎng)景約 80%,高復(fù)雜場(chǎng)景約 50%,其中,三種復(fù)雜度場(chǎng)景的任務(wù)量占比為 2:3:5 。
![]()
“ 場(chǎng)景越復(fù)雜,采納率越低,一般是因?yàn)楦邚?fù)雜場(chǎng)景下 AI 對(duì)需求的理解不夠到位。要提升采納率,相關(guān)經(jīng)驗(yàn)已經(jīng)很多,例如寫(xiě)好 Code Wiki、用好 Plan 模式等。”
“我們也很重視采納率這個(gè)指標(biāo),但重視不是因?yàn)殄X(qián),因?yàn)椴杉{率低太浪費(fèi)時(shí)間,要用 AI 寫(xiě)代碼,就用全球最好的模型。對(duì)我們而言,時(shí)間比 Token 更值錢(qián)。”
“ 我們的 Agent 執(zhí)行有較大量的高復(fù)雜場(chǎng)景,但要讓 Agent 改代碼很難,一般還是人來(lái)改。也可以讓 AI 改,但需要掰開(kāi)了揉碎了給 AI 講,這個(gè)過(guò)程不容易,我們大概有 400 多萬(wàn)行代碼,目前的 AI 上下文長(zhǎng)度還是不太夠用。”
至于更通用的 Agent,通過(guò)一個(gè)月的深度使用 OpenClaw,游戲制作人王鯨對(duì)龍蝦在游戲開(kāi)發(fā)的相關(guān)任務(wù)( 比如辦公、開(kāi)發(fā)、數(shù)據(jù)分析、咨詢(xún)等 )的采納率也有較深的體會(huì)。
不過(guò)在實(shí)際輸出結(jié)果前,龍蝦首先讓人頭疼的是較嚴(yán)重的執(zhí)行失敗問(wèn)題。
王鯨表示,“ 龍蝦還是比較經(jīng)常翻車(chē)的,問(wèn)題有大有小。其中比較嚴(yán)重的是讓龍蝦去做和網(wǎng)關(guān)、基礎(chǔ)配置相關(guān)的工作,它會(huì)信誓旦旦給你保證執(zhí)行順利,但其實(shí)只是膽子大,實(shí)際上經(jīng)常把自己配死。比如一個(gè)簡(jiǎn)單的增加新模型的操作,切換模型堪比機(jī)器人給自己換電池,拆下電池的那一刻它就死了( 斷網(wǎng) )。在配置文件這塊,很多Agent會(huì)調(diào)用一個(gè)文件,但彼此之間如果沒(méi)有很好調(diào)和(或溝通),容易把文件改壞。”
“ 記憶也存在調(diào)用問(wèn)題,即便是人工強(qiáng)調(diào)過(guò),也有可能因?yàn)闆](méi)有調(diào)用記憶,然后犯下重復(fù)執(zhí)行的錯(cuò)誤。”
當(dāng)然王鯨也認(rèn)為,既然要用,就盡量授權(quán)都給龍蝦,這樣才能正常工作,“ 而且像飛書(shū)插件這種授權(quán)帶時(shí)效性的,還需要經(jīng)常手動(dòng)檢查授權(quán)。”
“ 但為了安全,一定要在虛擬機(jī)中使用。我自己使用的是兩層虛擬機(jī)也就是虛擬機(jī)里的虛擬機(jī),來(lái)保障安全。龍蝦的潛在風(fēng)險(xiǎn)還是很高的,即便不提黑客的問(wèn)題,它也是拿著刀的猴子,可以砍椰子,但是誰(shuí)知道什么時(shí)候會(huì)不小心砍到人。”
“ 幻覺(jué)是必然存在的,當(dāng)它說(shuō)自己沒(méi)有辦法 ‘ 看 ’ 網(wǎng)頁(yè)的時(shí)候,只要告訴它 ‘ 你自帶一個(gè)瀏覽器 ’,就能解決很多問(wèn)題。最后就是記得留各種幫助文檔,讓龍蝦操作之前去讀一下。”
雖然使用龍蝦的起步有各種阻礙,但工作流跑通以后,采納率還是挺高的,整體能達(dá)到七成。
“ 為什么采納率高呢?一般我會(huì)把需求說(shuō)清楚,比如詳細(xì)說(shuō)明格式要求,把偏好和原則都記下來(lái),龍蝦會(huì)記住,發(fā)現(xiàn)問(wèn)題馬上指出,龍蝦會(huì)改進(jìn)。”
“如果從 ROI 的角度看,龍蝦的高 ROI 場(chǎng)景主要是辦公場(chǎng)景,比如飛書(shū)群消息統(tǒng)計(jì)/群秘書(shū)、周報(bào)匯總整理、AI 公司團(tuán)隊(duì)( 創(chuàng)建多個(gè) AI 員工分工協(xié)作 )、飛書(shū)文檔批量處理、日程/任務(wù)管理、PM 項(xiàng)目管理助手等,能把 1-2 小時(shí)的工作時(shí)長(zhǎng)壓縮到分鐘級(jí),強(qiáng)烈推薦落地;中 ROI 場(chǎng)景主要是開(kāi)發(fā)分析類(lèi),比如網(wǎng)頁(yè)生成、代碼片段生成、數(shù)據(jù)查詢(xún)分析/透視,可用但有局限;低 ROI 場(chǎng)景比如復(fù)雜工作流編排,出錯(cuò)后處理復(fù)雜,維護(hù)麻煩,還有瀏覽器自動(dòng)操作,只能查看頁(yè)面,無(wú)法真正操作,這些都不推薦落地。
“ 龍蝦最適合的場(chǎng)景有這些特性:文件/數(shù)據(jù)密集、重復(fù)性、本地集成、異步執(zhí)行( 接受分鐘級(jí)延遲 )等,而需要秒級(jí)響應(yīng)、復(fù)雜UI操作、調(diào)用多個(gè)外部 API 的復(fù)雜流程、大量主觀判斷的場(chǎng)景則不適合龍蝦。”
![]()
王鯨總結(jié)道,“ 綜合來(lái)說(shuō),我現(xiàn)在把龍蝦當(dāng)做我的 AI 分身加入了公司,進(jìn)入項(xiàng)目當(dāng) PM、秘書(shū)以及執(zhí)行策劃,極大節(jié)省了我個(gè)人的精力。并且在人際關(guān)系處理上,因?yàn)?AI 給人的刻板印象就是會(huì)得罪人的,所以很多流程化的、不講人情的公式化要求,可以讓 AI 替自己唱黑臉。”
相對(duì)于標(biāo)準(zhǔn)化程度高的開(kāi)發(fā)、辦公領(lǐng)域,由于主觀性和創(chuàng)意要求高,設(shè)計(jì)領(lǐng)域的 AI 輸出采納率特點(diǎn)呈現(xiàn)出極大的不同。
接下來(lái),我們將跟隨 John 的視角,來(lái)看看在產(chǎn)品設(shè)計(jì)領(lǐng)域的不同場(chǎng)景下,AI 輸出的采納率的現(xiàn)狀和特點(diǎn),由于在該領(lǐng)域很難像代碼一樣進(jìn)行簡(jiǎn)單快速的采納率統(tǒng)計(jì),所以這部分大多是主觀或者體感上的描述,但我們認(rèn)為依舊很有價(jià)值,值得分享。
![]()
首先要清楚一點(diǎn),要在各種場(chǎng)景把采納率量化是很難的事情,比如基于代碼行數(shù)的量化指標(biāo)肯定不適用于產(chǎn)品設(shè)計(jì)領(lǐng)域。
John 表示,“ 采納率不好清晰定義,因?yàn)楹茈y將內(nèi)容顆粒度拆得很細(xì)來(lái)衡量,畢竟你很難把 AI 的一個(gè)輸出一刀切分,說(shuō)這一部分全部是 AI 生成的,那一部分完全不是。目前只能定性描述為主。”
要更精確理解工作場(chǎng)景的采納率情況,可以先以生活場(chǎng)景為參考。AI 在生活場(chǎng)景中的應(yīng)用和搜索引擎沒(méi)太大區(qū)別,目前落地是比較成熟的。
“ 在生活場(chǎng)景中,AI 基本只有一類(lèi)使用方式,就是信息查詢(xún),一般是查詢(xún)比較簡(jiǎn)單的事實(shí)型信息。”
“ 比如挑選男性維生素的時(shí)候,會(huì)提問(wèn):應(yīng)該注意配料表里的哪些成分?但一般不應(yīng)該直接將 AI 提供的結(jié)果拿來(lái)用,而是把它當(dāng)作一個(gè)搜索或了解問(wèn)題的起點(diǎn)。”
“ 模型在回答中通常會(huì)提到一些關(guān)鍵詞,我會(huì)先評(píng)估這些關(guān)鍵詞或者整段描述的可信度,再通過(guò)搜索引擎做一次 Double Check。在 Double Check 之后,如果覺(jué)得基本是正確的,就會(huì)采納這些信息。”
“ 總體來(lái)說(shuō),目前這個(gè)場(chǎng)景下幻覺(jué)率已經(jīng)相對(duì)比較低,尤其是在非常具體的事實(shí)型問(wèn)題上,采納率其實(shí)是比較高的。”
“ 這里說(shuō)的 ‘ 采納 ’,是指我會(huì)把這些信息記在腦子里,比如知道男性維生素在配料上可能需要注意什么,之后在實(shí)際購(gòu)買(mǎi)時(shí),會(huì)刻意去注意這些信息。” 由于 AI 反饋有即時(shí)性,這就催生了一個(gè)很重要的新場(chǎng)景,就是靈感探索,這是傳統(tǒng)搜索引擎無(wú)法很好支持的。
“ 如果涉及到一些比較主觀的問(wèn)題,夾雜在工作和生活之間比如創(chuàng)意相關(guān)的場(chǎng)景,我對(duì) AI 的用法是:要的不是輸出,而是輸入。”
“ 我會(huì)把和AI一來(lái)一回對(duì)話(huà)的過(guò)程當(dāng)成一種 ‘ 思考實(shí)驗(yàn) ’。”
“ 比如我會(huì)先描述一個(gè)問(wèn)題或想法,看它怎么回應(yīng),再反復(fù)重啟這輪對(duì)話(huà),不斷修改 Prompt,逐漸逼近我要表達(dá)的東西。前幾輪輸出的結(jié)果哪怕很差,我也能接受。”
“ 一般平均情況下,可能需要輸入 10 輪才能得到自己想要的結(jié)果。之所以會(huì)超過(guò) 10 輪,是因?yàn)橄敕ㄒ婚_(kāi)始是很模糊的,而討論過(guò)程中又會(huì)不斷產(chǎn)生新的點(diǎn)。有時(shí)候我會(huì)發(fā)現(xiàn)一些自己之前完全沒(méi)有想到的東西。這是在對(duì)話(huà)中被激發(fā)出來(lái)的。但當(dāng)這些新的點(diǎn)加入之后,又會(huì)產(chǎn)生新的模糊之處,所以這個(gè)過(guò)程會(huì)不斷延伸。”
“ 直到我把 Prompt 修改到一個(gè)程度,使得 AI 的回答足夠接近我真正想表達(dá)的東西,說(shuō)明我對(duì)這個(gè)問(wèn)題或想法已經(jīng)想得足夠清楚,表達(dá)也足夠準(zhǔn)確。”
“ 這時(shí)我其實(shí)也不會(huì)去用它給出的答案,只會(huì)拿走最后寫(xiě)出來(lái)的 Prompt,一般來(lái)說(shuō),這個(gè) Prompt 會(huì)分成兩部分:一部分是我想要什么,另一部分是怎么驗(yàn)收它。然后,用畫(huà)圖、原型設(shè)計(jì)、用戶(hù)調(diào)研等方式來(lái)實(shí)現(xiàn)我的想法。”
“ 至于AI給我的那些具體建議,比如AI可能說(shuō) ‘ 基于我們剛才討論的內(nèi)容,你可以這樣設(shè)計(jì),或者在這個(gè)界面上做這樣的調(diào)整 ’,這些我基本不看。”
“ 所以在這種場(chǎng)景下,如果說(shuō)的是 ‘ 結(jié)果的采納率 ’,那基本是 0。不過(guò)這種場(chǎng)景在創(chuàng)意工作的使用頻率非常高。”
事實(shí)查詢(xún)和靈感探索可以說(shuō)是 AI 場(chǎng)景的兩個(gè)相反的端點(diǎn),也就呈現(xiàn)出采納率的極大區(qū)別,“ 總體來(lái)說(shuō),信息越 ‘ 薄 ’ ,也就是越簡(jiǎn)單、越偏事實(shí)型的內(nèi)容,采納率就會(huì)越高;越主觀的內(nèi)容,采納率就會(huì)更低。”
John 對(duì) AI 的采納相比普通用戶(hù)是克制很多的,因?yàn)樵谒磥?lái),大語(yǔ)言模型生成的內(nèi)容本質(zhì)上只是一種觀點(diǎn),是對(duì)很多觀點(diǎn)的一種抽象總結(jié),而不是真理,“ 我從來(lái)不會(huì)把它當(dāng)成一種 ‘ 真理機(jī) ’,不會(huì)覺(jué)得它說(shuō)出來(lái)的東西天然就是對(duì)的。對(duì)我來(lái)說(shuō),它更像是一種非常廉價(jià)地獲取一個(gè)視角的方式。”
降低期待其實(shí)更有利于提升采納率,很多 AI 輸出未被采納,除了技術(shù)問(wèn)題,也經(jīng)常和使用方式不當(dāng)或者期待過(guò)高有關(guān),“ 用戶(hù)對(duì)大模型理解越少,反而期待越高。尤其是如果把它當(dāng)成一種 ‘ 真理機(jī) ’,也就是 ‘ 一次提問(wèn)就能把答案完善地給出來(lái) ’,就很容易出現(xiàn)極端的情況:要么全部采納,要么完全不采納,或者直接覺(jué)得它沒(méi)有什么用。”
“ 關(guān)于使用方式不當(dāng),比如在寫(xiě) Prompt 的時(shí)候,其實(shí)很多人自己都沒(méi)有把問(wèn)題想清楚,沒(méi)有經(jīng)歷反復(fù)迭代的過(guò)程。很多時(shí)候他們給出的需求非常抽象,既沒(méi)想清楚要什么,也沒(méi)想清楚怎么驗(yàn)收。這種情況下,其實(shí)很難判斷輸出質(zhì)量,因?yàn)檫B評(píng)價(jià)標(biāo)準(zhǔn)都沒(méi)有。”
“ 寫(xiě) Prompt 還是一種挺難的能力,而且是需要花時(shí)間的,但很多人不太愿意花這個(gè)時(shí)間,他們會(huì)把這件事當(dāng)成一個(gè) One-Shot 的過(guò)程。” “ 即便現(xiàn)在的大模型產(chǎn)品在不斷積累用戶(hù)記憶,也沒(méi)法讓模型很準(zhǔn)確地判斷用戶(hù)意圖,更何況模型還經(jīng)常引用不相關(guān)的記憶。”
“ 還有另外一個(gè)問(wèn)題,是記憶本身解決不了的。”
“現(xiàn)在的 AI 記憶更多是 ‘ 事實(shí)型記憶 ’,而不是 ‘ 行為型記憶 ’,最多是在缺少上下文的時(shí)候,幫用戶(hù)補(bǔ)充一點(diǎn)背景信息。但很多用戶(hù)的問(wèn)題其實(shí)不是缺少背景,而是表達(dá)本身。如果用戶(hù)從一開(kāi)始就說(shuō)不清楚自己的需求,那模型就算記住再多也沒(méi)用。”
“所以,更理想的情況其實(shí)是 ‘ 行為型記憶 ’,比如模型能記住這個(gè)用戶(hù)經(jīng)常會(huì)漏掉什么信息,或者表達(dá)上有哪些習(xí)慣,目前我還不確定哪個(gè)模型具備這種能力。如果沒(méi)有的話(huà),過(guò)度依賴(lài)歷史上下文,反而可能讓體驗(yàn)越來(lái)越差。”
多去探索 AI 生成的新玩法其實(shí)也能提高采納率,“ 這其實(shí)就是探索 AI 產(chǎn)出在一些不同場(chǎng)景的可能性。同樣的內(nèi)容用在不同場(chǎng)合確實(shí)可以發(fā)揮出不同的價(jià)值。比如生成視頻用作內(nèi)容消費(fèi)的采納率,和生成視頻用作用戶(hù)調(diào)研的采納率,可能在前者被淘汰的內(nèi)容可以用在后者場(chǎng)景里。”
“ 對(duì)于近期大火的 Seedance 2.0,我也有一個(gè)比較感興趣的場(chǎng)景:比如 Figma 的交互原型可能都不需要做,只需要準(zhǔn)備幾張關(guān)鍵畫(huà)面,然后讓視頻模型生成一個(gè) ‘ 用戶(hù)在使用這個(gè)產(chǎn)品原型 ’ 的視頻,再把這個(gè)演示視頻拿給別人看。這樣別人看到的是一個(gè)動(dòng)態(tài)的演示過(guò)程,而不是幾張靜態(tài)圖。對(duì)于早期測(cè)試來(lái)說(shuō),這種方式其實(shí)更容易理解。”
“ 尤其是在游戲領(lǐng)域,這種方式可能很有價(jià)值。比如游戲開(kāi)發(fā)里有一個(gè)概念叫 ‘ 垂直切片 ’:開(kāi)發(fā)團(tuán)隊(duì)會(huì)把核心玩法和一個(gè)關(guān)鍵場(chǎng)景做成一個(gè)可玩的版本,然后拿這個(gè)去做融資或者找發(fā)行商。但其實(shí)在更早期階段,很多驗(yàn)證完全可以用視頻來(lái)完成,甚至不需要真正開(kāi)發(fā)。”
“ 我印象特別深的一個(gè)案例是 TikTok 上曾經(jīng)很火的一個(gè)游戲概念叫《 Bird Game 3 》,當(dāng)時(shí)很多短視頻都在傳播,看起來(lái)像一個(gè)真實(shí)存在的游戲,但后來(lái)發(fā)現(xiàn)它根本不存在,只是大家基于一個(gè)梗想象出來(lái)的 ‘ 虛構(gòu)游戲 ’。很多用戶(hù)其實(shí)是在 ‘ 云游戲 ’,看視頻覺(jué)得好笑就會(huì)轉(zhuǎn)發(fā)。這種傳播本身就已經(jīng)驗(yàn)證了這個(gè)游戲創(chuàng)意具有傳播性。對(duì)于現(xiàn)在很多高度依賴(lài)傳播屬性的游戲來(lái)說(shuō),用視頻生成來(lái)做這種早期驗(yàn)證,其實(shí)是一種非常有效的方法。”
如果要再深入到交付階段,則涉及界面設(shè)計(jì)、原型開(kāi)發(fā)等場(chǎng)景。“ 界面設(shè)計(jì)過(guò)程主要涉及圖像素材的生成,采納率大概是 50%,大部分生成的圖像是不可用的。”
“ 至于是否需要做后期修復(fù),很難一概而論。因?yàn)檫@類(lèi)內(nèi)容覆蓋的范圍比較廣,比如在設(shè)計(jì)的不同階段,插圖的需求也不一樣,需要修復(fù)的程度也不同。舉一個(gè)比較具體的例子:如果我讓它生成一個(gè)像素風(fēng)格的 icon,那AI生成的幾乎是永遠(yuǎn)不可用的。因?yàn)橄袼仫L(fēng) icon 的核心是每一個(gè) Pixel 都非常清晰、非常規(guī)則,而模型生成出來(lái)的本質(zhì)上是渲染的一整幅圖,只是 ‘ 看起來(lái)像 ’ 像素風(fēng)。它的邊緣不是真正的像素結(jié)構(gòu)。所以像這種需求,采納率基本就是 0。” “ 我一般會(huì)把 AI 生成的圖拖到 Figma 或 Illustrator 里,再自己重畫(huà)一遍,AI 圖更多是作為一個(gè)參考底板。”
“ 如果是用作演示內(nèi)容的配圖,大概也是 50% 的采納率,比如 Placeholder 型的插圖,只要整體風(fēng)格大體能接受,其實(shí)就可以采納。”
“ 如果是在實(shí)際生產(chǎn)中,已經(jīng)把 AI 整合進(jìn)一個(gè)自動(dòng)化 Workflow ,那生成的內(nèi)容基本都會(huì)被采納。”
“ 當(dāng)然,在生產(chǎn)級(jí)工作中,主要的界面設(shè)計(jì)工具還是 Figma,而圍繞 Figma 的整個(gè)工作流程,目前沒(méi)有任何一個(gè)其它工具能在關(guān)鍵環(huán)節(jié)上做到生產(chǎn)級(jí)別的可用生成,比如設(shè)計(jì)系統(tǒng)、具體界面的設(shè)計(jì)等。”
“有些產(chǎn)品會(huì)號(hào)稱(chēng)可以做設(shè)計(jì)系統(tǒng),也可以自動(dòng)生成界面,能把流程跑通并做到生產(chǎn)級(jí)別。但這些產(chǎn)品往往脫離了 Figma 生態(tài)。對(duì)我來(lái)說(shuō),這其實(shí)沒(méi)有意義,因?yàn)槲易罱K還是要在 Figma 里完成很多后續(xù)工作。它們最多只能在一種情況下有用:對(duì)界面要求不高,或者是讓一個(gè)完全不懂界面設(shè)計(jì)的人快速做出一個(gè) ‘ 看起來(lái)還行 ’ 的頁(yè)面,用來(lái)達(dá)到一個(gè)非常低的基礎(chǔ)標(biāo)準(zhǔn)時(shí)。”
Figma 本身其實(shí)也在逐漸加入一些 AI 或 Agent 功能,比如 “ Figma Make ”,對(duì)此 John 的期待也不高,“ 我基本不用。我會(huì)用的更多還是一些比較傳統(tǒng)的或更接近 Machine Learning 的功能,比如移除背景、向量化功能等( 比如輸入一張普通圖片,輸出一張矢量圖,這樣原本不能修改的圖片就可以修改了 )。”
在界面設(shè)計(jì)以外,有時(shí)候 John 需要把一些想法快速做成原型,比如一個(gè) Web Demo,這樣在和前端、后端溝通時(shí),可以更清楚地表達(dá)視覺(jué)、數(shù)據(jù)關(guān)系等需求,“ 不然僅靠設(shè)計(jì)師的語(yǔ)言,其實(shí)他們很難想象具體是什么樣子。”
“ 如果使用一些通用型 Agent 或代碼類(lèi) IDE 來(lái)實(shí)現(xiàn),采納率是非常高的。”
“ 畢竟我的要求是只要能演示效果,不太在意它是否能上生產(chǎn)環(huán)境,也不太在意代碼質(zhì)量或數(shù)據(jù)安全問(wèn)題。這種原型基本就是一次性的 APP( Disposable APP )。” “ 但會(huì)根據(jù)原型的復(fù)雜程度有所區(qū)別。有的原型需要嘗試很多次,而且迭代結(jié)果不是線(xiàn)性的過(guò)程,只想微調(diào)局部元素卻導(dǎo)致整個(gè)頁(yè)面布局完全改變,這種情況其實(shí)一直都存在,不管用什么 AI 產(chǎn)品。當(dāng)然最終的結(jié)果基本都會(huì)被采納,畢竟要求不高。”
還有一個(gè)比較特殊的場(chǎng)景,要求會(huì)更低一些,就是 John 的個(gè)人項(xiàng)目開(kāi)發(fā),“ 很多時(shí)候是用部署在純本地環(huán)境的模型,這時(shí)不需要考慮數(shù)據(jù)安全問(wèn)題。在這種情況下,和原型開(kāi)發(fā)有一定相似性,對(duì)可靠性的要求也不高,只要能跑起來(lái)就可以。”
“ 比如我會(huì)根據(jù)自己家庭的需求做一個(gè)記賬軟件。因?yàn)槲野l(fā)現(xiàn)市面上的很多記賬軟件,其實(shí)都不能完全滿(mǎn)足我的需求,總是缺一些我需要的功能。”
” 而且,這個(gè)軟件不止我一個(gè)人在用,還需要讓家庭里的其他人也能用,所以把這個(gè)應(yīng)用部署在了自己家的網(wǎng)絡(luò),相當(dāng)于是在內(nèi)網(wǎng)部署一個(gè)小型業(yè)務(wù)系統(tǒng),這種級(jí)別的項(xiàng)目基本上可以完全用 AI ‘ Vibe ’ 出來(lái),我只負(fù)責(zé)提需求。” 在界面設(shè)計(jì)中,AI 的視覺(jué)理解瓶頸目前還很明顯,“ 任何想把設(shè)計(jì)往上提升比如加入風(fēng)格、加入自己對(duì)界面的理解的需求,AI 其實(shí)都做不到。”
“ 主要問(wèn)題是調(diào)整成本非常高。一種情況是,比如只讓它把某個(gè)按鈕往旁邊挪兩個(gè) Pixel,結(jié)果整個(gè)頁(yè)面的布局都會(huì)發(fā)生變化。”
“ 另一種情況是表達(dá)需求的成本很高。很多設(shè)計(jì)需求其實(shí)很難用語(yǔ)言準(zhǔn)確表達(dá),比如希望頁(yè)面有一些孟菲斯設(shè)計(jì)風(fēng)格,大語(yǔ)言模型往往會(huì)用一種非常膚淺的方式去理解這種概念。比如它會(huì)理解為:孟菲斯風(fēng)格就是大量鮮艷的顏色,比較突出的幾何形狀,輪廓明顯的圖形。然后,它就會(huì)把整個(gè)界面鋪滿(mǎn)各種彩色元素,看起來(lái)非常幼稚。”
“ 相比之下,在我腦子里的想象,可能只是一些很細(xì)微的調(diào)整:某些元素的顏色要更鮮亮一點(diǎn),顏色選擇要更大膽、更跳躍;或者讓頁(yè)面的輪廓線(xiàn)更加明顯一些。”
“ 我目前試過(guò)的很多模型,沒(méi)有一個(gè)真的能理解這些東西,而且做界面生成的Token 成本通常也比較高。很多時(shí)候,如果我把時(shí)間花在和模型反復(fù)解釋這些需求上,還不如自己直接在設(shè)計(jì)工具里試幾種方案,很快就能得到結(jié)果。”
“ AI 對(duì)界面的理解,很難做到結(jié)構(gòu)化地拆解再理解再生成,更多是直接給你一個(gè)整體性的效果。”
“ 有一個(gè)場(chǎng)景我也一直比較期待:在設(shè)計(jì)早期,只有一些風(fēng)格關(guān)鍵詞,再加上一個(gè)很粗略的結(jié)構(gòu)草圖,我希望有一個(gè)工具能把這些信息結(jié)合起來(lái),模擬出一個(gè)可能的界面,這樣可以幫助我們?cè)谠缙诖_定視覺(jué)方向。但目前沒(méi)有產(chǎn)品能做到這一點(diǎn)。”
“ 當(dāng)然,如果你讓它生成一個(gè) Dashboard,這是結(jié)構(gòu)性非常強(qiáng)、功能性強(qiáng)于美術(shù)表達(dá)的界面類(lèi)型,模型其實(shí)是可以做出來(lái)的。”
“ 但又會(huì)出現(xiàn)另一個(gè)問(wèn)題:它生成的界面往往不遵循你的設(shè)計(jì)系統(tǒng)。所謂設(shè)計(jì)系統(tǒng),其實(shí)就是一整套規(guī)范。比如界面里的顏色、線(xiàn)條粗細(xì)、間距、邊框?qū)挾鹊龋ǔ2粫?huì)直接用具體數(shù)值標(biāo)注,而是用變量來(lái)定義。比如邊距可能是 1px、2px、4px,或 S、M、L 這樣的等級(jí),圓角也可能是 2%、4%、6% 等不同級(jí)別。”
“ 如果讓生成式工具來(lái)做界面,它雖然能生成看起來(lái)類(lèi)似的界面,但實(shí)際上用的都是具體數(shù)值,而不會(huì)調(diào)用你定義好的變量。從設(shè)計(jì)系統(tǒng)的角度來(lái)說(shuō),它并沒(méi)有真正遵循你的規(guī)范。”
“ 如果模型不能直接使用我的設(shè)計(jì)系統(tǒng),我基本不會(huì)去用。原因很簡(jiǎn)單:后續(xù)的調(diào)整成本會(huì)非常高。”
“ 比如現(xiàn)在覺(jué)得整個(gè)頁(yè)面的矩形圓角太硬了,想把圓角從 2 Pixel 改成 4 Pixel。在設(shè)計(jì)系統(tǒng)里,只需要改一個(gè)變量,整個(gè)界面里的相關(guān)元素都會(huì)一起更新。但如果界面沒(méi)有使用變量系統(tǒng),我就必須一個(gè)一個(gè)去找頁(yè)面里的矩形,把它們的圓角逐個(gè)改掉,這就變成了完全手動(dòng)的工作。”
“ 目前我還沒(méi)有發(fā)現(xiàn)一個(gè) Figma 工作流能解決這個(gè)問(wèn)題。這個(gè)問(wèn)題的技術(shù)難度其實(shí)未必很高,可能只是沒(méi)有找到一套合適的工具流或者工具鏈能夠?qū)崿F(xiàn)它。”
![]()
因此,總體而言,以設(shè)計(jì)場(chǎng)景為典型,其實(shí)在除了代碼生成以外的大部分場(chǎng)景中,人們都感覺(jué) AI 的實(shí)際采納率并沒(méi)有特別高。客觀因素比如模型能力有限、記憶類(lèi)型不完備等自然很重要,主觀因素特別是不合理的期待卻較少為人注意,如果大模型不是 “ 真理機(jī) ” 而是 “ 觀點(diǎn)機(jī) ”,那它本質(zhì)是面向未來(lái)的,幻覺(jué)是基本屬性,知識(shí)再豐富,也不是可靠的百科全書(shū),執(zhí)行能力再?gòu)?qiáng),驗(yàn)收環(huán)節(jié)也必不可少,這一點(diǎn)倒和人類(lèi)沒(méi)太大區(qū)別。
現(xiàn)實(shí)層面看,近幾個(gè)月 SaaS 市場(chǎng)被全面看空,在 John 看來(lái),這更多還是市場(chǎng)對(duì)于 “ SaaS 泡沫 ” 的情緒波動(dòng),有不少恐慌的成分,有點(diǎn)非理性。
“ 一方面,人們都覺(jué)得 AI 很有前景,敘事也很龐大,但另一方面,很多人心里都有點(diǎn)虛,不確定它的潛力邊界。”
“ 我之前聽(tīng)過(guò)一句話(huà),感覺(jué)挺有道理的:如果你現(xiàn)在去問(wèn)大家,有多少人覺(jué)得 AI 可能存在泡沫,其實(shí)有不少人是有這種擔(dān)心的。但如果回看 2000 年互聯(lián)網(wǎng)泡沫的時(shí)候,當(dāng)時(shí)其實(shí)很多人并不覺(jué)得有泡沫。所以換個(gè)角度看,如果現(xiàn)在已經(jīng)有這么多人在擔(dān)心泡沫,反而說(shuō)明可能離真正的泡沫階段還有一點(diǎn)距離。因?yàn)檫@至少說(shuō)明整體市場(chǎng)還是比較謹(jǐn)慎的。”
在過(guò)去幾年,問(wèn)答場(chǎng)景和人類(lèi)監(jiān)督的 Agent 場(chǎng)景下,Token 消耗一般不為人過(guò)度關(guān)注,但在龍蝦時(shí)代,24 小時(shí)在線(xiàn)燒 Token 的龍蝦直接點(diǎn)燃了大家的 Token 焦慮。
王鯨表示,“ 傳統(tǒng)對(duì)話(huà)式 AI 一句話(huà)消耗一兩千 Token,現(xiàn)在用龍蝦隨便一句話(huà)就 20 萬(wàn) Token,就算和其他 Agent 場(chǎng)景相比也是消耗更大的,比我寫(xiě)代碼用的 Qwen Coder 高了很多倍。”
“ 究其原因,還是因?yàn)?Skill 裝的多,工具調(diào)用的多。畢竟長(zhǎng)了手,工作范圍廣,比起純文本操作,基礎(chǔ)消耗自然高了很多。”
“ 而且現(xiàn)在很多操作不是軟件化的、模塊化的,而是 AI 現(xiàn)場(chǎng)思考以后去操作的,類(lèi)似于每次按按鈕都全屏截圖識(shí)圖一次,每一次操作都要思考一次,能效比很差,就像大炮打蚊子。”
用得少怕落后,用得多怕看賬單。
從這個(gè)節(jié)點(diǎn)開(kāi)始,AI 輸出的采納率這個(gè) “ 房間里的大象 ”,或許會(huì)越來(lái)越被人們?cè)谝狻?/strong>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.