這是 Vibe Coding 的時(shí)代,這是 Vibe Working 的時(shí)代,這也是語(yǔ)音輸入的時(shí)代……
??鍵盤,似乎正在變成一件古董。
2025 年 2 月初,Andrej Karpathy 首次提出并命名了「Vibe Coding(氛圍編程)」這一概念:開發(fā)者不再逐行寫代碼,而是用自然語(yǔ)言向 AI 描述需求,讓 Claude Code、Codex 這類工具代勞。
![]()
這個(gè)概念迅速成為 AI 圈的流行語(yǔ),并在 2025 年底演變?yōu)橐环N更廣泛的工作方式:一切知識(shí)工作都開始「順著感覺走」,讓 AI 替你把想法變成輸出。人們給這種工作方式起了個(gè)新名字:Vibe Working。
而 Vibe Working 自然需要一種比鍵盤更順滑的輸入方式。于是,語(yǔ)音輸入登場(chǎng)了。
語(yǔ)音聽寫正在和 Vibe Coding 合流:開發(fā)者一邊踱步一邊口述需求,語(yǔ)音工具把語(yǔ)音轉(zhuǎn)成文字 prompt,編程 AI 再把 prompt 轉(zhuǎn)成代碼。思維流動(dòng)的速度,不再受限于手指的速度。
這場(chǎng)融合甚至還引發(fā)了一個(gè)意想不到的尷尬:Mac Mini 沒有內(nèi)置麥克風(fēng)。
在 V2EX、知乎、小紅書等中文平臺(tái)上,「買了 Mac Mini 想 Vibe Coding,發(fā)現(xiàn)沒有麥克風(fēng)怎么辦」成了一個(gè)高頻問題。有人困惑地翻遍設(shè)置找不到輸入設(shè)備,才發(fā)現(xiàn)這臺(tái)機(jī)器的「缺陷」:Mac Mini(以及 Mac Pro、Mac Studio)從來(lái)就沒有內(nèi)置麥克風(fēng)。
![]()
圖源:小紅書 @科爾白
于是,想 Vibe Working 的用戶,不得不在下單 Mac Mini 的同時(shí),再配一根 USB 麥克風(fēng)或鵝頸麥。蘋果大概沒有預(yù)料到,有一天「沒有麥克風(fēng)」會(huì)成為一臺(tái)高性能臺(tái)式機(jī)的硬傷,而不只是一個(gè)用戶忘記帶耳機(jī)時(shí)才會(huì)遇到的小煩惱。
這個(gè)尷尬背后是一個(gè)真實(shí)的趨勢(shì)。語(yǔ)音輸入,正在以超出所有人預(yù)期的速度,從邊緣走向主流。
1
硅谷辦公室,竊竊私語(yǔ)聲
據(jù)《華爾街日?qǐng)?bào)》報(bào)道,西雅圖的 AI 創(chuàng)業(yè)者 Mollie Amkraut Mueller 曾經(jīng)有一個(gè)神圣的夜晚儀式:哄孩子睡覺,倒在沙發(fā)上,和丈夫各自打開電腦,在客廳的寧?kù)o中完成一天剩余的工作。
這種平靜后來(lái)被打破了。
不是因?yàn)楹⒆涌摁[,而是因?yàn)?Mollie 自己:她開始在夜里對(duì)著筆記本電腦低聲嘀咕,時(shí)而停頓,時(shí)而喃喃糾正自己,時(shí)而又接著說(shuō)。她的丈夫忍受了一段時(shí)間,然后提出了抗議。
Amkraut Mueller 迷上了一款叫 Wispr Flow 的語(yǔ)音聽寫應(yīng)用,用它與 Claude Code、Codex 搭配,能把散漫的意識(shí)流語(yǔ)音,在幾秒內(nèi)轉(zhuǎn)化為連貫、可用的文本。高效,是的。但也確實(shí)有點(diǎn)奇怪。
這種奇怪,正在硅谷的辦公室里以病毒式速度蔓延。
在一些公司里,這場(chǎng)風(fēng)潮是從一名員工開始的,然后悄悄蔓延開去。鵝頸式麥克風(fēng)開始出現(xiàn)在工位上。越來(lái)越多的人放棄鍵盤,轉(zhuǎn)而對(duì)著電腦低語(yǔ)指令。
有位風(fēng)險(xiǎn)投資人描述說(shuō),今天去拜訪 AI 創(chuàng)業(yè)公司,就像走進(jìn)了一家高端呼叫中心。只不過每個(gè)人都在和 AI 聊天。金融科技公司 Ramp 的工程師們戴著游戲耳機(jī)大聲和 AI 助理交談;人力資源公司 Gusto 的聯(lián)合創(chuàng)始人 Edward Kim 鼓勵(lì)員工嘗試語(yǔ)音聽寫技術(shù),并預(yù)言「未來(lái)的辦公室聽起來(lái)會(huì)更像一個(gè)銷售樓層」。
然后他以身作則:「我現(xiàn)在一直在和我的電腦說(shuō)話,除非萬(wàn)不得已,我不打字。」
這篇題為《Typing Is Being Replaced by Whispering — and It's Way More Annoying》(打字正在被低語(yǔ)取代——而且煩人多了)的《華爾街日?qǐng)?bào)》報(bào)道迅速引發(fā)廣泛討論。文章作者 Kate Clark 寫道:「整個(gè)硅谷的工作方式正在被重塑,曾經(jīng)平靜的辦公空間正在變成嘈雜的聲音巢穴。」
![]()
圖源:《華爾街日?qǐng)?bào)》
《衛(wèi)報(bào)》也在同月跟進(jìn),發(fā)表了《打字的終結(jié)?為什么工人們突然開始拋棄鍵盤》。
一時(shí)間,「語(yǔ)音輸入」成了科技圈最熱門的話題之一。
這場(chǎng)低語(yǔ)革命,到底是怎么發(fā)生的?
1
硅谷辦公室的聲音變遷
讓我們先做一次簡(jiǎn)短的聲景考古。
1998 年,辦公室的主旋律是傳真機(jī)的撥號(hào)嘟鳴聲和答錄機(jī)紅燈的閃爍。2008 年,是鍵盤噼里啪啦的打字聲和電話鈴聲。到了 2018 年,Slack 的消息提示音接管了這一切。
而 2026 年,你走進(jìn)一家硅谷 AI 創(chuàng)業(yè)公司,聽到的是此起彼伏的低語(yǔ)——有人在說(shuō)「給張三發(fā)一封關(guān)于明天會(huì)議的郵件」,有人在念「不,取消,重新開始」,有人則在對(duì)著屏幕描述一個(gè)函數(shù)的邏輯。
NICH 工作室的 Chad Strickland 在 Substack 上記錄了這一變化:「過去一年,我們工作室的聲音變了。我們一直以播放精選歌單著稱,從進(jìn)門到最后一個(gè)人離開,音樂不停。但是,低語(yǔ)聲開始了。現(xiàn)在我們?cè)谝魳返倪x擇上非常謹(jǐn)慎,不能有歌詞——Jackie Gleason 的古典爵士樂于是開始流行起來(lái)。為什么?因?yàn)槟悻F(xiàn)在聽到的,主要是人們對(duì)著筆記本電腦展開單邊對(duì)話。停頓,半截的詞,偶爾一句『不,劃掉那句』。」
技術(shù)上,促成這場(chǎng)變化的關(guān)鍵節(jié)點(diǎn)是 2022 年:OpenAI 發(fā)布了開源語(yǔ)音識(shí)別模型 Whisper,將語(yǔ)音轉(zhuǎn)文字的準(zhǔn)確率推到了一個(gè)新高度。此后迭代持續(xù)加速。Whisper Large v3 在干凈音頻基準(zhǔn)測(cè)試中,詞錯(cuò)誤率已降至約 2.7%;OpenAI 今年推出的 gpt-4o-transcribe 模型,在第三方評(píng)測(cè)中甚至跑出了 2.5% 的低錯(cuò)誤率。相比五年前錯(cuò)誤率極高的語(yǔ)音識(shí)別工具,這是質(zhì)的飛躍。從那時(shí)起,AI 語(yǔ)音大模型的成熟期開始加速到來(lái)。
但技術(shù)的成熟,只是拼圖的一塊。真正點(diǎn)燃這場(chǎng)風(fēng)潮的,是一個(gè)詞:voicepilled。
去年秋天,LinkedIn 聯(lián)合創(chuàng)始人 Reid Hoffman 在 LinkedIn 上坦白:「I am voicepilled。」他論證說(shuō),用說(shuō)話代替打字是計(jì)算機(jī)領(lǐng)域的下一次偉大飛躍。所謂「voicepilled」,是一種頓悟——當(dāng)你不再被那個(gè)維多利亞時(shí)代的打字機(jī)遺產(chǎn)(也就是鍵盤)束縛時(shí),你可以擁有更高的生產(chǎn)力和創(chuàng)造力。
![]()
圖源:LinkedIn:Reid Hoffman
這個(gè)詞來(lái)自電影《黑客帝國(guó)》中著名的「紅藍(lán)藥丸」比喻:一旦你吞下紅藥丸,看見了另一個(gè)世界,就再也回不去了。Voicepilling 這個(gè)詞迅速成為拋棄鍵盤的新簡(jiǎn)稱,并以快速傳播,因?yàn)?strong>AI 語(yǔ)音聽寫工具的準(zhǔn)確率已經(jīng)高到足以讓說(shuō)話比打字更快。
1
一個(gè)正在爆發(fā)的市場(chǎng)
Wispr Flow 的創(chuàng)業(yè)歷程頗具戲劇性。
公司由 Tanay Kothari 和 Sahaj Garg 于 2021 年創(chuàng)立,最初目標(biāo)并非做語(yǔ)音輸入軟件,而是開發(fā)一種帶有神經(jīng)接口的非侵入式可穿戴設(shè)備,希望通過讀取用戶神經(jīng)信號(hào),實(shí)現(xiàn)對(duì)電腦和智能手機(jī)的控制。團(tuán)隊(duì)后來(lái)甚至打造出了一款被 Kothari 形容為「像純粹魔法一樣」的藍(lán)牙耳機(jī)原型。然而,由于市場(chǎng)需求未能達(dá)到預(yù)期,公司不得不進(jìn)行艱難轉(zhuǎn)型,將團(tuán)隊(duì)規(guī)模從約 40 人縮減到 4 人,并將重心轉(zhuǎn)向語(yǔ)音聽寫產(chǎn)品。最終,這條轉(zhuǎn)型路線催生了后來(lái)廣受關(guān)注的 Wispr Flow。
這次「被迫轉(zhuǎn)型」,撞上了一個(gè)時(shí)代的風(fēng)口。
Wispr Flow 的 Mac 應(yīng)用于 2024 年秋季上線,此后一路高歌:每月活躍用戶增長(zhǎng) 50%。Kothari 表示,硅谷幾乎每一家頂級(jí)風(fēng)投基金都在使用 Wispr Flow 撰寫郵件、備忘錄和文件。VC 們自己成了這款產(chǎn)品最狂熱的用戶,而「VC 用什么」這件事,在硅谷從來(lái)都不是小事。
融資隨之而來(lái):2025 年 6 月,Wispr Flow 完成由 Menlo Ventures 領(lǐng)投的 3000 萬(wàn)美元 A 輪融資;同年 11 月,又完成了由 Notable Capital 領(lǐng)投的 2500 萬(wàn)美元追加融資,估值達(dá)到約 7 億美元。而根據(jù)彭博社今年五月的報(bào)道,Wispr AI 正就一輪約 2.6 億美元的新融資進(jìn)行談判,估值有望突破 20 億美元。
從 4 人小團(tuán)隊(duì)到 20 億美元估值,用了不到三年。
Wispr Flow 并非孤軍奮戰(zhàn)。早期入場(chǎng)的 Aqua Voice 和 Willow 均為 Y Combinator 支持的公司,此后又有 TalkTastic、Typeless、Superwhisper 等一批競(jìng)爭(zhēng)者涌入。科技媒體 TechCrunch 將 2025 年評(píng)為 AI 語(yǔ)音聽寫應(yīng)用真正騰飛的一年,并盤點(diǎn)出多款年度最佳語(yǔ)音聽寫工具。
Wispr 自稱,在用戶使用三個(gè)月后,平均每位用戶超過一半的字符已通過語(yǔ)音輸入完成。公司 12 個(gè)月用戶留存率達(dá) 70%,用戶基礎(chǔ)年增長(zhǎng) 100 倍,目前全球下載量已突破 250 萬(wàn)次,并已滲透至財(cái)富 500 強(qiáng)中的 270 家企業(yè)。
有一個(gè)細(xì)節(jié)值得一提:Wispr Flow 的用戶中,英語(yǔ)輸入僅占約 40%,其余 60% 來(lái)自非英語(yǔ)語(yǔ)言——西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、印地語(yǔ)、普通話等。一款「硅谷創(chuàng)業(yè)公司」做出來(lái)的語(yǔ)音產(chǎn)品,超過半數(shù)的真實(shí)使用場(chǎng)景,其實(shí)發(fā)生在硅谷以外。這或許是整個(gè)語(yǔ)音輸入趨勢(shì)最被低估的一個(gè)側(cè)面。
這款產(chǎn)品的名人背書陣容也頗為耀眼。Reid Hoffman 公開宣布自己「voicepilled」;a16z 創(chuàng)始合伙人 Marc Andreessen 稱其「好得令人震驚(staggeringly good)」;蘋果聯(lián)合創(chuàng)始人 Steve Wozniak 也是日常用戶。Superhuman CEO Rahul Vohra 則將它稱為「自 ChatGPT 以來(lái)最重要的消費(fèi)者 AI 產(chǎn)品之一」。在硅谷,「VC 們的手機(jī)里裝了什么」這件事,從來(lái)不只是個(gè)人選擇——它是下一輪融資對(duì)話的前奏。
科技巨頭也嗅到了風(fēng)向。2026 年 5 月,谷歌在 Android Show: I/O Edition 2026 上發(fā)布了 Gboard 內(nèi)置的 Gemini 驅(qū)動(dòng) AI 語(yǔ)音聽寫功能 Rambler。該功能能夠自動(dòng)去除口頭禪、理解用戶的中途修改,并支持多語(yǔ)言混合輸入,被視為谷歌正式進(jìn)入 AI 語(yǔ)音聽寫賽道的重要一步。谷歌 Android 核心體驗(yàn)總監(jiān) Ben Greenwood 將其描述為「重新發(fā)明鍵盤」。
對(duì)創(chuàng)業(yè)公司來(lái)說(shuō),這個(gè)消息喜憂參半:巨頭親自入場(chǎng),是市場(chǎng)被驗(yàn)證的最好證明,同時(shí)也是最大的競(jìng)爭(zhēng)威脅。
與此同時(shí),更「奇葩」的使用場(chǎng)景也在涌現(xiàn)。Willow 的創(chuàng)始人 Allan Guo 在 LinkedIn 上宣布:「我很高興地宣布,我們已經(jīng)把鍵盤從全球最權(quán)威的電視獎(jiǎng)項(xiàng)里移除了。」——2026 年艾美獎(jiǎng)的籌備團(tuán)隊(duì),正在用 Willow 的語(yǔ)音聽寫工具來(lái)處理 Slack 消息、清空收件箱。
![]()
圖源:LinkedIn:Lawrence Liu & Allan Guo
當(dāng)一臺(tái)高性能 Mac 的工位上開始長(zhǎng)出鵝頸麥,當(dāng)艾美獎(jiǎng)的運(yùn)營(yíng)團(tuán)隊(duì)開始對(duì)著屏幕小聲嘀咕,這場(chǎng)變化就不再只是硅谷的極客把戲了。
根據(jù) Mordor Intelligence 今年一月的報(bào)告,全球語(yǔ)音識(shí)別市場(chǎng)規(guī)模在 2026 年估計(jì)達(dá)到約225 億美元,預(yù)計(jì)到 2031 年將增長(zhǎng)至617 億美元,年復(fù)合增長(zhǎng)率約 22.4%。這還只是「語(yǔ)音識(shí)別」這一個(gè)細(xì)分方向,整個(gè)語(yǔ)音 AI 領(lǐng)域的市場(chǎng)空間,要遠(yuǎn)不止于此。
![]()
當(dāng)連谷歌都開始把語(yǔ)音聽寫內(nèi)置到默認(rèn)鍵盤里時(shí),這件事的走向就已經(jīng)清晰了。
而中國(guó)市場(chǎng)的情況,比外界想象的更早熱起來(lái)。
中國(guó)用戶的語(yǔ)音輸入習(xí)慣,其實(shí)比硅谷的「voicepilling 風(fēng)潮」早。
這與中文輸入法生態(tài)的發(fā)展路徑密切相關(guān)。相比許多西方用戶長(zhǎng)期依賴鍵盤輸入,中國(guó)用戶很早便開始通過手機(jī)輸入法使用語(yǔ)音轉(zhuǎn)文字功能。有研究者認(rèn)為,中文語(yǔ)音識(shí)別與拼音輸入體系之間存在天然協(xié)同,使語(yǔ)音輸入更容易融入日常溝通場(chǎng)景;與此同時(shí),移動(dòng)互聯(lián)網(wǎng)時(shí)代積累的輸入習(xí)慣,也為語(yǔ)音交互的普及提供了土壤。
在這一過程中,第三方輸入法廠商持續(xù)推動(dòng)了語(yǔ)音輸入能力的升級(jí)。搜狗、訊飛、百度等頭部產(chǎn)品長(zhǎng)期占據(jù)市場(chǎng)主導(dǎo)地位,其中訊飛輸入法一直將 AI 語(yǔ)音技術(shù)作為核心競(jìng)爭(zhēng)力。根據(jù)訊飛官方資料,其語(yǔ)音輸入目前已支持 200 余種方言、30 多種外語(yǔ),并提供離線語(yǔ)音識(shí)別能力。
最近半年,中國(guó)語(yǔ)音輸入市場(chǎng)更進(jìn)入了一輪明顯的產(chǎn)品升級(jí)周期。
2025 年 12 月,微信輸入法 iOS 版從 2.2.6 直接升級(jí)至 3.0。此次更新幾乎將語(yǔ)音能力置于產(chǎn)品中心位置:語(yǔ)音大模型全面升級(jí),支持 15 種方言(包括粵語(yǔ)、四川話、上海話等),語(yǔ)音輸入取消時(shí)長(zhǎng)限制,并新增離線識(shí)別能力。
同月,字節(jié)跳動(dòng)推出豆包輸入法,登陸 Android 和 iOS 平臺(tái),將豆包大模型直接嵌入鍵盤。產(chǎn)品主打「語(yǔ)音輸入又快又準(zhǔn)」,同時(shí)引入情境感知能力,可根據(jù)工作、聊天等不同場(chǎng)景提供差異化建議。今年 5 月,豆包輸入法進(jìn)一步推出 macOS 版本,延續(xù)了「按下 Fn 鍵即可開口說(shuō)話」的語(yǔ)音交互思路,Windows 版本也已進(jìn)入籌備階段。
![]()
更值得關(guān)注的是,語(yǔ)音輸入正在從手機(jī)場(chǎng)景向 PC 場(chǎng)景擴(kuò)張。2026 年初,微信電腦版更新后開始支持更廣泛的語(yǔ)音輸入調(diào)用能力。用戶不僅可以在微信聊天窗口中使用語(yǔ)音轉(zhuǎn)寫,也能夠在文檔編輯、辦公協(xié)作和網(wǎng)頁(yè)輸入等場(chǎng)景中直接完成語(yǔ)音輸入。與此同時(shí),系統(tǒng)還引入了自動(dòng)清理口頭禪等功能,對(duì)轉(zhuǎn)寫結(jié)果進(jìn)行進(jìn)一步優(yōu)化。
從產(chǎn)品演進(jìn)方向來(lái)看,中國(guó)廠商正在嘗試把語(yǔ)音輸入從一種輔助功能,逐漸變成跨應(yīng)用、跨場(chǎng)景的基礎(chǔ)交互能力。雖然硅谷所討論的「voicepilling」更多聚焦于通過語(yǔ)音向 AI Agent 或大模型下達(dá)復(fù)雜指令,而中國(guó)市場(chǎng)長(zhǎng)期以來(lái)主要服務(wù)于日常信息輸入,但兩者的發(fā)展方向正在逐漸靠攏。
無(wú)論是 AI 工作流中的語(yǔ)音指揮,還是日常溝通中的語(yǔ)音轉(zhuǎn)寫,本質(zhì)上都指向同一個(gè)趨勢(shì):語(yǔ)音正在重新成為人與計(jì)算機(jī)之間最自然的人機(jī)接口之一。
1
親歷者說(shuō):愛它的人和討厭它的人
當(dāng)然,不是每個(gè)人都愛這場(chǎng)低語(yǔ)革命。
愛它的人這樣描述:「Wispr 在我們幾乎所有的事情上都比打字快——起草郵件、整理想法、向其他 AI 工具下指令。它也讓人感覺有點(diǎn)荒誕。我工作了大半輩子,聲音一直是你想跟另一個(gè)人說(shuō)話時(shí)才用的東西。」Strickland 寫道,「但我們可以保證,這東西快、高效、而且讓人上癮。」
獨(dú)立軟件開發(fā)者 Geoffrey Huntley 則把這種工作方式描述得更加生動(dòng)。他說(shuō),自己?jiǎn)?dòng)項(xiàng)目時(shí),會(huì)先打開一個(gè)語(yǔ)音提示框,讓 AI 就需求和顧慮來(lái)「采訪」自己,然后才開始生成代碼。他說(shuō):「我跟它說(shuō)話,就像在爵士樂隊(duì)里即興演奏——前后來(lái)回,前后來(lái)回。」
紐約語(yǔ)音聽寫應(yīng)用 Monologue 的總經(jīng)理 Naveen Naidu 則給出了一個(gè)更宏觀的判斷:「那些已經(jīng)大量使用語(yǔ)音的人,不會(huì)再回頭了。一旦你每周對(duì)著筆記本電腦說(shuō) 20 個(gè)小時(shí),打字就變成了一種摩擦。我認(rèn)為未來(lái)的走向是:語(yǔ)音成為「委托層」——你說(shuō)出你的意圖,事情就發(fā)生了。」
![]()
圖源:小紅書 @超級(jí)斜杠
HR 咨詢師 Claire Koryczan 則從積極角度解讀了這一現(xiàn)象:「在當(dāng)今日常生活中,口頭交流已經(jīng)變得越來(lái)越少見,所以一項(xiàng)鼓勵(lì)人們強(qiáng)化對(duì)話溝通能力的技術(shù),只會(huì)是一種積極的發(fā)展。」
從純粹的效率角度看,數(shù)字也站在語(yǔ)音這邊。普通專業(yè)人士的打字速度約為每分鐘 40 至 60 個(gè)詞,而說(shuō)話速度則高達(dá) 130 至 150 詞——AI 語(yǔ)音聽寫將這一速度差距轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力增益。Wispr Flow 則聲稱其速度比打字快五倍。
但懷疑者同樣有理由。
![]()
圖源:小紅書 @Bob
首先是尷尬感。一個(gè)人對(duì)著自己說(shuō)話,是奇怪的,甚至有點(diǎn)令人難堪的。這不是技術(shù)問題,而是根深蒂固的社會(huì)規(guī)范:我們并不習(xí)慣在公開場(chǎng)合對(duì)著機(jī)器低語(yǔ)。這種感覺在今天有多陌生,就像二十年前在飯桌上接聽手機(jī)一樣。
其次是隱私問題。開放式辦公室本就飽受批評(píng),噪音和隱私雙雙不足。當(dāng)語(yǔ)音聽寫成為常態(tài),在眾目睽睽之下說(shuō)出敏感的客戶信息、財(cái)務(wù)數(shù)據(jù)或商業(yè)機(jī)密,不可避免地帶來(lái)新的隱患。有些工具將音頻傳輸?shù)皆贫朔?wù)器,這意味著用戶的每一句話都可能經(jīng)過第三方的服務(wù)器。隱私政策這件事,在「我只是想快點(diǎn)回完這封郵件」的緊迫感下,常常被遺忘。
第三是認(rèn)知負(fù)擔(dān)。大約 48% 的員工表示,言語(yǔ)交流是辦公室里最令人分心的噪音來(lái)源。工人們平均每天因?qū)υ捀蓴_損失 21.5 分鐘的工作時(shí)間。你可能想通過語(yǔ)音輸入來(lái)提高效率,但你的同事可能正在被你的低語(yǔ)聲打斷思路。
還有一種更深層的憂慮,來(lái)自英國(guó)《皇家公報(bào)》評(píng)論員的警告:「如果這些 AI 功能有朝一日消失,你會(huì)發(fā)現(xiàn)自己不知道當(dāng)初是怎么完成工作的,就像你現(xiàn)在已經(jīng)無(wú)法在沒有 GPS 的情況下去到一個(gè)熟悉的地方一樣。技能的退化不會(huì)一蹴而就。」
1
辦公室禮儀需要重寫了
「你能小聲點(diǎn)嗎?」這句話在開放式辦公室里可能會(huì)越來(lái)越常見。
辦公室設(shè)計(jì)也將隨之改變。專屬「語(yǔ)音區(qū)」、隔音艙,甚至建筑結(jié)構(gòu)上的調(diào)整,可能都將成為必要。企業(yè)也需要更新工作場(chǎng)所政策,規(guī)定可接受的噪音水平和個(gè)人麥克風(fēng)、耳機(jī)的使用規(guī)范。
一些公司已經(jīng)開始摸索。Computerworld 的專欄作者 Mike Elgan 觀察到,從藍(lán)牙耳機(jī)的興起,到在餐廳接電話的正常化,再到公共場(chǎng)合視頻通話的普及——每一次技術(shù)帶來(lái)的行為變化,都經(jīng)歷了從「令人不適」到「理所當(dāng)然」的轉(zhuǎn)變。語(yǔ)音聽寫,不過是這個(gè)序列中的下一個(gè)。
他認(rèn)為,主流媒體聚焦于「辦公室里的新奇怪規(guī)范」,其實(shí)錯(cuò)過了更大的文化轉(zhuǎn)變:語(yǔ)音交互不僅在改變辦公室,也通過移動(dòng)端和可穿戴設(shè)備,在公共生活的每一個(gè)角落重塑人與技術(shù)的關(guān)系。
谷歌在 Android 大會(huì)上宣布 AI 眼鏡將于今年秋天發(fā)貨;Meta、Snap、亞馬遜的智能眼鏡產(chǎn)品線也在擴(kuò)張。AI 眼鏡將是大多數(shù)人接觸到的第一款「語(yǔ)音優(yōu)先」設(shè)備,它們將把語(yǔ)音交互帶入人們?nèi)旌虻纳顖?chǎng)景中。當(dāng)我們開始對(duì)著眼鏡低聲下達(dá)指令、發(fā)送郵件、完成文字工作時(shí),在咖啡館或地鐵里對(duì)著屏幕小聲嘀咕,會(huì)顯得格外平常。
這個(gè)場(chǎng)景,距離現(xiàn)在并不遙遠(yuǎn)。
1
尾聲:鍵盤,拜拜了您呢?
回到那個(gè)更宏大的問題:鍵盤,真的要消失了嗎?
歷史告訴我們,鍵盤雖然很可能會(huì)被戲稱為「古法輸入」,但并不會(huì)消失,就像手寫從未真正消失一樣。但它的角色將收縮,成為一種備用方式。
![]()
語(yǔ)音,將成為默認(rèn)輸入。「未來(lái)的生產(chǎn)力將被口述,而不是被打字。」
這也許過于樂觀,也許過于悲觀,但有一點(diǎn)是確定的:從打字機(jī)到鍵盤,從鼠標(biāo)到觸屏,每一次「人如何與機(jī)器交談」的方式發(fā)生改變,都意味著一場(chǎng)深刻的認(rèn)知與社會(huì)重組。
語(yǔ)音,并不是一項(xiàng)新技術(shù)。它是人類最古老的表達(dá)方式。AI,不過是讓我們回到了一個(gè)更原始、也更自然的起點(diǎn):用嘴說(shuō),而非用手敲。
只不過,現(xiàn)在的聽眾,不再是另一個(gè)人。
1.https://www.wsj.com/tech/typing-is-being-replaced-by-whisperingand-its-way-more-annoying-a804fee7
2.https://www.bloomberg.com/news/articles/2026-02-06/voice-to-text-ai-lets-office-workers-talk-instead-of-type
3.https://www.theguardian.com/technology/2026/may/12/end-of-typing-workers-ditching-keyboards-voicepilling-ai-dictation
4.https://www.thecultureedit.com/p/whisper-while-you-work
5.https://www.computerworld.com/article/4175881/ai-will-kill-the-skill-of-typing.html
6.https://www.royalgazette.com/opinion-writer/opinion/article/20260518/keep-your-keyboard-in-ai-revolution/
7.https://www.bloomberg.com/news/articles/2026-05-12/ai-dictation-startup-wispr-in-funding-talks-at-2-billion-value
8.https://techcrunch.com/2025/06/24/wispr-flow-raises-30m-from-menlo-ventures-for-its-ai-powered-dictation-app/
9.https://techcrunch.com/2025/11/20/as-its-voice-dectation-app-takes-off-wispr-secures-25m-from-notable-capital/
10.https://x.com/alliekmiller/status/1969420607172292789
11.https://techcrunch.com/2026/05/12/google-adds-gemini-powered-dictation-to-gboard-which-could-be-bad-news-for-dictation-startups/
12.https://www.androidheadlines.com/2026/05/google-gboard-rambler-ai-voice-dictation-features.html
13.https://news.mydrivers.com/1/1076/1076402.htm
14.https://willowvoice.com/blog/voice-dictation-open-offices-quiet-mode
點(diǎn)個(gè)“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.