我一直覺得自己離一個(gè)正經(jīng)虛擬主播只差一套動作捕捉設(shè)備。畢竟臉可以用 Live2D 湊合,但身體動作要想在我那堆“峽谷一級保護(hù)廢物”操作里秀出點(diǎn)人樣,光靠鍵盤鼠標(biāo)是沒戲的。結(jié)果昨天刷到個(gè)視頻,我整個(gè)人愣在屏幕前——有人用總成本不到 200 美元一臺的 16 臺自制相機(jī),自己搓出了一套好萊塢級的動作捕捉系統(tǒng),還把過程全開源了。現(xiàn)在我感覺,我那頂著菜狗頭像、幻想用貓耳美少女形象出道的計(jì)劃,突然就從一個(gè)“等我有錢”的妄想,變成了“要不我也去學(xué)學(xué)畫電路板”的邪念。
這個(gè)讓我上頭的內(nèi)容,來自硬件 DIY 創(chuàng)作者 Made By Dennis 做的一期視頻:《從零開始搭建好萊塢動作捕捉》。名字聽著唬人,但他真不是靠砸錢買設(shè)備。整套方案的起點(diǎn)其實(shí)特別玩家向——就是不服氣市面上的動捕設(shè)備太貴,干脆自己手搓 16 臺相機(jī),用光學(xué)動捕的路線來解決問題。對,就是那種你在《戰(zhàn)神》幕后紀(jì)錄片里看到過的,演員身上貼滿反光小球,周圍一圈相機(jī)咔咔捕捉動作,最后做成奎爺揮斧頭那種技術(shù)。
![]()
這種技術(shù)路線在游戲行業(yè)幾乎不用科普。從 3A 大作到獨(dú)立游戲里那些自然到離譜的肢體動作,很多時(shí)候都得靠演員穿著緊身動捕服,在一堆相機(jī)中間反復(fù)滾地板。而那一堆相機(jī),單臺市價(jià)動輒數(shù)萬,全套下來能直接吃掉一個(gè)小團(tuán)隊(duì)的預(yù)算。所以當(dāng)我看到 Made By Dennis 直接把單臺成本砍到 200 美元以下,腦子里第一個(gè)念頭是:這要是能普及,以后我這種又菜又想做內(nèi)容的廢物玩家,是不是真的能在自家客廳里套個(gè)虛擬皮囊蹦跶了?
當(dāng)然,真想把 Vtuber 夢照進(jìn)現(xiàn)實(shí),得先看看這 16 臺相機(jī)到底是怎么攢出來的。核心部件其實(shí)不復(fù)雜。每臺相機(jī)都選用了一顆相對便宜的單色傳感器,型號是 AR0234。用單色的道理也很直白:這套設(shè)備本來就不是為了拍彩色畫面,而是專門盯著那些反光小球在空間里的移動軌跡。給每臺相機(jī)配上紅外光圈后,有效范圍內(nèi)能反射回來的基本只有那些高亮小白點(diǎn),單色傳感器反而更容易抓干凈數(shù)據(jù),一點(diǎn)多余信息都不帶。這種用便宜貨做精準(zhǔn)犧牲的打法,比很多游戲配置優(yōu)化還講究性價(jià)比,甚至讓我想起當(dāng)年為了帶得動某個(gè)虛幻 5 游戲,寧可關(guān)掉體積云也不降分辨率的傳統(tǒng)手藝。
傳感器選定之后,鏡頭也沒走燒錢路線。因?yàn)閱紊珎鞲衅鞯某叽缰挥?6.8 毫米,正好可以搭配那些為監(jiān)控?cái)z像頭大量生產(chǎn)的廉價(jià)鏡頭。監(jiān)控鏡頭的邏輯玩家也熟——量大管飽,分辨率不一定極致,但邊緣捕捉夠用,而且?guī)缀醪挥每紤]對焦偏移之類的問題。傳感器加上這支鏡頭,組合成本攏共約 40 美元。看到這個(gè)數(shù)字的時(shí)候,我下意識算了一下,這差不多是我在某個(gè)抽卡游戲里一單 648 能買到的材料錢,結(jié)果人家拿來造了一臺動作捕捉相機(jī)的眼睛。
真正把我從“我也能行”的幻想拽回現(xiàn)實(shí)的是電路板。找到一塊能跟這顆單色傳感器搭檔、價(jià)格還不被中間商抬上天的現(xiàn)成板子,實(shí)在是太難了。于是 Made By Dennis 直接轉(zhuǎn)身自己設(shè)計(jì)并制作了 PCB。對,就是畫電路圖、打樣、焊接那種自己搞。視頻里他提起這個(gè)段落的時(shí)候語氣輕描淡寫,但我這種連主機(jī)清灰都要看三遍教程的選手,瞬間就覺得自己的虛擬主播夢可能需要先插播一個(gè)“回設(shè)計(jì)工藝課重修”的支線任務(wù)。好在,他把 PCB 設(shè)計(jì)文件全都掛到了自己的 GitHub 上,說不定未來真有哪個(gè)手巧的老哥拿來魔改,再做一批小批量板子出來賣。到那個(gè)時(shí)候,我能氪金解決的問題絕對不碰烙鐵。
硬件只是第一步。16 臺預(yù)算相機(jī)懟在房間里,拍到的無非是幾十個(gè)小白點(diǎn)在黑色背景里上下翻飛。要把這些二維畫面變成精確的三維動作數(shù)據(jù),還得靠一套叫三角測量的算法。簡單說,就是每顆反光標(biāo)記點(diǎn)同時(shí)被多臺相機(jī)拍到,通過不同相機(jī)之間的視角差,就能算出這個(gè)點(diǎn)在空間里的真實(shí)位置。這個(gè)過程在游戲開發(fā)里再常見不過,但之前都是靠專業(yè)軟件配合動輒六位數(shù)價(jià)格的設(shè)備完成的。Made By Dennis 則自己寫了一套處理方案,同樣放到了 GitHub 上,而且他給出的數(shù)據(jù)是:比他測試過的開源方案里最主流的那套 OpenCV 方法,速度快 300 倍。看到這個(gè)數(shù),我這種對代碼一知半解的廢物第一反應(yīng)不是去讀源碼,而是立刻腦補(bǔ)出以后錄跳舞視頻,錄完 5 分鐘就能直接導(dǎo)出骨骼動畫,不用再等一晚上解析的爽感。
坦白說,這個(gè)項(xiàng)目最對我胃口的不是設(shè)備參數(shù)本身,而是它那種“既然找不到便宜的,就自己從頭做一個(gè)”的野生創(chuàng)造力。而且全程沒有刻意搞那種“重新定義行業(yè)”的敘事,只是把一個(gè)原本鎖在專業(yè)工作室里的技術(shù)拆解到玩家能看得見、甚至能想著摸一摸的水平。16 臺自制相機(jī)圍繞一個(gè)動捕區(qū)域,每一臺都用不到 200 美元就能搞定,加起來硬件成本還不到一臺高配主機(jī)的一半。這個(gè)對比一旦在腦子里生成,我再看看自己桌面上那臺為了跑 2K 畫質(zhì)攢的機(jī)箱,突然覺得好像 Vtuber 的啟動資金也不是那么遙不可及了。
當(dāng)然,腦袋一熱的興奮感消退之后,得老老實(shí)實(shí)盤一下實(shí)操難度。首先你至少得有一個(gè)能放得下 16 臺相機(jī)支架的空間,這對很多租房黨來說已經(jīng)是硬件勸退。其次,就算 PCB 有開源設(shè)計(jì),自己從頭焊接調(diào)試,也不是每個(gè)周末能搞定的事。然后還要考慮動捕服的標(biāo)記點(diǎn)怎么貼、怎么校準(zhǔn)場景、如何處理身體自遮擋帶來的數(shù)據(jù)丟失……想到這些,我那只存在于想象中的貓耳娘形象,在腦袋里朝我翻了個(gè)白眼,仿佛在說:你連每日任務(wù)都經(jīng)常忘記領(lǐng)獎(jiǎng)勵(lì),就別在這兒給自己畫大餅了。
不過,這套開源方案對于玩家圈子的意義可能根本不在于每個(gè)人都能立刻變成虛擬主播。更大的想象空間是,一些獨(dú)立游戲開發(fā)小團(tuán)隊(duì)、做同人動畫的社區(qū)、甚至是在大學(xué)做游戲設(shè)計(jì)畢設(shè)的學(xué)生,也許能靠這套思路,用極低的硬件成本搭出一套可用的動捕環(huán)境。以前很多玩法因?yàn)閯硬短F而只能停留在創(chuàng)意階段,比如想做一個(gè)支持全身動作輸入的 VR 聊天室,或者給自制角色加一段流暢的待機(jī)動作,現(xiàn)在說不定會慢慢多起來。這不是什么“行業(yè)變革”,更像是在玩家工坊的角落里,突然多了一盒買得起的工具,至于能做出什么,得看誰先撿起來折騰。
至于我這種純純的消費(fèi)者,目前最現(xiàn)實(shí)的計(jì)劃還是先蹲一波社區(qū)有沒有大佬把這套方案做成套件賣。到時(shí)候我花錢買省心,拿到手直接就是 16 臺標(biāo)定好的相機(jī),然后把自己裹上反光小球,錄一段試圖還原《戰(zhàn)神》里奎爺格擋反殺的蠢動作,再用開源軟件跑一下骨骼數(shù)據(jù),套個(gè)免費(fèi) Vroid 模型,說不定真能在直播里以一副“極地大亂斗之王”的形象出道。就算做出來還是因?yàn)椴僮魈吮挥^眾嘲笑,至少那身動起來的笨拙是我自己親自套進(jìn)虛擬皮囊里的,不是單純靠臉撐著——這成就感,可能比我排位賽拿個(gè)三殺還持久一點(diǎn)。
再說了,萬一真的火了呢?我連直播間標(biāo)題都想好了:“200 美元手搓動捕,菜但癮大的虛擬廢物今日開張”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.