日前,影石Insta360創(chuàng)始人劉靖康在上海黑客松現(xiàn)場,將一枚25克重的“黃金鍵帽”送給獲勝MVP選手。據(jù)悉,這枚鍵帽此前只作為內(nèi)部榮譽,在公司程序員節(jié)上授予優(yōu)秀研發(fā)同事,這是它第一次授予外部開發(fā)者。
“影石積累了10年的全景數(shù)據(jù)和AI技術(shù),過去半年AI研究院已投中4篇頂會。”劉靖康在微博中寫道,“我們不僅要自己做研發(fā),更會把壓箱底的學術(shù)成果開源共享給行業(yè)。真正的破局,從來不是把公司關(guān)起門來完成的。”
此番表態(tài)背后,影石近期密集開源了多項全景智能核心成果,直指困擾行業(yè)多年的仿真成本、深度感知和三維生成等難題。
![]()
影石Insta360創(chuàng)始人劉靖康微博截圖。
AirSim360:在虛擬世界搭建全天候AI訓練場
仿真數(shù)據(jù)太貴、實飛驗證太慢、禁飛區(qū)越來越多……這一系列問題,幾乎是所有無人機與具身智能研發(fā)團隊繞不開的現(xiàn)實。一套名為AirSim360的開源仿真平臺正試圖改寫局面。
據(jù)悉,該平臺由影石聯(lián)合武漢大學、加州大學圣地亞哥分校、南洋理工大學、加州大學默塞德分校及深圳大學研究者共同推出,是全球首個面向全景與無人機的高保真物理仿真環(huán)境。開發(fā)者接入真實飛控板,即可在城市、山林等虛擬場景中完成飛行測試,系統(tǒng)實時反饋畫面與數(shù)據(jù)。
據(jù)團隊披露,AirSim360生成效率可達單日100萬幀,對應(yīng)生產(chǎn)成本僅20元,預(yù)計減少約90%的無效戶外實飛。對于受困于禁飛政策的團隊或急需海量測試數(shù)據(jù)的具身智能開發(fā)者而言,這相當于在虛擬世界里建了一座全天候訓練場。
![]()
AirSim360
DAP:給全景世界一把“AI通用尺子”
仿真數(shù)據(jù)再逼真,如果算法無法精確“看懂”全景畫面中每個物體的縱深距離,虛擬訓練的價值仍會大打折扣。
2026年2月,影石聯(lián)合高校研究者推出DAP(DepthAnyPanoramas),即全球首個在大規(guī)模多樣化數(shù)據(jù)集上訓練的全景度量深度基礎(chǔ)模型。具體而言,普通手機拍攝的全景照片是平面的,看不出遠近。DAP能逐像素計算出畫面中每個物體距離鏡頭的精確距離,將平面圖像還原為三維空間。
過去,全景圖像的邊緣會有畸變,人工標注成本極高,學術(shù)界依賴的數(shù)據(jù)集規(guī)模最多不過數(shù)萬張。影石將訓練數(shù)據(jù)規(guī)模擴大到200萬級別,并設(shè)計了一套跨場景通用的距離測量標準。
據(jù)了解,這把“AI通用尺子”無需針對新場景重新調(diào)整即可直接使用。在多項國際權(quán)威測試中,DAP在零樣本條件下的全景尺度深度預(yù)測均位列全球第一。
![]()
DAP
DiT360:擅長三維空間的“AI畫師”
“輸入一段文字描述,模型即可生成一張360度全景圖。”在生成式AI浪潮下,影石還拿出了DiT360全景文生圖模型。
據(jù)介紹,DiT360的獨特之處在于,它不僅能“畫”,還能理解三維世界的幾何結(jié)構(gòu),在圖像質(zhì)量與幾何一致性兩項指標上均表現(xiàn)優(yōu)異。
![]()
DiT360
影石AI研究院:四篇頂會與“打地基”的人
上述成果背后是一支年輕且高產(chǎn)的研究團隊。影石AI研究院自2025年決定全面開源,不到半年已投中4篇頂會。其中,3篇入選計算機視覺頂會 CVPR 2026,1篇入選機器學習頂會 ICLR 2026,分別聚焦全景飛行仿真、全景深度預(yù)測、全景文生圖與3DGS(高斯?jié)姙R)領(lǐng)域。
研究院總監(jiān)兼董事會成員Gavin是國內(nèi)少數(shù)“90后”TPAMI編委之一,長期擔任NeurIPS、ICML等頂會領(lǐng)域主席,谷歌學術(shù)引用超16000次。
團隊中,DAP第一作者是加州大學圣地亞哥分校一年級博士生,本科階段已有4篇頂會一作。Fly360第一作者則來自中國科學院喬紅院士團隊。
“在全景這個早期賽道上,我們更希望做那個打地基的人。”研究院負責人表示。為此設(shè)立的“黃金鍵帽”獎,寓意每一次敲擊都能“點石成金”,專門獎勵基于影石開源成果做出產(chǎn)業(yè)落地價值的開發(fā)者。
![]()
影石送出的“黃金鍵帽”。
截至目前,AirSim360、DAP、DiT360的代碼、模型、數(shù)據(jù)集及工具鏈均已不同程度開源。全景視覺這個長期缺乏開源工具的賽道,正在迎來第一批免費可用的基礎(chǔ)設(shè)施。對于AR/VR、自動駕駛與機器人領(lǐng)域的開發(fā)者而言,這場始于一枚金鍵帽的開源行動,或許比它看起來要重得多。
(受訪單位供圖)
編輯 孔盼成 審讀 毛小妹 二審 李怡天 三審 張穎
〖免責申明〗本文僅代表作者個人觀點,其圖片及內(nèi)容版權(quán)僅歸原所有者所有。如對該內(nèi)容主張權(quán)益請來函或郵件告之,本賬號將迅速采取措施,否則與之相關(guān)的糾紛本賬號不承擔任何責任。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.