Unity Sentis 是一個智能模型“播放器”,能讓游戲直接在玩家的設備(PC、手機、主機等)上本地運行 AI 模型,并實時返回計算結果。這一能力自 Unity 2022 版本起被引入,團結引擎繼承自該版本,因此也原生支持。為了幫助開發者更方便地使用該能力,Unity 中國資源商店已上架 200 多款模型。本文從中精選了五款進行介紹,它們均已適配團結引擎 Sentis 推理運行時,開箱即用,支持端側 AI 推理。后面我們還會帶來更多模型介紹,也歡迎大家前往 Unity 中國資源商店親自體驗和探索。
訪問鏈接:
https://assetstore.u3d.cn/search?q=AI%20model
文本轉語音模型:inference-engine-unity-inference-engine-jets-text-to-speech
Jets Text-to-Speech是一種高效、自然的文本轉語音(TTS)生成模型 。該模型通過深度神經網絡對輸入文本進行分析和編碼,進而合成出流暢、自然的人類語音。Jets TTS 集成于團結引擎推理引擎后,開發者可以實現虛擬角色臺詞實時合成、語音助手回答及無障礙閱讀等功能,極大提升了交互的沉浸感和多模態體驗。
模型優勢
語音合成流暢自然,接近人聲水平;
支持多種情感、腔調、性別的切換,賦予角色“靈魂”;
延遲極低,滿足實時交互需求。
技術特點
支持多種語言與語音風格,聲音擬真度高;
具備實時推理能力,適合交互式場景;
可與團結引擎場景無縫協作,輸出標準語音文件或流式音頻數據。
應用案例
游戲中的 NPC 臺詞自動生成與配音;
虛擬數字人的口語播報、AI 客服;
在線教育、朗讀輔助、無障礙閱讀產品。
模型鏈接:
https://assetstore.u3d.cn/packages/add-ons/machinelearning/assetstore-package-20005332
單目深度估計模型:inference-engine-unity-inference-engine-midas
MIDAS是一款優秀的單目深度估計模型,可以僅憑一張普通 RGB 圖片預測出場景各像素點的相對深度。其原理基于卷積神經網絡,通過對海量帶標簽的圖片訓練,學習像素特征與深度之間的關系。
模型優勢
無需專用硬件,僅憑 RGB 相機即可獲取深度場信息;
對各種光照、物體尺度具備天然適應性;
可與AR、VR 實時流媒體直接對接。
技術特點
單目輸入即可快速獲取稠密深度圖,無需專用深度相機;
算法高效,支持實時處理,適合嵌入式與桌面端部署;
經過大規模數據訓練,對真實世界或虛擬場景中的室內室外環境都能給出穩定且不錯的深度預測。
應用案例
游戲/虛擬現實場景中的 3D 環境自動重建;
機器人/無人機的環境感知與路徑規劃;
安全駕駛輔助(視覺感知層)。
模型鏈接:
https://assetstore.u3d.cn/packages/add-ons/machinelearning/assetstore-package-20005333
輕量智能AI模型:inference-engine-unity-inference-engine-minilm-v6
MiniLM-v6屬于輕量級的 Transformer 系列自然語言理解模型。它通過知識蒸餾將大模型中蘊含的語言理解與推理能力遷移到更小參數規模的網絡結構上,在保證性能的同時極大減少了推理資源消耗。
模型優勢
在保證高準確率的同時,明顯降低了內存和算力需求;
支持文本分類、實體識別、語義檢索等主流NLU任務;
啟動和響應速度快,適用于移動設備與實時在線場景。
技術特點
模型小巧,部署高效,適合邊緣端與實時應用;
在文本分類、摘要、問答、情感分析等任務上表現突出;
多語言支持,易于與團結引擎項目中的多文字內容處理結合。
應用案例
游戲對話系統、智能 NPC、任務提示;
智能客服、自動 FAQ 與內容審核;
云邊協同文本理解與推薦系統。
模型鏈接:
https://assetstore.u3d.cn/packages/add-ons/machinelearning/assetstore-package-20005334
圖像識別和分類模型:inference-engine-unity-inference-engine-mobilenet-v2
MobileNet-v2是一款專為移動端和嵌入式設備設計的輕量級圖像分類模型。它采用深度可分離卷積和倒殘差結構,相較傳統 CNN 擁有更低的計算復雜度和更小的模型體積,卻能在絕大多數圖像識別任務上提供接近主流大型模型的準確率。
模型優勢
支持目標分類、檢測與分割等任務;
部署資源極低,可在手機、VR 頭顯或物聯網設備運行;
與團結引擎集成無縫,可搭配攝像頭實時推理。
技術特點
高效結構設計,適合低算力終端快速部署;
支持目標檢測、圖像分類等多類視覺任務;
與團結引擎深度整合,便于開發實時圖像智能應用。
應用案例
視頻流中的目標追蹤與識別;
增強現實交互中的圖像分割與物體標記;
安防監控、智能家居視覺入口。
模型鏈接:
https://assetstore.u3d.cn/packages/add-ons/machinelearning/assetstore-package-20005335
語音識別模型:inference-engine-unity-inference-engine-whisper-tiny
Whisper-tiny是基于 OpenAI Whisper 架構的輕量級端到端語音識別模型。該模型可將音頻中的語音內容高速、高精度地轉寫為文本,并支持多語種識別。
模型優勢
小體積、快推理,適合在線與邊緣設備集成;
多語種能力涵蓋廣,可服務全球項目;
支持口語、對話、演講等多種語音場景。
技術特點
端到端自動語音識別,不依賴外部規則或特征工程;
相比標準版 Whisper 參數量更小,推理速度更快,適合資源受限場景;
支持多語種跨域識別。
應用案例
游戲或交互 APP 中的實時語音輸入和指令;
無障礙實時字幕、會議記錄、語音搜索等;
VR/AR 中的語音交互與命令識別。
模型鏈接:
https://assetstore.u3d.cn/packages/add-ons/machinelearning/assetstore-package-20005338
除本文介紹的五款模型,Unity 中國資源商店已上架的 200 多款 AI 模型均經過充分測試,能夠在團結引擎上順暢運行,覆蓋多種不同的 AI 能力,大家可以前往商店探索使用。
掃碼查看AI大模型
Unity 官方微信
第一時間了解Unity引擎動向,學習進階開發技能
每一個“點贊”、“在看”,都是我們前進的動力
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.