品玩4月17日訊,階躍星辰(StepFun)正式發布新一代語音生成模型StepAudio 2.5 TTS。該模型面向Agent時代構建,突破傳統語音合成技術局限,致力于實現從單純的“復現聲音”向深層次的“創造表達”跨越,賦予語音合成模型真正理解人類意圖的能力。
StepAudio 2.5 TTS具備三大核心能力:一是全局語境控制,支持通過自然語言定義整段語音的情緒基調、角色狀態及場景氛圍,確保表達的連貫性與統一性;二是文中語境控制,能夠精準調節語氣、節奏、停頓及呼吸感,細膩刻畫角色的心理活動與潛臺詞;三是零樣本復刻與全音色控制,無需重新訓練即可保留目標音色特征,并靈活調節情感與風格。
該模型現已全量上線階躍星辰開放平臺及Step Plan,支持非流式與流式語音合成等多種接口方式,旨在為有聲書制作、影視配音及智能交互等場景提供具備真人級表現力的語音解決方案。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.