![]()
谷歌今日宣布推出Gemini 3.5 Live Translate,這是其最新的實時語音到語音翻譯模型。
該模型能夠識別超過70種語言,并生成"流暢、自然的翻譯語音",同時保留原始語音的語調、節奏和音調。
與傳統的逐段翻譯系統相比,傳統系統需要"等待說話者說完后才開始響應",而Gemini 3.5 Live Translate采用連續語音生成方式,實現"無尷尬停頓的流暢音頻,并在整個會話過程中始終僅落后說話者數秒"。
Gemini 3.5 Live Translate通過持續生成語音,在"等待更多上下文以提升翻譯質量"與"即時翻譯以保持與說話者同步"之間取得平衡。
目前,Gemini 3.5 Live Translate已開始向Android和iOS版Google翻譯應用推送,用戶在佩戴耳機的情況下,點擊左下角的"實時翻譯"按鈕即可使用。
Android應用還同步推出了全新"收聽模式",在沒有耳機的情況下,用戶可通過手機聽筒收聽翻譯內容,操作方式與接聽普通電話一樣,"只需將手機舉到耳邊即可"。
Gemini 3.5 Live Translate同樣將引入Google Meet。此前,該視頻通話應用的語音翻譯功能僅支持5種語言。新模型支持70多種語言,使其"在一次會議中可實現2000余種語言組合的翻譯,突破了此前僅支持與英語互譯的局限"。在網頁端,控制欄中新增了一個按鈕,可立即啟動語音翻譯功能。
本月起,該功能將面向"特定Google Workspace企業用戶以私測形式開放",更大范圍的推廣將于今年晚些時候進行。
此外,Gemini 3.5 Live Translate也已通過Gemini Live API和Google AI Studio向開發者開放公開預覽。
在安全性方面,所有生成的音頻均已嵌入SynthID水印:
這一不可感知的水印直接融入音頻輸出之中,確保AI生成內容始終可被檢測識別,有助于防止錯誤信息的傳播。
Q&A
Q1:Gemini 3.5 Live Translate支持哪些語言?
A:Gemini 3.5 Live Translate支持超過70種語言,在Google Meet中可實現2000余種語言組合的實時翻譯,大幅突破了此前僅支持與英語互譯的5種語言限制。
Q2:Gemini 3.5 Live Translate的"收聽模式"怎么用?
A:"收聽模式"是Android版Google翻譯應用新增的功能。在沒有耳機的情況下,用戶無需任何額外設備,只需將手機舉到耳邊,即可通過手機聽筒收聽實時翻譯內容,操作方式與接聽普通電話完全相同。
Q3:Gemini 3.5 Live Translate和傳統翻譯系統有什么區別?
A:傳統逐段翻譯系統需要等待說話者說完一段話后才開始翻譯,容易產生明顯的停頓感。而Gemini 3.5 Live Translate采用連續語音生成方式,翻譯過程流暢自然,始終僅落后說話者數秒,同時還能保留原始語音的語調、節奏和音調。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.