IT之家 6 月 9 日消息,北京時間 9 日(今天)晚間,谷歌正式發(fā)布最新的實時語音互譯音頻模型 Gemini 3.5 Live Translate,邁出實時翻譯的下一步。
Gemini 3.5 Live Translate 可自動識別 70 多種語言,并生成流暢、自然的翻譯語音,同時保留說話者的語調(diào)、語速和音高。

根據(jù)介紹,傳統(tǒng)輪流式系統(tǒng)通常要等說話者說完后才開始翻譯,Gemini 3.5 Live Translate 則會連續(xù)生成語音,在“等待更多上下文以提升翻譯質(zhì)量”和“即時翻譯以跟上說話者節(jié)奏”之間取得平衡。整個會話過程中,翻譯音頻可以保持流暢,避免尷尬停頓,并始終只比說話者慢幾秒。
Gemini 3.5 Live Translate 今起陸續(xù)登陸谷歌產(chǎn)品:
開發(fā)者可通過 Gemini Live API 和 Google AI Studio 使用公開預(yù)覽版
企業(yè)客戶可從本月起在 Google Meet 中使用私有預(yù)覽版
普通用戶可通過 Android 和 iOS 版谷歌翻譯使用
Gemini 3.5 Live Translate 會在語音流式傳輸過程中同步處理內(nèi)容,讓跨語言交流更加順暢。模型可以自動處理多語言輸入,無需手動調(diào)整設(shè)置,抗噪能力也能幫助應(yīng)用適應(yīng)嘈雜、復(fù)雜和不可預(yù)測的環(huán)境。開發(fā)者可以把 Gemini 3.5 Live Translate 用于多語言通話、會議、課程、直播和廣播等場景,提供實時口譯體驗。
據(jù)IT之家了解,Gemini 3.5 Live Translate 將登陸全球 Android 和 iOS 版谷歌翻譯應(yīng)用。用戶使用實時翻譯功能時,只需連接任意耳機,就可以在 70 多種語言中獲得更順暢的翻譯,并讓譯文語音更接近說話者的語氣。
Android 用戶還將陸續(xù)獲得基于 3.5 Live Translate 的全新“聆聽模式”。用戶可以像接電話一樣把手機貼到耳邊,直接通過手機聽筒收聽翻譯音頻。在沒有耳機、又不希望旁人聽見翻譯內(nèi)容時,這種模式會更方便。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。