IT之家 7 月 20 日消息,ElevenLabs 昨日(7 月 19 日)發(fā)布博文,介紹推出了全新的 Turbo v2.5 文本到語音 AI 模型,支持普通話等 32 種語言,為全球近 80% 的地區(qū)提供高質(zhì)量、低延遲的 AI 對(duì)話。
Turbo v2.5 模型首次支持越南語、匈牙利語和挪威語,這些語言的使用人數(shù)分別為 8500 萬、1300 萬和 530 萬。
本次更新還重點(diǎn)提高了印地語、法語、西班牙語、普通話和其他 27 種語言的響應(yīng)速度,最高提升了 3 倍;英語的速度提高了 25%。IT之家附上宣傳視頻如下:
Turbo v2.5 模型結(jié)合了先進(jìn)的文本到語音技術(shù)和最新的低延遲模型架構(gòu),用戶基本上不需要等待,就能提供高質(zhì)量的 AI 生成音頻輸出。
Turbo 模型實(shí)現(xiàn)了快速語音合成,同時(shí)保持流暢和自然的高品質(zhì)音質(zhì),響應(yīng)時(shí)間不超過 400 毫秒。
ElevenLabs 成立于 2022 年,總部位于倫敦,專注于開發(fā)人工智能語音模型和工具,可以創(chuàng)建不同語言、口音和情感的合成語音。
公司首席執(zhí)行官 Mati Staniszewski 表示,ElevenLabs 目前擁有約 40 名遠(yuǎn)程辦公員工,分布在全球各地,并計(jì)劃到年底將團(tuán)隊(duì)擴(kuò)大至 100 人。
ElevenLabs 非常重視人工智能內(nèi)容的透明度,并開發(fā)了 AI Speech Classifier 等工具幫助識(shí)別合成音頻,同時(shí)也在開發(fā)用于電影配音的工具,并正在開發(fā)一個(gè)允許用戶生成 AI 語音并通過授權(quán)賺錢的平臺(tái)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。