「AI 文本理解」模型
·AI有聲內(nèi)容創(chuàng)作平臺(tái),批量高效的生產(chǎn)工具
值得提及的是,火山語音還自主打造了AI有聲內(nèi)容創(chuàng)作平臺(tái),以實(shí)現(xiàn)AI多角色有聲內(nèi)容的批量高效生產(chǎn)。簡(jiǎn)單來說用戶只需將目標(biāo)書籍文本導(dǎo)入,即可由平臺(tái)自動(dòng)完成角色的抽取、對(duì)話/旁白的區(qū)分,同時(shí)判定對(duì)話所屬的角色和情感。在配音環(huán)節(jié),用戶可以自主選擇配置AI音色來匹配書中各角色,也可選擇簡(jiǎn)單標(biāo)定角色人設(shè),依據(jù)平臺(tái)內(nèi)置策略一鍵配音。完成配音后,平臺(tái)即會(huì)根據(jù)自動(dòng)預(yù)測(cè)的信息完成音頻的自動(dòng)合成和拼接,僅需幾小時(shí)便可完成一部數(shù)千章的成品有聲書的生產(chǎn)!
此外,為了滿足連載追更用戶的聽書訴求,平臺(tái)還實(shí)現(xiàn)了連載自動(dòng)更新的功能,即收到線上文本更新的通知后,幾秒鐘之內(nèi)即可完成更新章節(jié)音頻的生產(chǎn)和上線,用戶可以通過聽書功能實(shí)時(shí)追更、無需等待。
最后,為了滿足用戶差異化的創(chuàng)作需求,該平臺(tái)還提供了一系列音頻調(diào)整和精修功能,例如指定特定詞語發(fā)音;控制句子的停頓、連讀、語速和音調(diào)等,可以讓AI自動(dòng)合成的音頻演繹更加完美。
火山語音,長(zhǎng)期以來面向字節(jié)跳動(dòng)各大業(yè)務(wù)線提供優(yōu)質(zhì)的AI語音技術(shù)能力以及全棧語音產(chǎn)品解決方案。目前團(tuán)隊(duì)的語音識(shí)別和語音合成覆蓋了多種語言和方言,多篇論文入選各類AI 頂級(jí)會(huì)議,技術(shù)能力已成功應(yīng)用到抖音、剪映、番茄小說等多款產(chǎn)品上,并通過火山引擎開放給外部企業(yè)。