
字節(jié)推語音生成模型Seed-TTS 擅長感情控制,聲音與真人無異
這篇文章介紹了字節(jié)跳動團(tuán)隊提出的新型語音生成模型Seed-TTS,該模型基于自回歸Transformer架構(gòu),具有極高的語音質(zhì)量和表現(xiàn)力,難以區(qū)分與人類語音的差異。它在情感控制、小說配音和跨語言內(nèi)容創(chuàng)作等方面表現(xiàn)出色,通過自我蒸餾和強(qiáng)化學(xué)習(xí)...
這篇文章介紹了字節(jié)跳動團(tuán)隊提出的新型語音生成模型Seed-TTS,該模型基于自回歸Transformer架構(gòu),具有極高的語音質(zhì)量和表現(xiàn)力,難以區(qū)分與人類語音的差異。它在情感控制、小說配音和跨語言內(nèi)容創(chuàng)作等方面表現(xiàn)出色,通過自我蒸餾和強(qiáng)化學(xué)習(xí)...