對(duì)此,火山引擎將大模型與實(shí)時(shí)音頻技術(shù)(RTC)相結(jié)合,從而能夠提供端到端的大模型實(shí)時(shí)對(duì)話能力,企業(yè)可以在自身的AI應(yīng)用中具體應(yīng)用這一實(shí)時(shí)語音功能,讓用戶真正做到和模型非常直接、自由的對(duì)話。
通過視頻Demo,譚待還在現(xiàn)場具體演示了大模型實(shí)時(shí)對(duì)話能力。他表示,通過將大模型與RTC結(jié)合,人與AI之間實(shí)現(xiàn)了更加自然的對(duì)話,首先是對(duì)話可以隨時(shí)插話、打斷,實(shí)現(xiàn)了如同真人之間的對(duì)話效果。
同時(shí),在以上的前提下,AI聲音仍然具備很好的表現(xiàn)力和情感色彩,讓用戶體驗(yàn)到與真人交流的感覺,并且AI也更加“懂”用戶。
最后,通過大模型推理與RTC端到端優(yōu)化的疊加,火山引擎已經(jīng)可以將這種人機(jī)對(duì)話的延遲做到1秒以內(nèi),即使在網(wǎng)絡(luò)環(huán)境很差,可能80%丟包的情況下,仍然可以保持非常清晰、流暢的通話質(zhì)量。
譚待表示,相信這樣的新技術(shù),可以讓AI時(shí)代的人機(jī)交互,上升到一個(gè)新的高度。(作者:梁蕓)