(騰訊智能產(chǎn)品副總裁、騰訊教育副總裁李學(xué)朝)

“AI助手不僅要提供更加智能的交互體驗(yàn),還需要通過(guò)自學(xué)習(xí)和自適應(yīng)等來(lái)提升對(duì)于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達(dá)能力?!崩顚W(xué)朝表示,為賦予AI助手交互智能的能力,騰訊云小微整合了語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別等AI能力,融合AI Lab前沿AI技術(shù)以及搜狗數(shù)字人團(tuán)隊(duì)豐富的業(yè)務(wù)模式,打造了基于新一代多模態(tài)人機(jī)交互技術(shù)的全新數(shù)智人產(chǎn)品矩陣,實(shí)現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級(jí)。

談及數(shù)智人的技術(shù)優(yōu)勢(shì)時(shí),李學(xué)朝介紹道,在NLP、知識(shí)圖譜、視覺(jué)等全棧AI底層能力的加持下,數(shù)智人擁有強(qiáng)大的形象表現(xiàn)力、識(shí)別力和感知理解能力,能在不同行業(yè)的多種業(yè)務(wù)場(chǎng)景下做到“聽(tīng)得清、聽(tīng)得懂、會(huì)表達(dá)”;而3D超寫實(shí)、3D寫實(shí)、3D半寫實(shí)、2D真人、2D卡通五種數(shù)智人的風(fēng)格,搭配可定制形象和騰訊海量IP形象授權(quán),能讓數(shù)智人擁有豐富多樣的人物形象,以滿足不同場(chǎng)景下的服務(wù)需求。

(五款數(shù)智人亮相)

“云小微數(shù)智人應(yīng)用服務(wù)的兩大場(chǎng)景,分別是企業(yè)服務(wù)和生活服務(wù)?!崩顚W(xué)朝表示,目前數(shù)智人已經(jīng)為金融、文教傳媒、公共服務(wù)等行業(yè)的體驗(yàn)型業(yè)務(wù)場(chǎng)景提供解決方案,以坐席客服、審核面簽、理財(cái)顧問(wèn)等形象為用戶提供智能交互的新體驗(yàn),幫助企業(yè)在提升服務(wù)體驗(yàn)的同時(shí)實(shí)現(xiàn)降本增效的目的。

以金融行業(yè)為例,騰訊云小微數(shù)智人助力平安普惠打造了首個(gè)金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,兩年間已經(jīng)為500萬(wàn)個(gè)用戶提供7×24小時(shí)的自然可視化的人機(jī)智能交互服務(wù),在提升用戶服務(wù)體驗(yàn)的同時(shí),將審核成本降低60%。

“我們希望的是,通過(guò)數(shù)智人,在生活服務(wù)中為用戶帶來(lái)更多陪伴、更多信息交互以及更深的情感鏈接。”李學(xué)朝表示,未來(lái),騰訊云小微數(shù)智人希望能夠突破時(shí)間和空間的限制,打破虛擬和現(xiàn)實(shí)的邊界,在數(shù)字化進(jìn)程中為各行各業(yè)提供有溫度的智能交互服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。

以下為演講實(shí)錄:

尊敬的各位嘉賓、媒體朋友和線上的觀眾朋友們:

大家好,我是騰訊李學(xué)朝,很高興能在騰訊一年一度的數(shù)字生態(tài)大會(huì)中與大家進(jìn)行交流。

今天主要跟大家分享的是,騰訊云小微數(shù)智人的全新產(chǎn)品,并且從技術(shù)到服務(wù),從內(nèi)到外,從現(xiàn)在到未來(lái),講一講我們“開(kāi)啟有溫度的數(shù)智未來(lái)“的愿景是怎樣展開(kāi)的。

隨著人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)高速發(fā)展,各行業(yè)數(shù)字化進(jìn)程加快,不同業(yè)務(wù)場(chǎng)景對(duì)線上用戶服務(wù)都提出了更高的要求,AI助手除了要提供更加智能的交互體驗(yàn),還需要通過(guò)自學(xué)習(xí)自適應(yīng)等來(lái)提升對(duì)于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達(dá)能力。人機(jī)交互模式從文本客服升級(jí)為語(yǔ)音客服再到多模態(tài)人機(jī)交互系統(tǒng),也就是大家常說(shuō)的數(shù)字人,溝通效率和服務(wù)溫度都得到了大幅提升。

而騰訊云小微通過(guò)整合語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別等AI能力,同時(shí)連接騰訊豐富的內(nèi)容和服務(wù)生態(tài),面向使用場(chǎng)景打磨平臺(tái)能力,助力行業(yè)客戶打造有智能、有形象、可交互的數(shù)字分身,實(shí)現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級(jí),也就是騰訊云小微與AI Lab聯(lián)合開(kāi)發(fā)的新一代多模態(tài)人機(jī)交互系統(tǒng)——數(shù)智人。

最近搜狗正式并入騰訊,也為數(shù)智人能力提供了助力。數(shù)智人產(chǎn)品深度聯(lián)動(dòng)了云小微、AI Lab、搜狗,匯聚云小微綜合AI能力,融合AI Lab前沿AI技術(shù),以及搜狗數(shù)字人團(tuán)隊(duì)豐富的業(yè)務(wù)模式、作為多模態(tài)能力的服務(wù)載體,便捷地服務(wù)于機(jī)構(gòu)、企業(yè),持續(xù)賦能行業(yè)。

這些能力從內(nèi)而外賦予了產(chǎn)品極大的優(yōu)勢(shì)。

首先,通過(guò)AI技術(shù)的加持,數(shù)智人產(chǎn)品目前已擁有強(qiáng)大的形象表現(xiàn)力、識(shí)別力和理解能力,并且能夠保證最優(yōu)服務(wù)性能,在很多場(chǎng)景中都能做到“聽(tīng)得清、聽(tīng)得懂、會(huì)表達(dá)”。

聽(tīng)得清就是能夠把人的聲音精準(zhǔn)轉(zhuǎn)化成文本。騰訊云小微在語(yǔ)音識(shí)別方面深耕建模、降噪、口音與領(lǐng)域適應(yīng)等技術(shù)能力,讓數(shù)智人能夠適應(yīng)各種復(fù)雜的噪聲環(huán)境。同時(shí),可識(shí)別超過(guò)34種語(yǔ)種、方言,擁有超過(guò)46萬(wàn)的垂直場(chǎng)景熱詞庫(kù)。

聽(tīng)清后還需要聽(tīng)得懂。騰訊云小微數(shù)智人結(jié)合知識(shí)圖譜能力和垂直領(lǐng)域庫(kù),并充分運(yùn)用全雙工的能力,通過(guò)語(yǔ)音(ASR)+語(yǔ)義(NLP)雙向判斷,降低錯(cuò)誤響應(yīng)概率,可進(jìn)行超過(guò)11個(gè)語(yǔ)種的機(jī)器翻譯;同時(shí),通過(guò)流式語(yǔ)義+語(yǔ)義VAD,在商用環(huán)境中,服務(wù)端推流渲染方案文本驅(qū)動(dòng)首幀延遲已降低至600ms內(nèi),單臺(tái)服務(wù)器并發(fā)上限,半年內(nèi)提升了60%,在保障交互體驗(yàn)的同時(shí),大幅提升了接待的效率。

在表達(dá)交流能力上,騰訊云小微數(shù)智人由個(gè)性化沉浸式TTS、有風(fēng)格的語(yǔ)音合成技術(shù)、以及具備形象、情緒和動(dòng)作的虛擬人合成,擁有超過(guò)28種語(yǔ)音合成音色,超過(guò)30個(gè)擬人化形象,在技術(shù)內(nèi)測(cè)中實(shí)現(xiàn)了根據(jù)語(yǔ)義匹配肢體動(dòng)作,把對(duì)話內(nèi)容多模態(tài)多層次地表達(dá)出來(lái)。

此外,為了讓數(shù)智人有個(gè)性、有情感、更真實(shí)生動(dòng),我們提供了3D超寫實(shí)、3D寫實(shí)、3D半寫實(shí)、2D真人、2D卡通等5類數(shù)智人形象風(fēng)格,擁有超細(xì)微面部情感表情以及數(shù)百種肢體動(dòng)作,可以滿足各類場(chǎng)景需求。同時(shí),擁有騰訊的海量IP形象授權(quán),讓數(shù)智人的形象選擇更加豐富多樣。

每一位數(shù)智人都擁有著不同的形象和性格,可從事不同的職業(yè),并且,每一位都身懷絕技,與眾不同。這兩天,他們也參與到了數(shù)字生態(tài)大會(huì)多個(gè)專場(chǎng)的主持工作中,為所有與會(huì)觀眾帶來(lái)了他們的“職業(yè)首秀”。

云小微數(shù)智人一直在通過(guò)不斷的自學(xué)習(xí)、自適應(yīng),以求為用戶提供更主動(dòng)、更專業(yè)的服務(wù)。目前,他們已經(jīng)以不同的形象出現(xiàn)在金融、傳媒、文旅、出行等多個(gè)行業(yè)中,踐行著我們服務(wù)于人的理念。接下來(lái)讓我們看看,云小微數(shù)智人的落地應(yīng)用情況。

云小微數(shù)智人應(yīng)用服務(wù)的兩大場(chǎng)景,分別是企業(yè)服務(wù)和生活服務(wù)。

在企業(yè)服務(wù)方面,以往一直是以企業(yè)和服務(wù)提供者為中心,現(xiàn)在我們轉(zhuǎn)變?yōu)橐韵M(fèi)者和使用者為中心,通過(guò)人機(jī)交互與協(xié)創(chuàng),提升服務(wù)體驗(yàn)的同時(shí)實(shí)現(xiàn)降本增效。在生活服務(wù)方面,數(shù)智人以用戶體驗(yàn)提升為中心,通過(guò)實(shí)現(xiàn)“軟硬結(jié)合”,給用戶提供智能交互的新體驗(yàn)。

在企業(yè)服務(wù)場(chǎng)景中,數(shù)智人已優(yōu)先面向金融、文教傳媒、公共服務(wù)等行業(yè)的體驗(yàn)型業(yè)務(wù)場(chǎng)景提供解決方案,可擔(dān)任坐席客服、審核面簽、理財(cái)顧問(wèn)、資訊播報(bào)、會(huì)展主持、導(dǎo)游導(dǎo)覽等多種角色。

接下來(lái)大家可以通過(guò)幾個(gè)案例進(jìn)行更深入的了解:

在金融領(lǐng)域,我們助力平安普惠落地了首個(gè)金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,針對(duì)企業(yè)面臨的人工成本攀升、人力缺乏、員工工作時(shí)間無(wú)法保障全時(shí)段服務(wù)等痛點(diǎn),通過(guò)自然可視化的人機(jī)智能交互,打造金融數(shù)智人分身。目前已累計(jì)服務(wù)用戶500萬(wàn),審核成本降低60%,保障了2年間7x24h的在線服務(wù),極大提升了用戶服務(wù)體驗(yàn)。

在疫情期間,觀眾無(wú)法親臨展廳和現(xiàn)場(chǎng),近距離參與各項(xiàng)活動(dòng),給很多展會(huì)活動(dòng)的舉辦帶來(lái)了困難。我們?yōu)橹袊?guó)(深圳)國(guó)際文化產(chǎn)業(yè)博覽交易會(huì)打造了線上虛擬講解員,擁有講解服務(wù)能力、多種情緒表達(dá)能力,能夠?qū)φ箯d、展館的相關(guān)問(wèn)題對(duì)答如流,并配合場(chǎng)景作出生動(dòng)的情緒動(dòng)作反饋,讓用戶在疫情期間,突破空間限制,享受互動(dòng)性極強(qiáng)的在線講解游覽體驗(yàn)。

在新聞播報(bào)領(lǐng)域,我們與新華社合作推出了全球首個(gè)AI合成主播。依托少量音視頻數(shù)據(jù)即可快速、低成本生成主播形象,輸入文本即可AI合成播報(bào)實(shí)時(shí)音視頻流,主播的表情、唇動(dòng)自然且專業(yè),基本與真人無(wú)異。到目前為止AI合成主播已經(jīng)累計(jì)播報(bào)新聞超過(guò)1萬(wàn)條,保證播報(bào)零誤差,可實(shí)現(xiàn)對(duì)日常和突發(fā)事件的實(shí)時(shí)響應(yīng)。

可以說(shuō),數(shù)智人具備降本、增效、提升服務(wù)體驗(yàn)、增強(qiáng)服務(wù)靈活性等優(yōu)勢(shì),比如數(shù)字坐席不但可提供7*24小時(shí)全時(shí)段、大體量服務(wù),成本也僅為真人坐席的1/5,可真正做到多維度提升企業(yè)服務(wù)能力。隨著數(shù)智人技術(shù)的不斷迭代升級(jí),我們相信科技創(chuàng)新的力量也將為企業(yè)服務(wù)創(chuàng)造更大的價(jià)值和可能。

在生活服務(wù)場(chǎng)景,騰訊云小微數(shù)智人也有著很大的應(yīng)用空間。數(shù)智人以交互智能增強(qiáng)人機(jī)互動(dòng),在智能車載、智能交通、智能家居、智能硬件等智能服務(wù)場(chǎng)景,為用戶提供更便捷、智能的服務(wù)。

我們的核心思路是:讓數(shù)智人與智能設(shè)備結(jié)合,打造以用戶為中心的生活服務(wù)。

一方面,數(shù)智人可以助力提升公眾服務(wù)效率。比如,數(shù)智人可及時(shí)、高效地處理用戶在公共交通場(chǎng)景中的票務(wù)等問(wèn)題,可代替人力進(jìn)行政策問(wèn)答,提升政策辦事問(wèn)答效率。同時(shí),憑借語(yǔ)音交互能力優(yōu)勢(shì),加強(qiáng)對(duì)中老年人等群體的服務(wù)關(guān)懷。

另一方面,數(shù)智人可憑借全新的視覺(jué)表達(dá),為用戶提供自然、豐富的智能交互服務(wù)。比如在智能家居中,用戶通過(guò)語(yǔ)音指令即可隨時(shí)隨地與數(shù)智人交流;個(gè)性化的形象表現(xiàn)和動(dòng)作表達(dá)能力,也能打造出更優(yōu)的虛擬偶像服務(wù)。未來(lái),數(shù)智人技術(shù)將重點(diǎn)向融合文字、聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)、肢體動(dòng)作等多維度感知的多模態(tài)交互方式演進(jìn)。

我們希望的是,通過(guò)數(shù)智人,在生活服務(wù)中為用戶帶來(lái)更多陪伴、更多信息交互以及更深的情感鏈接。首先,全天陪伴可隨時(shí)呼喚,提升交互效率;其次,有問(wèn)題直接問(wèn),讓中老年人也可簡(jiǎn)單方便地使用,打破數(shù)字化中的科技鴻溝,高度還原人與人之間的交流,打造有溫度的交流體驗(yàn),拉近個(gè)人與技術(shù)的距離。

同時(shí),數(shù)智人支持個(gè)性化自定義設(shè)置,讓企業(yè)和用戶都可打造屬于自己獨(dú)一無(wú)二的數(shù)智人。

前面說(shuō)的都是我們的過(guò)去,我們過(guò)往的成就,接下來(lái)讓我們說(shuō)一說(shuō)未來(lái)。未來(lái),我們的數(shù)智人會(huì)向什么方向發(fā)展,又將為社會(huì)創(chuàng)造哪些價(jià)值呢?

正如我今天分享的主題“溝通有溫度,服務(wù)新高度”,未來(lái),騰訊云小微數(shù)智人希望能夠突破時(shí)間和空間的限制,打破虛擬和現(xiàn)實(shí)的邊界,在數(shù)字化進(jìn)程中,為各行各業(yè)提供有溫度的智能交互服務(wù)。

我們將不斷提升平臺(tái)能力,輸出更優(yōu)質(zhì)的AI應(yīng)用解決方案,與更多行業(yè)實(shí)現(xiàn)場(chǎng)景共建,以定制化的服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。同時(shí),在不斷進(jìn)行科技創(chuàng)新、產(chǎn)品創(chuàng)新、模式創(chuàng)新的過(guò)程中,更好地服務(wù)社會(huì),服務(wù)于人,為社會(huì)創(chuàng)造更大的價(jià)值,從而全面開(kāi)啟全新的有溫度的數(shù)智未來(lái)!謝謝大家!

分享到

xiesc

相關(guān)推薦