(百度CTO王海峰在百度世界2020現(xiàn)場)

繼金融數(shù)字人、虛擬主持人等“虛擬人”陸續(xù)發(fā)布后,2020百度世界大會上,百度CTO王海峰發(fā)布了具備認知能力、可機機對話的終端虛擬人?!靶】怠?、“小李”兩位虛擬人依據(jù)康輝和李彥宏20多年前的形象、記憶和所擁有的知識打造,不僅形象、動作、聲音逼近真人,他們還對康輝、李彥宏本人的提問對答如流。兩位虛擬人之間的對話,更一度將直播推向高潮。

  (百度CTO王海峰發(fā)布了具備認知能力、可機機對話的終端虛擬人“小康”和“小李”)

不止“人機對談”還能“機機對話”!央視直播虛擬人超有梗對談

不止是虛擬二次元的卡通形象,也不止是模擬真人擔當主播,這次百度直接將20多年前的康輝和李彥宏請到了他們自己面前,在央視直播間里展開了一場“跨時空對談”。

  “小康是吧?我得先測測你是不是真的年輕的我,說一件我最難忘的事兒吧?”“我高中曠課看了1988年漢城奧運會開幕式。”猝不及防被爆年輕時趣事的康輝又考驗了小康的口條?,F(xiàn)場,康輝還追問了“小李”創(chuàng)業(yè)之初做過最瘋狂的事,年輕的“小李”坦然爆料自己壓力大的時候常去蹦迪。

表現(xiàn)自然、對答如流、時不時“歪頭殺”,還能回憶出二十年前自己生活工作中有趣細節(jié)的兩位虛擬人得到了“正主”本人的點贊認證。

更令人驚喜的是,此次直播中兩位虛擬人自個兒還互相交流了一番對于電影和讀書的見解,談到關(guān)于古樹的書時,“小李”秀出了如李彥宏本人一般對植物的深入了解,聊起了北京戒臺寺的白皮松。從“人機對話”到“機機對話”,一個字的差別,背后是人工智能認知能力的極大飛躍。

百度大腦全新升級! 支撐虛擬人能思考、有知識

這樣“形神兼?zhèn)洹钡奶摂M人背后,事實上整合了百度大腦包括視覺、語音、語言與知識等全方位的AI技術(shù)。在視覺、語音技術(shù)賦予虛擬人“有其形”之外,“有其神”是此次技術(shù)的最大亮點。

“與我們以前見過的虛擬人相比,這個虛擬人有知識、能理解,會讓你覺得面對的是一個有思考能力的‘真人’。” 百度CTO王海峰揭秘。而這一切的實現(xiàn)正是基于全新升級、擁有更強大理解能力的百度大腦。

目前,百度大腦已掌握超5500億的海量知識,覆蓋我們生活的方方面面,更包括醫(yī)療、法律、金融、科技等領(lǐng)域的專業(yè)知識。在大規(guī)模知識的基礎(chǔ)上,百度還研發(fā)了知識增強的持續(xù)學習語義理解框架,使百度大腦能夠綜合語音、語言、視覺等不同信息獲得對世界的統(tǒng)一認知。這項能力,正是此次全新升級的百度大腦6.0的核心能力,即“知識增強的跨模態(tài)深度語義理解”。有了這樣的理解能力,機器就能聽懂語音,看懂圖像視頻,理解語言,進而持續(xù)學習、綜合理解真實的世界。

圖片包含 監(jiān)控, 男人, 站, 鐘表

描述已自動生成

  (百度CTO王海峰在現(xiàn)場重磅發(fā)布百度大腦6.0)

生成、展示門檻大大降低 虛擬人技術(shù)應(yīng)用潛力無限

此次虛擬人還有一大突破在于,其生成和展示門檻已大大降低。以往虛擬人的生成依然需要真人來驅(qū)動,要被模擬者專門錄制長時間的視頻素材。而現(xiàn)在,只需要幾分鐘的短視頻,或者使用幾分鐘已有的視頻素材就能直接生成虛擬人。此外,這項虛擬人計算量非常低,這也意味著它可以在普通的手機上流暢運行,我們可以隨時和它進行對話聊天。

更低的生成成本、更廣的終端部署,無疑為虛擬人應(yīng)用打開了極大的想象空間。打開銀行APP有虛擬人客戶經(jīng)理為你辦理業(yè)務(wù),點擊博物館小程序會有虛擬人講解員隨時回答你的問題……在金融領(lǐng)域、旅游咨詢、醫(yī)療健康、移動通信等領(lǐng)域,這樣的虛擬人服務(wù)都非常有價值,它對于每一位用戶都是私人訂制、終身服務(wù)。更優(yōu)質(zhì)、知識密集的服務(wù),能夠惠及更多的普羅大眾。

或許在不遠的未來,依托虛擬人技術(shù)不止是能找到曾經(jīng)的自己,還能喚回逝去的親人,他將以另一種方式陪伴在你身邊。

分享到

zhangnn

相關(guān)推薦