從產(chǎn)業(yè)角度看,從政府到企業(yè)到人民百姓,發(fā)展數(shù)字經(jīng)濟成為各方認可的方向。那么,在人工智能應(yīng)用爆發(fā)、數(shù)字中國建設(shè)高峰期,人工智能領(lǐng)域還需要實現(xiàn)哪些技術(shù)突破?如何領(lǐng)跑數(shù)字經(jīng)濟?
人機大戰(zhàn)再次升級
此次斗詩是人機大戰(zhàn)的升級,是一場人類高手與AI作詩的較量,更是一次人工智能認知層的突破。
相較以往的人機大賽,無論是圍棋大戰(zhàn)還是德州撲克對決,大都是基于數(shù)據(jù)驅(qū)動,是隨著算法和計算力的提升而取得的機器勝利。
然而目前在語義理解上,突破者甚少。百分點將深度學(xué)習(xí)引入到自然語言處理技術(shù)中,并結(jié)合動態(tài)知識圖譜,基于對80萬首詩詞文章的學(xué)習(xí),可根據(jù)不用的語境智能生成唐詩以及五十多個詞牌的宋詞,對傳統(tǒng)文化與最新的人工智能技術(shù)進行了創(chuàng)新融合。
實際上,AI李白的首次曝光是在春節(jié)期間,主要圍繞新年送祝福主題。此次峰會上展出了第二個版本,不僅可以讓人體會到“一秒變李白”的神奇,還能與人互動對“飛花令”,將《中國詩詞大會》由線上轉(zhuǎn)到線下真實場景中,讓人工智能應(yīng)用普惠到更廣泛人群中。并且更好玩有趣,機器人可識別觀眾語音,根據(jù)語音生成個性化的詩和詞。
也因此,在人民日報旗下人民直播平臺上,全程直播了這場AI李白挑戰(zhàn)雷海為的斗詩賽,結(jié)果不出意料,人類高手雷海為贏得比賽。直播的同時,基于樂調(diào)查的實時在線投票中,支持AI李白的觀眾反而占了一多半。
對此,百分點董事長兼CEO蘇萌博士認為,在即興創(chuàng)作詩詞的挑戰(zhàn)賽中,人機各領(lǐng)風(fēng)騷。在全文邏輯和情感細膩度上,人類高手更勝一籌;在寫作效率和短文本的用詞上機器后來居上。
經(jīng)典古詩詞是語言中的精華,充滿人類情感,可以使語言思維得以升華。這就如同AI李白,也是通過NLP和知識圖譜對古典詩詞進行語義理解,自動學(xué)習(xí)發(fā)現(xiàn)詩詞中的特征和規(guī)律,捕獲上下文復(fù)雜的語言依賴關(guān)系,從而訓(xùn)練出智能作詩的模型。未來在深度學(xué)習(xí)算法持續(xù)升級換代后,系統(tǒng)也會持續(xù)進行自學(xué)習(xí)、自優(yōu)化。
蘇萌博士表示,這場斗詩賽,意味著機器已經(jīng)走進藝術(shù)領(lǐng)域,可以理解人類,進行一些創(chuàng)造性突破。希望今后可以用大規(guī)模盲測的方式量化評估人與機器的詩詞創(chuàng)作水平。
未來突破
AI正在以人類無法想象的速度演進。
最近幾年,隨著大數(shù)據(jù)技術(shù)、算法以及GPU計算能力的大幅度提升,使得神經(jīng)網(wǎng)絡(luò)的計算效率得到了顯著的提升,深度學(xué)習(xí)在圖像、人臉識別等感知層已經(jīng)實現(xiàn)明顯突破,比如峰會現(xiàn)場“刷臉”入場采用的人臉識別技術(shù),其準確度高達99.7%,已超越人類。
蘇萌博士認為,智能是解決實際問題的智能,智能進化三部曲包括感知、認知、決策,其中智能決策是其終極智能。然而,從感知到認知再到?jīng)Q策,每一步突破都會越來越難。尤其是NLP被比爾?蓋茨形容為“人工智能皇冠上的明珠”,處于認知智能最核心的地位,一旦技術(shù)突破將會推動人工智能整體的進展。
但是目前,NLP目前依然處于基于淺層語義的分析階段,缺少對現(xiàn)實的理解及對現(xiàn)實通用知識的掌握,在效果提升上已遇明顯瓶頸。
百分點早在2016年將深度學(xué)習(xí)引入自然語言處理上后已意識到此問題,便著手在知識圖譜結(jié)合自然語言上進行探索研發(fā)。目前百分點在分詞識別準確度已經(jīng)達到98.97%、實體識別準確度達到91.45%,已走在了行業(yè)前沿。通過自然語言處理技術(shù),理解人類的語言、思維,語言是人類文明傳承的載體,一旦機器學(xué)會人類語言思維,可以推動知識圖譜的進一步發(fā)展,機器可以更好的“讀懂”人類。
此次斗詩大賽,說明了百分點在自然語言生成技術(shù)(NLG)方面實現(xiàn)了突破,也是人民日報社聯(lián)合百分點引領(lǐng)國內(nèi)媒體率先探索智能采編業(yè)務(wù)的體現(xiàn)。在認知層,百分點將持續(xù)投入研發(fā),實現(xiàn)更多突破。
在會上,人民日報數(shù)字傳播有限公司董事長徐濤表示,已與百分點達成深度戰(zhàn)略合作關(guān)系,希望將百分點在人工智能領(lǐng)域的突破性技術(shù)應(yīng)用到人民日報數(shù)字屏幕上,給社會提供更多的數(shù)字文化產(chǎn)品。
各種人機頻繁上演的背后,實際上是意味著我們已經(jīng)進入到人機共生的未來社會新常態(tài)。如果說90后屬于互聯(lián)網(wǎng)原住民,那么現(xiàn)在的青少年,就是人工智能爆發(fā)期的原住民。因此,展館中處處可以看到“帶娃參會”的場景,更有中小學(xué)校組織學(xué)生來參觀。
未來,AI2.0時代產(chǎn)生的各種應(yīng)用產(chǎn)品,會讓人類生活更加美好,另一方面,不善于使用人工智能的,會真正被同齡人拋棄。
領(lǐng)跑數(shù)字化轉(zhuǎn)型
在峰會主論壇上,國家網(wǎng)信辦發(fā)布了《數(shù)字中國建設(shè)發(fā)展報告(2017年)》。報告指出,我國數(shù)字經(jīng)濟規(guī)模已經(jīng)位居全球第二,尤其是“互聯(lián)網(wǎng)+政務(wù)”讓人民群眾獲得感顯著增強。無論是政策層還是實際應(yīng)用場景都已明晰,未來將進入加速跑階段。
那么需要思考的是,如何才能領(lǐng)跑?在數(shù)字中國建設(shè)進入高峰期之時,所處的是數(shù)據(jù)密集型和知識密集型時代,數(shù)據(jù)是數(shù)字經(jīng)濟最基本的物質(zhì)基礎(chǔ),人工智能技術(shù)是其技術(shù)手段,以其為代表的新一代信息技術(shù)將成為拉動數(shù)字經(jīng)濟的新動能。
百分點自2015年開始深耕數(shù)字化轉(zhuǎn)型,為解決企業(yè)機構(gòu)實際問題,基于大數(shù)據(jù)全棧技術(shù)和人工智能認知技術(shù)進行雙輪驅(qū)動,通過語義理解將信息知識化,從語義到知識,最終支撐政府進行智能決策。
目前,百分點已經(jīng)覆蓋主流媒體出版機構(gòu)、政府公務(wù)事務(wù)、智能制造、零售等龍頭企業(yè),并建設(shè)了海外國家級大數(shù)據(jù)和人工智能平臺,是國內(nèi)實體經(jīng)濟數(shù)字化轉(zhuǎn)型和數(shù)字經(jīng)濟國際合作方面的先行者。