然而,結(jié)局大家都看到了,ET準確無誤地報出了5位觀眾手上的牌的花色和點數(shù),全場震驚。
其實ET并不是真的有“讀心術(shù)”,而是利用了一個名為De Bruijn序列的數(shù)學方程式,再加上強大的人工智能技術(shù),才完成了這場完美的表演show。
De Bruijn序列的原理很復雜,這里不詳述,感興趣的可以上網(wǎng)搜索下。但De Bruijn序列的結(jié)論很簡單,就是從這樣的序列中任意取出相鄰n個數(shù),它們的二進制排列一定不相同。這就意味著,ET只需將5名觀眾手上的黑牌和紅牌(對應二進制里的0和1)按順序出來,就只有一個唯一的解。
簡單來說,將牌事先按順序排列,不管怎么切牌,排序組合的可能性縮減到32種,然后根據(jù)下面這張圖表尋找對應的排列形式,答案就呼之欲出了。
如果一個普通的魔術(shù)師能完成這樣的魔術(shù)(需要對上面這張表倒背如流),你了解真相后可能會驚嘆他的記憶力。
但當一個人工智能表演這個魔術(shù)時,就不僅僅是記憶力這么簡單了。
在這場魔術(shù)秀中,阿里云ET全面展示了語音識別、語音合成、自然語言理解、實時圖像識別、機器學習等人工智能的綜合能力。
比如在與華少的交流中,ET不僅能“聽懂”華少的話并在屏幕下方實時打出字幕,還能給出相應的回復,對答如流。不僅如此,ET還“看出”了華少手中多出一副撲克牌。
節(jié)目中,被稱為“中國好舌頭”的華少在與ET的對話時刻意加快了語速,ET仍然準確無誤實現(xiàn)了實時語音識別,并將字幕輸出在屏幕上。這背后,是阿里云iDST技術(shù)團隊研發(fā)的智能語音交互(Intelligent Speech Interaction)系統(tǒng), 包含語音識別、語音合成、自然語言理解等技術(shù)。
而在ET識別黑牌的過程中,應用到的就是人工智能的圖像識別技術(shù)。在觀眾抽取撲克牌時,ET已經(jīng)完成了對5位觀眾的面部識別,并利用算法建立了器官輪廓定位,以便之后識別出是否有人轉(zhuǎn)身。
目前,阿里云ET的人臉算法已經(jīng)覆蓋了人臉檢測、器官輪廓定位、人像美化、性別年齡識別、1對1人臉認證和1對多人臉識別等多個方向,用機器學習的方法,包括卷積神經(jīng)網(wǎng)絡、Supervised Descent Method等,實現(xiàn)了高精度和高效的技術(shù),人臉識別在LFW上識別率超過99.5%。
基于此,ET能夠輕松識別出黑牌觀眾轉(zhuǎn)身的動作,準確報出5名觀眾的手牌。過程看似簡單,背后的算法和所需的大規(guī)模計算能力卻并非一朝一夕就能煉成的。
無論是語音識別還是圖像識別,阿里云ET的底層都依賴于深度學習算法以及大規(guī)模計算能力。一套復雜算法模型的訓練往往需要千億級別的樣本數(shù)據(jù),這就對背后的計算能力提出了很高的要求。
其實,ET能做的不僅僅是當個魔術(shù)師這么簡單,借助深度神經(jīng)網(wǎng)絡等機器學習技術(shù),阿里云人工智能已經(jīng)具備利用數(shù)據(jù)為一整座城市提供思考和決策的能力,目前,杭州政府聯(lián)合阿里云等13家企業(yè),為這座擁有2200多年歷史的城市安裝了一個人工智能的杭州城市數(shù)據(jù)大腦,將杭州打造成一座能夠自我調(diào)節(jié)、與人類良性互動的城市。在交通領(lǐng)域的試點中,ET通過對路口交通狀況的預測調(diào)控紅綠燈,使部分路段的車輛通行速度最高提升了11%。
人工智能正在以超乎想象的速度融入你的生活,其實ET已經(jīng)成為你身邊一個真正的魔術(shù)師了呢。