以下為速記部分內(nèi)容,未經(jīng)演講人確認(rèn):
楊應(yīng)麟:各位嘉賓,我是楊應(yīng)麟,美國國科微美國研究所的總經(jīng)理。
今天我給大家演講的內(nèi)容的是關(guān)于AI的方面,在我之前的演講嘉賓談到了不同的應(yīng)用場景以及分類,我們也發(fā)現(xiàn)了它還有一些不同尋常的應(yīng)用場景,包括股市或者癌癥治療的一些非常態(tài)情況的捕捉,除此之外,還有現(xiàn)在可以和人類下棋的阿爾法狗機器人等等?;谝陨喜煌姆诸悾覀兛梢宰R別出迎面而來的公交車或者是一輛車輛,以及看到人行道是否處于可以通行的狀況,綠燈是否亮了,以上這些都是人工智能的具體應(yīng)用。比如,在這里我們看到一名行人正準(zhǔn)備過馬路,但是我們又可以看到方向不同,那么我們到底是轉(zhuǎn)向左邊還是右邊呢?這個是瞬間做出的決定,它停下然后馬上又跑起來,這就是AI避免公交事故的一個辦法。
所以我們必須有這樣一個系統(tǒng),將不同的數(shù)據(jù)進(jìn)行積累,包括來自傳感器和攝象頭的數(shù)據(jù),這些數(shù)據(jù)來了之后,我們必須對他們進(jìn)行一些處理,如噪聲的過濾,或者是數(shù)據(jù)格式的處理,還有數(shù)據(jù)的安全性壓縮等等,另外還有機器學(xué)習(xí)等等。我們還會有不同的候選模型進(jìn)行選擇,然后才知道哪個是最好的學(xué)習(xí)模型范本,看左邊也就是數(shù)據(jù)處理的部分,網(wǎng)上或者是一些商場會儲存這些數(shù)據(jù),然后借助模型版本進(jìn)行機器學(xué)習(xí),然后把他們歸納起來應(yīng)用,所以這里有很多的數(shù)據(jù)。另外還有波音公司的無人駕駛,它每小時會有80TB的數(shù)據(jù)產(chǎn)生,所以我覺得這一切歸根結(jié)蒂都涉及到機器學(xué)習(xí),所以我會把這個部分移除。
現(xiàn)在我們看一下數(shù)據(jù)中心需求很大的功能。我們所做的是虛擬學(xué)習(xí),如何使這兩個部分能夠聯(lián)系起來呢?數(shù)據(jù)和學(xué)習(xí),所以我們在中間填補了一些虛擬化。我們有一個這樣的虛擬化儲存器。我們把它們連接起來,所以會有很多的數(shù)據(jù)在中間來來回回的轉(zhuǎn)移,這個部分有數(shù)據(jù)的處理,所以我們看了儲存。我們讓數(shù)據(jù)在儲存器中轉(zhuǎn)移,包括前面我們提到的一個圖片,會在這里我們被放大或縮小,這就是我們的人工智能學(xué)習(xí)的一個算法。
那么,我們現(xiàn)在談到這些技術(shù)有哪些優(yōu)勢呢?在這張片子里,我們看到固態(tài)硬盤的一個學(xué)習(xí)部分,通過找到它的數(shù)據(jù)正如之前我們提到的無人駕駛的汽車一樣,那么我們可以去管理和處理這些數(shù)據(jù),而且這樣的一個機器學(xué)習(xí)的過程應(yīng)該是有一個層級的,最重要的是找到合適的算法,使我們能夠通過這個算法建立起這樣一個級別。另外還有深度學(xué)習(xí)的一些算法,大概可能會有50個層級用到這個里面,我們必須要找到一個最好的算法去使用。因此說,這部分是一個有序的模型,有級別的、層級的模型,這些不同的節(jié)點都是非常重要的。
還有一個虛擬的機器的這樣的數(shù)據(jù)中心,所有的信心我們都可以通過它來處理,最后有什么好處呢?基本上我會減少處理量,通過這樣一個方法它是一個關(guān)鍵點。每年我們會發(fā)現(xiàn)和診斷400萬例這樣的例子,所以如果我們通過這樣的方法幫助我們?nèi)チ私膺@些全球被診斷的新增的癌癥病例,包括去進(jìn)行數(shù)據(jù)的分析,還考慮到這些病患是否有足夠的經(jīng)濟來源,去服藥,去確保在它最終死亡之前能夠找到解決辦法。
下面我想談一下我們的企業(yè),今天早上我也聽到有些學(xué)生會受到邀請來到這里參加大會,這是一個很好的學(xué)習(xí)機會。我們的公司在北臺和硅谷設(shè)有研發(fā)中心,在成都、北京、上海、深圳等地也有我們的分子公司等。去年國科微在深交所上市,我們的員工有近600人,絕大多數(shù)在美國從事研發(fā)的工作人員都有博士學(xué)位。我們的業(yè)務(wù)范圍包括四各方面,監(jiān)控、廣播電視、存儲,還有物聯(lián)網(wǎng)??梢哉f我們的工作涉及到整個市場的不同細(xì)分部分,包括企業(yè)和專業(yè)SSD的市場和消費者市場。在控制器方面,我們獲得了中國信息安全測評中心、國家密碼管理局等多項認(rèn)證。
下面回到技術(shù)方面的介紹,剛才談到了存儲,下面我們看一看數(shù)據(jù)是如何處理的。在這里我們可以看到一些數(shù)字,假設(shè)這些人都在使用智能電話,這意味著每一個人都會產(chǎn)生大量數(shù)據(jù)?;旧衔磥淼臄?shù)據(jù)收集會來自于很多的方面,包括前面提到的自動駕駛數(shù)據(jù)等等,我們生活的方方面面都會產(chǎn)生大量的數(shù)據(jù)。在這種情況下,我感興趣的是,當(dāng)我們在街上行走的時候,有人喜歡自拍,而自拍也會產(chǎn)生大量的數(shù)據(jù),而且大部分人會用到美顏功能,這些應(yīng)用都會產(chǎn)生大量的數(shù)據(jù)。
另外,我想介紹的是我們的低延時存儲的系統(tǒng)。早上我們也聽到了很多這樣的技術(shù),如何使用這些?我們先來看看關(guān)于存儲方面的要求,包括深度學(xué)習(xí)的算法,我們有2600萬個這樣的參數(shù),放在網(wǎng)絡(luò)中進(jìn)行深入學(xué)習(xí),如果把這些匯總起來,我們可以得到這樣一個圖片。如果使用一個這樣的監(jiān)控攝像機,然后進(jìn)行一些檢測。我們在天安門地區(qū)范圍內(nèi),放置十個典型的集線器攝象頭,它的性能大家非常清楚,存儲的數(shù)據(jù)量級是海量的,所以在這個方面我們要去補充一些對儲存的需求。如果我們想知道一張被拍攝的圖片中發(fā)生了什么,需要把這個復(fù)雜問題簡化,我們希望從這里獲得一些數(shù)據(jù),包括前面嘉賓談到控制器,一些制造商已經(jīng)可以提供這種低延時的產(chǎn)品,所以在技術(shù)方面有很多的優(yōu)勢。
下面給大家看一個非常有意思的圖片,一個機器狗正在喝馬桶里面的水,我覺得十分有趣。在這里我們可以看到,它的神經(jīng)網(wǎng)絡(luò)使用了大量的數(shù)據(jù)和內(nèi)存,這是我要給大家強調(diào)的第一點。第二點是移動和處理,它更類似于價格昂貴的儲存,因此減少這樣的一些延遲變得至關(guān)重要了。
下面看看另外一個例子,這是谷歌的在線翻譯軟件,使用了人工智能深度神經(jīng)網(wǎng)絡(luò)。我將英文輸入后,這個上面的中文可以準(zhǔn)確的翻譯出英文想要表達(dá)的意思,這就是很好的人工智能,謝謝大家。