英特爾中國區(qū)非易失性存儲事業(yè)部總經(jīng)理劉鋼
劉鋼:各位嘉賓,各位朋友,下午好。很高興能有機會在年底到中國數(shù)字經(jīng)濟峰會跟各位分享交流,感謝DOIT的邀請。
人工智能在過去一年進展非???,其實不僅是平臺的改善和發(fā)展,而且在各種應(yīng)用上已經(jīng)進步的非???,到了我們生活的很多方面,剛剛提到的城市管理,阿里的智慧大腦和百度提到的智能媒體還有智能的醫(yī)療,還有科大訊飛,其實在我自己生活中,我每天也可以感受到人工智能,今天早上我從上海飛過來,我在樓上聽到我兒子在樓下說話,他說丁東給我講故事,前不久我剛買了人工智音響,最近我發(fā)現(xiàn)我太太學(xué)英語比較專心,老是拿手機說話,因為手機可以自動的給她判別發(fā)言是否標準,我覺得打分比較合理,在我們家,我女兒得分是最高的,我覺得人工智能已經(jīng)進展到跟我們的生活緊密相關(guān)。
為什么在過去的一年兩年中,人工智能發(fā)展的這么快,跟以前的人工智能有什么不同?上一次大的浪潮是在97年,整整二十年,過去二十年為什么人工智能到現(xiàn)在發(fā)展這么快?那個時候的人工智能跟現(xiàn)在不一樣,那個時候的人工智能學(xué)習(xí)方法是推理,人知道怎么解決問題,只是要給它數(shù)據(jù)推斷出來怎么解決問題,而今天的人工智能是很多問題人根本就不知道怎么解答,甚至人的解答能力還不如機器,機器通過大規(guī)模的深度學(xué)習(xí),自己找到解決問題的方法,這是通過深度學(xué)習(xí)找到的解決方法。后一種方法,可以讓機器做得比人更好,甚至有很多時候擺脫了人的曲線,比如說像阿爾法狗,甚至都沒有輸入大量的數(shù)據(jù),就讓兩臺機器左右的互補學(xué)習(xí),說話人工智能已經(jīng)進展到了新的階段,這個新的階段主要是有四方面的技術(shù)的快速發(fā)展,讓新的學(xué)習(xí)能力得以實現(xiàn)。
第一,大數(shù)據(jù)的快速存取。第二,高性能的計算能力,大家知道今天的阿爾法狗是二十年前深藍計算能力的三萬倍。第三,非常多新的算法的出現(xiàn),而且算法通過互聯(lián)網(wǎng)平臺共享,算法的迭代升級也非??臁5谒?,跟剛剛科大訊飛講到的也很一致,人不僅是有數(shù)據(jù),在機器計算機里面的數(shù)據(jù)進行學(xué)習(xí),而是有大量的物聯(lián)網(wǎng)的設(shè)備部署,有大量的傳感器,能夠感知真實的世界,能夠看得見,可以感受得到真實世界,由此采集了很多的數(shù)據(jù),這個大量的數(shù)據(jù)又變成下一步機器學(xué)習(xí)的來源,所以這個是大部分大數(shù)據(jù)高性能計算和更高效算法以及大規(guī)模布置的物聯(lián)網(wǎng)的傳感器,讓人工智能發(fā)展到今天這波,跟以前完全是基于邏輯推理的人工智能有非常大的不一樣。
講到四大關(guān)鍵技術(shù)推動人工智能發(fā)展,今天我想特別講到其中的一塊,因為都跟數(shù)據(jù)有關(guān)系,我想特別強調(diào)數(shù)據(jù)技術(shù)的進展,另一方面,也是英特爾我們自己把數(shù)據(jù)看得非常重要,以至于我們的CEO現(xiàn)在對外講英特爾是一家什么樣的公司時候,他絕對說我們是一家新銳公司,很多數(shù)據(jù)技術(shù)在英特爾越來越投入,進展越來越快,data在我們公司變得非常重要,也許這次我們看的是CIO論壇,沒準下次我們看的是CDO論壇,今年年初大家看到可口可樂取消了CMO,有了CGO,數(shù)據(jù)就是下一個能源。
在數(shù)據(jù)方面有哪些進展?有哪些新的技術(shù)可以幫助我們更有效的存和取大規(guī)模的數(shù)據(jù),來支持新一代的人工智能?
我們首先來看大數(shù)據(jù)的分層,大家都在說大分局,人產(chǎn)生的數(shù)據(jù)和機器產(chǎn)生的數(shù)據(jù),以及工廠產(chǎn)生的數(shù)據(jù),完全是不同數(shù)量級的,這是每一天這些設(shè)備產(chǎn)生的數(shù)據(jù),設(shè)備產(chǎn)生的數(shù)據(jù)遠遠超過人,但是這個數(shù)據(jù)量大,并不是重要的,最重要的是這些大量的數(shù)據(jù)需要得到及時的處理,能夠更靠近處理它的處理器,無論這個處理器是CPU還是CPU還是神經(jīng)原芯片,可以更高效的處理人工智能。
但是另一方面,又不可能把大量的數(shù)據(jù)全部放到CTO,因為你做不到,我們可以看到,根據(jù)應(yīng)用的不同,應(yīng)用場景的不同,和數(shù)據(jù)重要性不行,把數(shù)據(jù)分成三大類,第一大類大家很熟悉了,冷數(shù)據(jù),第二部分是溫數(shù)據(jù),第三個是熱數(shù)據(jù),需要實時在線,這三種不同層的數(shù)據(jù)需要用不同的存儲技術(shù)解決,下面我很快給大家看一下在未來這幾個主要的存儲技術(shù)的發(fā)展,今天吃午飯的時候我們還聊到未來幾個產(chǎn)品大的種類,大家可以看到,在未來的三到四年中,硬盤的市場占有量是在逐漸萎縮的,中間增長最快的是HC,從今天的市場到2020年變成300億市場,而且SSD部分產(chǎn)品不僅是向下代替了很多快速硬盤的市場,而且向上也代替了很多內(nèi)存的市場,為什么這樣?這是因為有新的存儲技術(shù)出現(xiàn)。
在講新的存儲技術(shù)之前,我想給各位看一個圖,存儲在各位CIO的預(yù)算或者花費中占比有多少,這是一個全球的數(shù)據(jù)。大概在基礎(chǔ)架構(gòu)的花費中,你可以看到,在存儲部分的花費會占到20%,不包括內(nèi)存;加上內(nèi)存,大概會占到整個IT基礎(chǔ)架構(gòu)花費的40%以上。上周末我在蘇州參加行業(yè)年度峰會,跟好幾位互聯(lián)網(wǎng)的服務(wù)商在交流,馬上就有很大的互聯(lián)網(wǎng)公司的IT高管跟我說,其實那個費用已經(jīng)超過50%了,存儲的花費已經(jīng)超過了IT花費的50%以上了,尤其是隨著最新內(nèi)存的漲價,而且不止內(nèi)存漲價,新的人工智能也需要更多的內(nèi)存兩個因素結(jié)合到一起,可以看到,在存儲和內(nèi)存上的花費非常大,在過去兩年這兩個加起來占到720億美金。中國市場綠色的部分是固態(tài)盤,企業(yè)級固態(tài)盤占整個市場今天的三分之一,但是2020年企業(yè)固態(tài)盤占整個固態(tài)盤市場一半,在全球市場企業(yè)級固態(tài)盤今天就占到所有固態(tài)盤的一半以上,企業(yè)在它的IT基礎(chǔ)架構(gòu)里,大規(guī)模的部署新的存儲技術(shù),但是這種全新的存儲技術(shù)用在溫數(shù)據(jù)上,就是現(xiàn)有的固態(tài)盤數(shù)據(jù),因為溫數(shù)據(jù)既要求高密度,也要求大容量,而且還要比硬盤更快,這個部分基于閃存技術(shù)的固態(tài)盤可以滿足要求,這一部分還有新的發(fā)展,大家可以看到,新的發(fā)展一方面是在接口方面,2017年開始,2018年會有非常大的轉(zhuǎn)變,2017年轉(zhuǎn)變已經(jīng)開始了,固態(tài)盤的接口大規(guī)模的轉(zhuǎn),今天像BAT公司50%以上的固態(tài)盤已經(jīng)轉(zhuǎn)向了PCIE,因為固態(tài)盤如果還用傳統(tǒng)的接口,接口本身就是瓶頸,所以在固態(tài)盤的基礎(chǔ)上,往下非常大的轉(zhuǎn)變其中之一就是存儲接口的改變,這個跟英特爾最新的計算平臺也有關(guān)系,在一臺服務(wù)器里面部署幾十片的PCIE的盤,各位可以看看今天外面的展臺已經(jīng)有好幾家廠商的產(chǎn)品,就是在一臺服務(wù)器上,這是一個發(fā)展趨勢。
還有一個發(fā)展趨勢,固態(tài)盤不僅是快,以前我們認為固態(tài)盤的劣勢,硬盤的存儲密度更高,固態(tài)盤只有幾百GB,但是現(xiàn)在不一樣了,固態(tài)盤的存儲密度甚至可能更高,今天如果沒有實現(xiàn)一個PB的存儲容量,用硬盤技術(shù)做,2TB可能要放滿42u機架,裝滿服務(wù)器,每一臺服務(wù)器插滿2TB硬盤,可以做到一個PB,有些公司已經(jīng)開始測試了,新型的固態(tài)盤高密度的會變成1U服務(wù)器,1PB,整整一個機柜變成1U服務(wù)器,這是產(chǎn)品在測試當(dāng)中,是基于3D64層,在一條寸子大的固態(tài)盤里,可以達到存儲容量32TB,在一臺服務(wù)器放滿32個,就是一個PB,可以讓溫數(shù)據(jù)完全用基于新型的閃存固態(tài)盤實現(xiàn),所以基于閃存NAND顆粒的可以很好的解決溫數(shù)據(jù)部分。
我們再看數(shù)據(jù)分層,現(xiàn)在熱數(shù)據(jù)部分還是用DRAM實現(xiàn),新的應(yīng)用對DRAM需求越來越大,尤其是人工智能,需要大量的樣本比對,機器學(xué)習(xí)也需要大內(nèi)存,越來越多的應(yīng)用都需要內(nèi)存,而內(nèi)存價格飛漲,內(nèi)存的容量其實過去幾年并沒有太大的增長,大家可以看這個圖,左邊這個圖是過去幾年內(nèi)存的增長,你可以看到內(nèi)存顆粒的增長,容量增長越變越慢,所以類似的容量并沒有快速增長,而另一方面,閃存又太慢,因為閃存跟內(nèi)存比太慢了,是從時延上來講,人工智能里時延非常重要,人工智能的應(yīng)用對時延要求非常高,要在每一個部分降低時延,但是你看在nand里面和dram時延差一千倍,兩個之間有很大的鴻溝,一方面DRAM進展太慢,另外NAND基于閃存的SSD太大了,如果我用這個圖比較大家可以更清楚的了解,CPU里面的存儲叫SRAM,這個作為數(shù)量級1比對,大家可以看到,DRAM延遲大概是10,lateney是10萬,硬盤就是一千萬,是更慢的,怎么樣能夠彌補這兩個之間的無論是性能還是價格,還是時延上的巨大差距呢?一種新的材質(zhì)會出現(xiàn),就是英特爾的新型材質(zhì),3DXPoint,Latency只有100,跟內(nèi)存比沒有差太多,但是密度卻大很多,這種新的存儲介質(zhì)介于DRAM和NAND之間,今天中午討論到了英特爾現(xiàn)在有基于PCIE的接口,聽說未來也會有基于DRAM的接口,因為它太快了,只用PCIE無法把性能完全發(fā)揮出來,明年我們會看到有DRAM的接口出來。
我們先看看基于PCIE接口的產(chǎn)品,有什么樣的性能提升,簡單的來說,無論在Qos9的時候是60X,時延是最難提升的,從各個方面來講,而ot low產(chǎn)品第一代時延就相當(dāng)于現(xiàn)在最快的四十分之一,提高了40倍,在時延加速上,所以可以看到,它最大的優(yōu)勢就是在時延的改進方面,這是40倍的提升,是完全革命性的新的存儲技術(shù)。
這種新的存儲技術(shù)有多種的應(yīng)用場景,常常也會問到你們這么快的產(chǎn)品怎么定位的,兩種定位,第一種定位是最快的SSD,所以這里面有一個大數(shù)據(jù)庫,各位如果有非常大型的數(shù)據(jù)庫,當(dāng)運行到optoneSSD上,每秒處理能力從原來的1365變成了13650,提高了十倍,只是把盤從nandSSD變成了optoneSSD,就是當(dāng)成最快的SSD,得到的好處不僅是每秒鐘TBS倍數(shù)增長,同時時延比原來改進了五倍。在前不久阿里的云棲大會,阿里也是應(yīng)用這個進展,因為阿里有非常強的反應(yīng)能力,因為大家知道阿里雙十一的交易量非常大,所以阿里的數(shù)據(jù)庫開發(fā)非常領(lǐng)先,阿里的最新數(shù)據(jù)庫比MySQL還快,所以這是當(dāng)成一個更快的或者最快的固態(tài)盤。
另一種應(yīng)用方法,是把它當(dāng)成更大的內(nèi)存,因為它跟內(nèi)存的速度相比,也只有一個數(shù)量級的差別,不是太大的差別,當(dāng)成一個更大的內(nèi)存,所以當(dāng)你的內(nèi)存平時只有幾個GB,而你需要幾個TB內(nèi)存做人工智能的時候,Optone是個不錯的選擇。我們來看一個例子,這個公司原來只有很小的內(nèi)存,用了Optone以后有了很大的提升。
(播放視頻)
剛剛大家看到的應(yīng)用,是把Optone當(dāng)成一個擴展的新型更大內(nèi)存實現(xiàn),這個圖大家可以看到,原本你左邊插滿了內(nèi)存條,新的配置只需要一個內(nèi)存條,就是Optone,做到只有原來成本的三分之一,但是可以達到1.9,可以看到新型的材料新型的存儲介質(zhì)來適應(yīng)大數(shù)據(jù)的需求,因為大數(shù)據(jù)的發(fā)展才剛剛開始,未來會有更大規(guī)模的數(shù)據(jù),這個時候只是依賴傳統(tǒng)的DRAM發(fā)展不足以滿足人工智能發(fā)展的需求,尤其是這一波人工智能是大數(shù)據(jù)推動的,所以后面支持大數(shù)據(jù)的數(shù)據(jù)技術(shù)創(chuàng)新就顯得尤其重要,不僅是計算能力創(chuàng)新,而且是數(shù)據(jù)技術(shù)創(chuàng)新非常重要,所以英特爾不計算自己是一個計算公司,而說自己是一個數(shù)據(jù)公司。
剛才講的還是通過大內(nèi)存來解決已經(jīng)知道的問題,現(xiàn)在這個應(yīng)用是什么?就是內(nèi)存大到了不是貴的問題,是原來不可能做到這么大的內(nèi)存的,誰試過讓服務(wù)器達到24個TB,或者48個TB的,沒有做到過,但是如果有Optone就可以做到,當(dāng)你應(yīng)用在上層的時候,讓根本原來無法解決的問題變得可以解決,這個也是Optone基于新型的存儲介質(zhì)的SSD產(chǎn)品帶來的優(yōu)勢,尤其是對人工智能會帶來非常多的幫助,尤其是這部分帶來不僅是容量的變大,關(guān)鍵是延遲時間,在這個方面我們跟訊飛也有一個討論,剛剛部署的AI的云平臺,在那個部分,為了縮短人工智能、云對應(yīng)用響應(yīng)的延遲時間,它幾乎在每一個部分去減少時延,所以O(shè)ptone是其中非常重要的一個技術(shù)。這是訊飛照片,可以看到他的人工智能平臺,可以看到實際上Optone在今年已經(jīng)在很多人工智能平臺中開始使用了。
我們希望能夠擴大我們新型的存儲技術(shù)對大數(shù)據(jù)和人工智能的應(yīng)用,也希望跟各位一起合作,因為大數(shù)據(jù)是支撐我們?nèi)斯ぶ悄馨l(fā)展的最關(guān)鍵的一個技術(shù),所以英特爾的部門叫NSG,這個名字是非易失性存儲解決方案事業(yè)部,謝謝大家。