右二為MemVerge聯(lián)合創(chuàng)始人兼CEO范承工
在很長一段時間里,能否分清內(nèi)存和外存的概念一直是鑒別計算機(jī)/手機(jī)玩家專業(yè)與否的一道入門測試題。
從功能上來講,內(nèi)存和外存都是用于存儲和讀取數(shù)據(jù)的設(shè)備;但在經(jīng)典的馮諾依曼體系結(jié)構(gòu)中,只有內(nèi)存才屬于存儲器,而外存則屬于輸入/輸出設(shè)備。它們之間最為關(guān)鍵的差異不在于存取速度,而在于能否與CPU直接交換數(shù)據(jù)。
由于工作環(huán)境的不同,內(nèi)存通常只有在通電的情況下才能讀寫內(nèi)容,一旦斷電,內(nèi)存上存儲的內(nèi)容也會隨之消失;而外存則須要在斷電的情況下,也能保證其所存儲數(shù)據(jù)的安全。
不同的功能與角色,讓內(nèi)存與外存走向了不同的進(jìn)化路線。內(nèi)存技術(shù)隨著CPU不斷迭代,頻率與帶寬成為了內(nèi)存的主要性能指標(biāo);而外存技術(shù)的進(jìn)化則更加多樣,從打孔紙帶到磁帶,從磁帶到硬盤、光碟,多種不同存儲介質(zhì)彼此競爭、不斷迭代,容量、速度與成本的平衡是外存設(shè)備的生存準(zhǔn)則。
然而,隨著技術(shù)的進(jìn)步,內(nèi)存與外存開始出現(xiàn)融合的跡象,英特爾和鎂光新近推出的非易失性內(nèi)存成為了介于內(nèi)存和外存的中間態(tài)產(chǎn)品。它兼具內(nèi)存的高速和固態(tài)硬盤的大容量,并且不會因斷電而失去其所存儲的內(nèi)容。
依托于非易失性內(nèi)存的出現(xiàn),一些新的應(yīng)用場景與產(chǎn)品開始出現(xiàn),內(nèi)存融合基礎(chǔ)架構(gòu)(MCI)的發(fā)明者M(jìn)emVerge就是其中之一。
日前,MemVerge宣布完成2450萬美元A輪融資,投資方包括高榕資本、美國光速創(chuàng)投、北極光創(chuàng)投、JVP、LDVP等。本輪融資將用于擴(kuò)大MemVerge在硅谷的工程師、銷售和市場團(tuán)隊,加大研發(fā)投入,進(jìn)一步推動MCI技術(shù)的發(fā)展。
我們采訪了MemVerge聯(lián)合創(chuàng)始人兼CEO范承工博士,和他聊了聊內(nèi)存融合基礎(chǔ)架構(gòu)(MCI)在人工智能領(lǐng)域的應(yīng)用。范承工畢業(yè)于加州理工學(xué)院,曾任VMware高級副總裁、EMC高級副總裁。
機(jī)器產(chǎn)生數(shù)據(jù)已超過90%
范承工表示,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的數(shù)據(jù)由機(jī)器直接生產(chǎn),人類輸入的數(shù)據(jù)已經(jīng)不足10%,機(jī)器產(chǎn)生的數(shù)據(jù)則超過了90%。監(jiān)控攝像頭拍攝的視頻文件、聯(lián)網(wǎng)傳感器傳回的數(shù)據(jù)等等,都屬于機(jī)器產(chǎn)生的數(shù)據(jù)。每天有超過2.5億千兆字節(jié)的數(shù)據(jù)以極快的速度在人工智能、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)和數(shù)據(jù)分析等應(yīng)用中產(chǎn)生。
人類產(chǎn)生數(shù)據(jù)通常擁有一個CRUD(Create,Read,Update,Delete)生命周期,先是創(chuàng)建,再是讀取,然后是更新,最后是刪除,這一流程也是大多數(shù)數(shù)據(jù)庫的底層設(shè)計;而機(jī)器產(chǎn)生的數(shù)據(jù)的生命周期則是CRAP(Create,Read,Ad-hoc queries,Pipeline),一般機(jī)器產(chǎn)生的數(shù)據(jù)只會寫入一次,不會經(jīng)歷多次修改,人們對于它的需求更多是實時查詢,比如從監(jiān)控數(shù)據(jù)中找到嫌疑人的影像,或者從大量數(shù)據(jù)中尋找特定數(shù)據(jù)等等。
對比人類產(chǎn)生的數(shù)據(jù),機(jī)器產(chǎn)生的數(shù)據(jù)結(jié)構(gòu)化程度較差,缺乏合適的管理手段。這給互聯(lián)網(wǎng)巨頭和大型企業(yè)的數(shù)據(jù)科學(xué)家團(tuán)隊帶來了巨大挑戰(zhàn)。
人工智能、機(jī)器學(xué)習(xí)與大數(shù)據(jù)分析是處理機(jī)器產(chǎn)生數(shù)據(jù)最為主要的應(yīng)用場景,MemVerge希望以新的數(shù)據(jù)基礎(chǔ)架構(gòu),消除了內(nèi)存和存儲之間的界限,讓相關(guān)應(yīng)用能夠以更快的速度運行,以此解決機(jī)器生成數(shù)據(jù)時代的挑戰(zhàn)。
MemVerge系統(tǒng)的核心是由英特爾和鎂光聯(lián)合推出的傲騰內(nèi)存,據(jù)范承工介紹,傲騰內(nèi)存在物理層面上屬于相變內(nèi)存(PCM,Phase-Change Memory),采用的制造工藝是3D XPoint。英特爾從1999年就開始研發(fā)這一技術(shù),但直到近期才將其商用化。傲騰先推出了SSD產(chǎn)品,這是因為SSD相對比較低端,在速度要求上沒有內(nèi)存那么高;而英特爾新近推出的內(nèi)存形態(tài)的傲騰內(nèi)存可以直接插到內(nèi)存插槽里,這是一個革命性的產(chǎn)品——它足夠快可以做內(nèi)存,又足夠可靠可以作為外存,這使得內(nèi)存和外存第一次有了融合的可能。
MemVerge是全新物種 將幫助企業(yè)用戶降本提效
范承工表示,MemVerge的核心產(chǎn)品是一款具有DRAM、傲騰內(nèi)存、SSD三層結(jié)構(gòu)的一體機(jī)系統(tǒng),它的內(nèi)存由DRAM加上傲騰內(nèi)存提供,它的存儲由SSD加上傲騰內(nèi)存提供,內(nèi)存和存儲共享傲騰內(nèi)存,并且根據(jù)不同的需要向企業(yè)用戶提供整合后的內(nèi)存與存儲邏輯接口。對比傳統(tǒng)服務(wù)器,MemVerge的一體機(jī)可以提供更大的內(nèi)存空間和更快的存儲速度。與目前最先進(jìn)的存儲和計算解決方案相比,MemVerge的內(nèi)存融合系統(tǒng)提供了10倍的內(nèi)存容量和10倍的數(shù)據(jù)I/O速度。
范承工預(yù)計,在正式發(fā)布之后,MemVerge一體機(jī)的每GB存儲成本將會在1美元以下。
范承工表示,當(dāng)前的企業(yè)級存儲市場中,高端存儲系統(tǒng)的單位存儲價格在3~5美元/GB,中端存儲系統(tǒng)的單位存儲價格約為1~2美元/GB,低端存儲系統(tǒng)的價格則在50~60美分/GB。MemVerge的系統(tǒng)能夠以中端存儲系統(tǒng)的價格提供高于高端存儲系統(tǒng)的性能。
需要指出的是,MemVerge并非是傳統(tǒng)的存儲系統(tǒng),它是一個融合了服務(wù)器、存儲系統(tǒng)、軟件服務(wù)的全新物種。通過MemVerge的系統(tǒng),企業(yè)可以完成此前無法完成的事情。
例如,領(lǐng)英擁有約5.62億用戶(2018年5月數(shù)據(jù)),這些海量彼此關(guān)聯(lián)的用戶數(shù)據(jù)形成了一個復(fù)雜的“圖”(Graph),擁有數(shù)以百億計的“節(jié)點”和“邊”。
這里的“圖”是指是由若干給定的點(節(jié)點)及連接兩點的線(邊)所構(gòu)成的圖形,這種圖形通常用來描述某些事物之間的某種特定關(guān)系,用點代表事物,用連接兩點的線表示相應(yīng)兩個事物間具有這種關(guān)系。
如果想通過機(jī)器學(xué)習(xí)對這個“圖”進(jìn)行訓(xùn)練和處理,這個“圖”的數(shù)據(jù)庫/模型就必須存儲在內(nèi)存中。此前,沒有機(jī)器擁有這么大的內(nèi)存,但現(xiàn)在,通過MemVerge的系統(tǒng),領(lǐng)英可以將多個節(jié)點的內(nèi)存連在一起,使得研究人員可以有足夠大的內(nèi)存完成這個工作。
由于內(nèi)存空間的大幅增長,MemVerge的系統(tǒng)還可以在一定程度上減少企業(yè)的成本支出,大幅削減此前受單個機(jī)器內(nèi)存空間制約而不得不添置的機(jī)器。而隨著機(jī)器整體數(shù)量的削減,企業(yè)的管理成本——耗電、空間、管理人員——也將隨之下降。
此外,MemVerge還搭建了自己的應(yīng)用商店,企業(yè)用戶可以非常方便的一鍵部署所需的開源軟件。
目前,MemVerge還處于早期的Alpha階段,客戶包括領(lǐng)英、騰訊和京東等知名互聯(lián)網(wǎng)公司。MemVerge預(yù)計將于明年初正式推出自己的第一版產(chǎn)品。
今年6月,MemVerge將進(jìn)入Beta階段,范承工表示,希望可以有更多來自傳統(tǒng)行業(yè)的企業(yè)能夠成為MemVerge的Beta用戶。
大公司難逃創(chuàng)新者的窘境 創(chuàng)業(yè)公司更能把握新技術(shù)紅利
毫無疑問,傲騰內(nèi)存是一項突破性的技術(shù),它在MemVerge的系統(tǒng)中扮演著至關(guān)重要的角色。但作為一種全新的硬件產(chǎn)品,傲騰內(nèi)存的未來還有很大的不確定性。如果傲騰內(nèi)存發(fā)展不夠順利,英特爾選擇停止生產(chǎn)這種硬件,MeMVerge是否也會遭到連帶的打擊?
對此,范承工表示,傲騰內(nèi)存這類產(chǎn)品有一個統(tǒng)稱叫SCM(Storage Class Memory),意為“存儲級別內(nèi)存”。存儲級別內(nèi)存的概念在過去十年里一直是比較熱的一個概念,業(yè)界很多廠家都在研發(fā)這方面的技術(shù),比如微軟、三星、海力士等等。未來三到五年會有更多企業(yè)加入到存儲級別內(nèi)存的競爭中來。
“英特爾的傲騰內(nèi)存只是第一家真正面市的商業(yè)級產(chǎn)品,它給了MemVerge這樣的軟件公司一個參照物,讓我們可以在上面開發(fā)軟件產(chǎn)品?!?/p>
范承工表示,創(chuàng)業(yè)公司沒有大公司的歷史包袱,能夠更快、更徹底地?fù)肀碌募夹g(shù),推出革命性的產(chǎn)品。大公司對市場的掌控非常強(qiáng),對客戶掌控非常強(qiáng),但這也意味著,它對一些技術(shù)的依賴性也非常強(qiáng)。
當(dāng)大公司面對顛覆性的技術(shù),它往往會陷入“創(chuàng)新者的窘境”。從商業(yè)模式上來看,如果新的技術(shù)使得它現(xiàn)有的產(chǎn)品賣不出去,或者價格暴跌,大公司將很難做出這樣的決定;而在技術(shù)上,大公司傳統(tǒng)的架構(gòu)經(jīng)歷了過去十年或更長時間的積累,這導(dǎo)致它面對新技術(shù)的自然反應(yīng)就是怎樣把這個新的東西放到它已有架構(gòu)中去,而不是為這項新技術(shù)做一個新的架構(gòu),這很難讓新技術(shù)發(fā)揮自己的全部優(yōu)勢。
這兩個是大公司很難克服的劣勢。面對傲騰這樣的新硬件,傳統(tǒng)的數(shù)據(jù)庫公司會考慮怎樣改進(jìn)他的數(shù)據(jù)庫,傳統(tǒng)的存儲公司會想著怎樣把這個產(chǎn)品加入已有的架構(gòu)里做一個緩存,它們都不會成為MemVerge的直接競爭對手。
“它們(大公司)只會用這個新的硬件來改進(jìn)一些現(xiàn)有的產(chǎn)品,而MemVerge是則將利用這個硬件能夠做出一個嶄新的、融合的新物種?!?/p>