以下為澤塔云CTO明晨的演講實(shí)錄整理:
澤塔云背景:澤塔云英文名稱ZETTAKIT。公司旨在將海量數(shù)據(jù)放到一個(gè)很小的容器內(nèi),實(shí)現(xiàn)客觀交付。公司成立兩年多時(shí)間,員工約80人,其中一半以上都是研發(fā)和技術(shù)人員。 經(jīng)過兩年的發(fā)展,澤塔云在全國有六個(gè)分支機(jī)構(gòu),北京為總部和研發(fā)中心。南京、西安、成都、鄭州、深圳設(shè)有分公司。今年12月份,澤塔云計(jì)劃做B輪融資,之后將在廣州、沈陽、上海、杭州設(shè)立分公司,進(jìn)一步覆蓋全國的市場。
2015年9月份澤塔云獲得國內(nèi)頂級(jí)創(chuàng)投團(tuán)隊(duì)深圳達(dá)晨給我們A輪投資1500萬。今年4月份發(fā)布V2.0版本產(chǎn)品。這個(gè)版本涵蓋了包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò),包括安全的完整數(shù)據(jù)中心軟件定義解決方案。
此外澤塔云在吉林農(nóng)信,吉林銀行、國聯(lián)證券、民生證券有相應(yīng)的項(xiàng)目部署落地。今年跟神州數(shù)碼聯(lián)合開發(fā)做GPU云還有VR云虛擬現(xiàn)實(shí)。(順便一提,澤塔云在展廳搭了VR體驗(yàn)環(huán)境,小編嘗試了一下,和血戰(zhàn)上海灘的槍戰(zhàn)游戲相仿,VR確實(shí)體驗(yàn)更佳,但容易忘我,排我前面體驗(yàn)的妹子一掄手把就朝著圍觀群眾去了……)
超融合帶來的改變
回歸正題,超融合到底改變了什么?人們?yōu)槭裁从盟?因?yàn)橄鄬?duì)傳統(tǒng)架構(gòu)來講,超融合有自身的提升,包括它的性能、可靠性、擴(kuò)展能力、管理的程度等等。當(dāng)然我們可以看到超融合里面所用的技術(shù),包括虛擬化,包括網(wǎng)絡(luò)技術(shù)、存儲(chǔ)技術(shù)其實(shí)都是過去比較長的一段時(shí)間里我們?cè)谘赜玫募夹g(shù)。
現(xiàn)在我們從項(xiàng)目的落地,用戶的反饋來看超融合帶來的改變,用戶感受最深的改變是服務(wù)的交互方式??赡苤吧弦粋€(gè)業(yè)務(wù)系統(tǒng),異構(gòu)環(huán)境,服務(wù)器,交換機(jī),磁盤陣列,虛擬化軟件。先是需要專家選型,討論方案、對(duì)接方案,項(xiàng)目周期可能兩三個(gè)月甚至半年時(shí)間。項(xiàng)目周期很慢,而超融合部署可以快速簡單交付使用。三臺(tái)一體機(jī),化繁為簡的交付方式。
關(guān)于傳統(tǒng)架構(gòu),我們可以看到一個(gè)現(xiàn)狀,傳統(tǒng)架構(gòu)里面的層級(jí)很多,包括服務(wù)器虛擬化,服務(wù)器硬件、交換設(shè)備,包括磁盤陣列等等——總的來說,異構(gòu)環(huán)境,管理復(fù)雜。另外一點(diǎn)從性能方面講,縱向IO路徑很深,從業(yè)務(wù)端產(chǎn)生以后需要經(jīng)過每層周轉(zhuǎn)最終落到磁盤陣列上面。另外一點(diǎn)在我們購買存儲(chǔ)之初看到它的上限。廠家告訴你一拖二,一拖三就OK。你加拓展柜,容量雖然能增長,性能反而有一定程度的衰減——SaaS鏈路,延長、衰減等等??蛻絷P(guān)心的成本問題,構(gòu)建這個(gè)架構(gòu)的采購成本,服務(wù)器、網(wǎng)絡(luò)、交換、虛擬等等,大約硬件成本不少于150萬,可能更大規(guī)模兩三百萬,四五百萬都很常見,這是傳統(tǒng)一個(gè)架構(gòu)。
再來看超融合,超融合給我們帶來什么?第一點(diǎn)簡單的管理。一套管理平臺(tái),我們平臺(tái)可以涵蓋計(jì)算資源,虛擬化資源的管理。網(wǎng)絡(luò)資源的管理,存儲(chǔ)資源管理包括一些安全的管理。
另外就是性能上,是很扁平化的架構(gòu),IO效率得到一定程度的提升。另外提到建設(shè)成本,原來硬件、服務(wù)器、存儲(chǔ)、交換這些硬件,150萬硬件成本。我實(shí)現(xiàn)同樣的能力,比如同樣的存儲(chǔ)空間,同樣的CPU內(nèi)存計(jì)算資源,可能三臺(tái)X86服務(wù)器搞定,這是超融合帶來價(jià)值的提升。
除了剛才提到像性能、成本,包括擴(kuò)展能力以外,我們看到包括功耗上,本身磁盤陣列把存儲(chǔ)歸還給服務(wù)器,功耗一定是減少的。機(jī)房里面相應(yīng)配套,像UPS,電源,機(jī)柜空間的節(jié)省都是會(huì)帶來的。另外一方面就是管理運(yùn)維,人力成本節(jié)省,時(shí)間成本、初始建設(shè)成本等等。這里提一點(diǎn),傳統(tǒng)架構(gòu)中做IDC運(yùn)維的時(shí)候,真的很難做到說有很多異構(gòu)設(shè)備,你放幾臺(tái)備件,形成備機(jī)。而在超融合架構(gòu)里,標(biāo)準(zhǔn)的X86硬件,我不挑硬件,CPU能做虛擬化就OK。拿過來以后就可以預(yù)置系統(tǒng)。當(dāng)硬件壞掉時(shí),直接頂上,非常的便捷。
ZETTAKIT超融合產(chǎn)品的架構(gòu)分了幾層,下面是硬件,中間是資源池,上面是資源管理調(diào)度和管理自動(dòng)化。我們現(xiàn)在跟硬件是完全解耦,我們做利舊,如果有現(xiàn)成的服務(wù)器,像X3650 M3,M2的服務(wù)器,戴爾、惠普服務(wù)器,我們可以幫你利用。包括異構(gòu)存儲(chǔ)的設(shè)備,像IPSAN,包括NAS我可以容納進(jìn)來做整體的管理和交換機(jī)。
ZETTAKIT超融合產(chǎn)品的整個(gè)存儲(chǔ),我們把它稱之為去中心化的全分布式架構(gòu)。我們這個(gè)節(jié)點(diǎn),集群里面每個(gè)節(jié)點(diǎn),每個(gè)服務(wù)器都是對(duì)等的。有幾個(gè)角色,第一是集群數(shù)據(jù),第二是源數(shù)據(jù)節(jié)點(diǎn),第三是管理仲裁節(jié)點(diǎn)。我們?cè)磾?shù)據(jù)打散,放在一臺(tái)兩臺(tái)服務(wù)器里面,可能存在單點(diǎn)可能是風(fēng)險(xiǎn),另外性能瓶頸都會(huì)有。這里我們把源數(shù)據(jù)拆散,分散每個(gè)節(jié)點(diǎn),性能并發(fā)。而管理仲裁,我們集群節(jié)點(diǎn)初始部署的時(shí)候,每個(gè)節(jié)點(diǎn)都會(huì)預(yù)置一個(gè)管理仲裁模塊。任意時(shí)刻只有一部分的節(jié)點(diǎn),你是十個(gè)集群,我選三五七個(gè)都可以。只有一部分節(jié)點(diǎn)行使管理仲裁,稱為董事會(huì),當(dāng)一個(gè)壞了,整個(gè)集群會(huì)從其它的默認(rèn)節(jié)點(diǎn)里推出一個(gè)節(jié)點(diǎn)進(jìn)董事會(huì)。后端組網(wǎng)我們支持普通千兆、萬兆都是可以支持。對(duì)上層接口,包括像普通的文件,塊接口都可以支持。
而宕機(jī)遷移的時(shí)間,澤塔云可以做到一分鐘以內(nèi)。為什么不是秒級(jí)?這里討論兩點(diǎn),第一是你的業(yè)務(wù)是否需要這么短的時(shí)間保持業(yè)務(wù)連續(xù)性。我們做金融行業(yè)用戶,保險(xiǎn)、證券,15分鐘的宕機(jī)時(shí)間足夠。一兩分鐘足夠你去做安全的規(guī)劃和手段。另外一點(diǎn)我們會(huì)規(guī)避一個(gè)風(fēng)險(xiǎn),就是監(jiān)聽,工商局去機(jī)房做運(yùn)維,不小心把網(wǎng)線踢斷了,我們馬上做遷移,反而對(duì)集群造成不必要的影響。我們有一個(gè)監(jiān)聽周期大概30秒鐘,判斷完成之后,我們?cè)偃プ鲞w移的動(dòng)作,保證你遷移的準(zhǔn)確性和無誤性。
超融合為什么更安全?很多廠家提了副本策略??赡茏龇ú煌?,我們這里兩副本、三副本都OK,以兩副本為例看澤塔云的實(shí)現(xiàn)方式。ABCD數(shù)據(jù)為例,首先我們會(huì)把它完整的寫入,另外一個(gè)副本打散切片相對(duì)均衡分配在其它網(wǎng)絡(luò)遠(yuǎn)端節(jié)點(diǎn)之上。這樣做的好處,第一副本策略帶來的容量提升,這毋庸置疑。第二我們?cè)谛阅芊矫嬗袃?yōu)化,遠(yuǎn)端節(jié)點(diǎn)和本地節(jié)點(diǎn)IO是差不多的。網(wǎng)絡(luò)上遠(yuǎn)端節(jié)點(diǎn)沒有明確的寫短板效應(yīng)。一個(gè)架構(gòu)里面寫一個(gè)數(shù)據(jù),基本上接近本地IO性能,這是寫方面的優(yōu)化。另外一點(diǎn)就是讀,大家可以看到ABCD數(shù)據(jù)過來以后,完整落到本地。你的虛擬機(jī)和業(yè)務(wù)對(duì)數(shù)據(jù)有請(qǐng)求的時(shí)候,從本地支持。
傳統(tǒng)硬件定義場景,二層三層交換機(jī),定義之后你的網(wǎng)絡(luò)邊界,你的網(wǎng)絡(luò)架構(gòu)。幾個(gè)問題,資源利用問題,網(wǎng)絡(luò)安全都會(huì)有。我們實(shí)現(xiàn)這些主要通過軟件方式來讓用戶自己去決定網(wǎng)絡(luò)邊界所處位置。通過界面,通過這些配置非常具有靈活性。
我們來看第一個(gè)就是分布式虛擬路由,分布式虛擬交換,大二層網(wǎng)絡(luò),這樣的做法用戶可以自己定義它的網(wǎng)絡(luò)外延到底在哪兒,它可以做多租戶,一個(gè)大云里有多個(gè)小云都可以實(shí)現(xiàn)。
安全方面,南北向流量,軟件防火墻,四防七層的負(fù)載均衡。云主機(jī)防護(hù)是SDN實(shí)現(xiàn)的事。
這是我們界面截圖,叫做所畫即所得網(wǎng)絡(luò)拓?fù)洌覀冋娴陌衍浖x權(quán)力交給客戶,讓用戶定義你的網(wǎng)絡(luò)是什么樣。界面里的小圖標(biāo)有虛擬機(jī)、交換、路由、防火墻、主機(jī)防護(hù),可以直接拖拽。比如創(chuàng)虛機(jī)、創(chuàng)路由交換,直接拖到這個(gè)里面,就創(chuàng)建出來了。誰跟誰組網(wǎng),某個(gè)虛機(jī)跟某個(gè)交換設(shè)備去連,把鼠標(biāo)拖到這個(gè)節(jié)點(diǎn)附近就撒手,這個(gè)網(wǎng)絡(luò)拓?fù)浣ǔ闪?,運(yùn)維方式簡單。另外通過數(shù)據(jù)中心的大屏顯示器,在我的辦公室直接展示出來,你的網(wǎng)絡(luò)當(dāng)前狀態(tài)可以直觀呈現(xiàn),方便運(yùn)維。我們?cè)谫Y源監(jiān)視,存儲(chǔ)、計(jì)算都會(huì)有一些。
我們的自動(dòng)彈性擴(kuò)縮,沒有1.0版本。有一個(gè)互聯(lián)網(wǎng)電商用戶曾提出一個(gè)需求,像雙11、雙12這樣的場景,資源要求會(huì)突發(fā)激增,該如何做?我們?cè)谶@里面實(shí)現(xiàn)一個(gè)東西就是虛機(jī)的彈性擴(kuò)縮。針對(duì)當(dāng)前虛機(jī)的資源使用情況,超過80%或者90%的時(shí)候,負(fù)載均衡調(diào)度就出發(fā),動(dòng)態(tài)添加加虛機(jī)資源,滿客戶業(yè)務(wù)需求。當(dāng)業(yè)務(wù)某個(gè)時(shí)刻變溫或者變冷,不需要那么多資源的時(shí)候,將會(huì)相應(yīng)做一個(gè)回收。
關(guān)于安全這一塊,實(shí)際上我們對(duì)安全的理解,安全一定是多維度,這里面可能涵蓋計(jì)算安全,虛擬化安全,存儲(chǔ)安全,網(wǎng)絡(luò)安全,管理安全等等,這里面主要是網(wǎng)絡(luò)安全這塊。在實(shí)際項(xiàng)目中,絕大多數(shù)的用戶都傾向于硬件安全防護(hù)設(shè)備。究其原因有兩點(diǎn),第一用戶的使用習(xí)慣,慣性在那。第二一些安全設(shè)備不適合做虛擬化。這里面要說的尤其是超額場景中,最緊迫的還不是外部安全防護(hù),實(shí)際上是內(nèi)網(wǎng)安全。在這方面,要做的一個(gè)是云主機(jī)防火墻,另外一個(gè)就是病毒木馬防毒,通過防火墻我們有端口,路由流量管控,限制子網(wǎng)之間主機(jī)之間隔離。通過防毒實(shí)現(xiàn)向虛機(jī),病毒木馬向虛機(jī)掛馬,避免這種場景出現(xiàn)。
大家知道機(jī)械盤最慢,我們做的事就是在機(jī)械盤和業(yè)務(wù)之間加一個(gè)序列化層。可以是高性能SSD,也可以是普通的HDD。這里面要實(shí)現(xiàn)的就是把上層隨機(jī)無序的數(shù)據(jù)通過序列化層做打包,相當(dāng)于把隨機(jī)轉(zhuǎn)順序的過程。通過這樣的優(yōu)化,可以把IO提升10倍左右,后面有一些數(shù)據(jù)跟大家分享。
這是我們實(shí)際運(yùn)行的項(xiàng)目,左邊是傳統(tǒng)架構(gòu),典型SAN網(wǎng)絡(luò)場景。三臺(tái)一體機(jī),6U,2200W。相應(yīng)的配套,UPS,空調(diào),機(jī)柜空間等等。我們通過隨機(jī)序列化,同樣硬盤做到6000。相當(dāng)于什么概念?二甲醫(yī)院的看病,開方子都是根據(jù)這個(gè)系統(tǒng)。
GPU,目前我們?cè)谶@塊主要做的一件事就是我們?cè)谡辖K和山東,包括安徽整個(gè)市的網(wǎng)吧。建設(shè)的時(shí)候成本除了場地以外最貴的占用最多成本就是機(jī)箱,主機(jī)一臺(tái)3000塊錢,2000塊錢都是顯卡,每兩年更新?lián)Q代一次。我們?cè)趺醋?把原來分散每個(gè)主機(jī)里面GPU資源,放到一個(gè)集中高密度的Server里面做虛擬化。這個(gè)Server可能支持十個(gè)、十六個(gè)顯卡。針對(duì)虛擬化,我們針對(duì)不同用戶。有的用戶區(qū)網(wǎng)吧聽歌、看電影,分很少資源甚至不分,打游戲我們就分很多的資源。
災(zāi)備方面現(xiàn)在有兩套方案,異地的場景,數(shù)據(jù)級(jí)的保護(hù),兩個(gè)節(jié)點(diǎn)之間分別部署超融合,兩套超融合之間去做數(shù)據(jù)級(jí)別異地復(fù)制。中間時(shí)間策略還有打快照保證它的邏輯。
另外一塊就是雙活數(shù)據(jù)中心,一套超融合我們把它拆開,中間第三地布一個(gè)仲裁站點(diǎn)。兩中心之間做大二層網(wǎng)絡(luò)打通。東北銀行做的就是這種場景,主行和分行之間七公里距離,主中心一份副本,災(zāi)備中心一份副本,完成之后測(cè)試整體切換的時(shí)間。總中心斷電,測(cè)試之后時(shí)間是兩分鐘。遷往大二層的網(wǎng)絡(luò),非常快,不用改中間的中間件。另外整個(gè)數(shù)據(jù)做這個(gè)場景,數(shù)據(jù)兜一圈是五毫秒。
這是澤塔云產(chǎn)品當(dāng)前的交互方式,第一種針對(duì)用戶既有資產(chǎn)比較重的情況,做利舊。只要你的服務(wù)器支持虛擬化就可以做,另外就是虛擬機(jī)。
案例分享
這里分享兩個(gè)案例,這是國家衛(wèi)計(jì)委管理中心做得項(xiàng)目,最早用戶想做一個(gè)云數(shù)據(jù)中心。當(dāng)時(shí)找一家集成商幫它做打包方案,包括虛擬化、服務(wù)器硬件、存儲(chǔ)硬件、網(wǎng)絡(luò)硬件。整個(gè)方案做下來以后,給用戶報(bào)價(jià)四百萬。2014年財(cái)政緊縮,預(yù)算未批,批了兩百萬。用戶與我們溝通后指定了我們。幫他做兩件事,第一就是我們?cè)谒臄?shù)據(jù)中心部署8臺(tái)戴爾的2820服務(wù)器。這里部署一套超融合,支撐整個(gè)醫(yī)療云的項(xiàng)目。第二在他的災(zāi)備中心機(jī)關(guān)辦公室改的機(jī)房,淘汰下來四臺(tái)服務(wù)器部署對(duì)等。在兩套中心之間做了數(shù)據(jù)級(jí)的異地災(zāi)備。大家可以看到傳統(tǒng)架構(gòu)方案400萬沒做的事,只是云數(shù)據(jù)中心,200萬預(yù)算,不光把用戶想做云數(shù)據(jù)中心實(shí)現(xiàn)了。同時(shí)做數(shù)據(jù)級(jí)的災(zāi)備。整個(gè)項(xiàng)目做完了。做宕機(jī)遷移現(xiàn)場測(cè)試,直接到托管機(jī)房拔電源,遠(yuǎn)程一分鐘之內(nèi),這臺(tái)被拔電源物理機(jī)虛機(jī)平滑地做了遷移。而這整個(gè)項(xiàng)目做下來之后,統(tǒng)計(jì)資源利用率使用情況,CPU、硬盤資源情況,總體資源利用率不到30%。也就是說衛(wèi)計(jì)委未來三年不用再采硬件設(shè)備。
做天津職大的項(xiàng)目,當(dāng)時(shí)用戶采取了虛擬化,他們的痛點(diǎn)是存儲(chǔ)不穩(wěn)定,經(jīng)常閃斷。用戶表示想將所有的數(shù)據(jù),業(yè)務(wù)放到服務(wù)器里面,不想用存儲(chǔ)。他提出了一個(gè)超融合的需求,我們就把他所有虛機(jī)業(yè)務(wù)和數(shù)據(jù)做了一個(gè)遷移。整個(gè)業(yè)務(wù)做下來,業(yè)務(wù)系統(tǒng)非常多,大概60多個(gè)。我們遷移過程中,通過P2V、V2V遷移工具,2天時(shí)間60多個(gè)業(yè)務(wù)系統(tǒng)搞定。這個(gè)上面沒有上一個(gè)新硬件,完全是既有硬件幫他實(shí)現(xiàn),純利舊的場景。
澤塔云愿景:12月份將啟動(dòng)B輪融資,大概按照十億估值來做。B輪做完以后,澤塔云計(jì)劃做兩件事,第一就是成立ZETTAKIT創(chuàng)新架構(gòu)研究院,像微軟、英特爾研究院一樣,專門進(jìn)行前沿領(lǐng)域研發(fā)。第二收購大數(shù)據(jù)團(tuán)隊(duì),打造IaaS+PaaS的整體云計(jì)算解決方案?,F(xiàn)在數(shù)據(jù)中心基礎(chǔ)架構(gòu)朝著新一代基礎(chǔ)架構(gòu)轉(zhuǎn)型,未來IT變化五年十年如何誰也不知道。我們想不管未來架構(gòu)什么樣,不再來自美國硅谷,不再來自印度,來自ZETTAKIT,來自中國的廠商,謝謝。