“如果NVMe硬盤標準在OCP里得以建立,那受益的群體不僅僅是互聯(lián)網(wǎng)企業(yè)客戶,還有傳統(tǒng)企業(yè)客戶,乃至存儲系統(tǒng)供應(yīng)商?!痹诋斕煺匍_的主論壇上,希捷中國區(qū)產(chǎn)品經(jīng)理劉嘉如是說。
超大規(guī)模數(shù)據(jù)架構(gòu)的演進方向
在大規(guī)模數(shù)據(jù)架構(gòu)的演進方向方面,劉嘉針對優(yōu)化QoS以及性能、存儲與計算分離,以及Composable Open Data Center架構(gòu)進行了探討以及希捷在這些方面的實踐。
針對計算和存儲分離這個話題,劉嘉在主題演講表示,計算存儲分離,即把CPU、GPU從存儲完全獨立出來,這是當下全球CSP應(yīng)用的一個方向,目的是為了應(yīng)對硬盤容量越來越大的情況下提升存儲密度的問題。
當數(shù)據(jù)量發(fā)展到一定程度,越來越多的用戶在做數(shù)據(jù)湖、數(shù)據(jù)倉的時候就會考慮把存儲單獨出來,一方面降低TCO,另一方面,對存儲的優(yōu)化也更有針對性,包括散熱、振動。劉嘉認為,超大規(guī)模數(shù)據(jù)架構(gòu)上將會向著存算分離,以及Composable Data Center這個架構(gòu)方向去發(fā)展。
Composable Open Data Center架構(gòu)誕生的背景是容器技術(shù)不斷地普及,對計算和存儲資源產(chǎn)生更加細粒化的解耦合要求,與現(xiàn)有硬件基礎(chǔ)架構(gòu)之間產(chǎn)生的矛盾。其技術(shù)優(yōu)勢在于可以對所有的計算和存儲資源做解耦合,用統(tǒng)一的管理接口與容器的接口去做調(diào)度,提升靈活性,其背后有兩個連接的技術(shù)提供支撐,之一就是為人熟知的NVMe Over Fabric——它能夠以100微秒的延遲去連接存儲設(shè)備。
目前市場上還只是對存儲和計算做一些簡單的分離,尚無法對CPU、內(nèi)存、FPGA、GPU做完全的解耦合和顆?;N磥懋擯CIe Gen5得到普及后,最新的CXL和Gen-Z技術(shù)將通過把連接的延遲從微秒級降到納秒級,對諸如CPU與內(nèi)存這樣的計算資源做解耦合,朝高性能和高存儲方向再邁進。
2020年底,希捷已經(jīng)交付20TB熱輔助磁記錄技術(shù)(HAMR)硬盤產(chǎn)品給到業(yè)內(nèi)領(lǐng)先的OEM與云計算用戶,進行測試與試用。
雙碳話題:踐行社會責任
碳達峰、碳中和是今年的政府工作報告中提出的年度重要任務(wù)之一,也是“十四五”規(guī)劃和2030/2060應(yīng)對排放的重要目標。作為一個全球領(lǐng)先的科技企業(yè),希捷正在承擔起這樣的社會責任。
數(shù)據(jù)中心的TCO分成采購成本與運維成本兩部分,在運維成本中又有一部分跟服務(wù)器的功耗,包括數(shù)據(jù)中心的PUE密切相關(guān)。
早在四、五年前,希捷就跟重要的合作伙伴一起探討和落實進一步降低排放的舉措。例如,將之前得到了廣泛使用的空氣硬盤以功耗比更優(yōu)秀的氦氣硬盤來替代,如一塊16TB的氦氣硬盤,就會比之前的兩塊8TB能耗更低,這其實就達成降碳目標的做法。而研發(fā)采用雙磁臂技術(shù)和熱輔助磁記錄技術(shù)的硬盤,當容量可以做到50TB,也就是能夠替代三塊16TB容量的硬盤,這就意味著在降碳的同時實現(xiàn)性能和容量的兼得。
此外,液冷的技術(shù)也得到了越來越多企業(yè)的關(guān)注,越來越多的廠商正在把這個技術(shù)以一種更低的成本落地。
談到機械硬盤,有兩個話題無法回避。
一是與固態(tài)盤的市場競爭問題。從存儲系統(tǒng)市場的角度,業(yè)界的發(fā)展方向是從全硬盤的陣列逐漸過渡到混合陣列,并且有向全閃陣列發(fā)展過渡的趨勢。很多人認為閃存盤因為讀寫速度等方面的優(yōu)勢會逐漸取代傳統(tǒng)磁盤,但實際上二者近年來始終都在高速成長,希捷也同時提供了這兩方面的產(chǎn)品。
針對實時分析的場景需求,固態(tài)硬盤的確更合適一些。但并不是所有采用固態(tài)硬盤的做法就是最優(yōu)的方案。劉嘉認為,在大部分場合,企業(yè)盡量都把數(shù)據(jù)存下來展開大數(shù)據(jù)的離線分析等工作,尤其是業(yè)務(wù)對性能和及時度、有效度要求并不那么高的情況下,機械硬盤其實具備更好的TCO。
那么,機械硬盤與閃存盤優(yōu)勢結(jié)合,會不會取得1+1>2的效果呢?答案是否定的。
在超大規(guī)模的數(shù)據(jù)架構(gòu)方面,90%的數(shù)據(jù)量仍然還會依托到硬盤上,原因不外乎是硬盤整體的TCO優(yōu)勢與數(shù)據(jù)耐寫度、數(shù)據(jù)存儲壽命的優(yōu)勢。所以很多客戶除了在嘗試新的閃存技術(shù)以外,也在嘗試新的硬盤技術(shù),比如上面提到的雙磁臂技術(shù)就可能大幅度提升硬盤的性能。采用硬盤展開冷存類的業(yè)務(wù)也是另外一種嘗試。
在劉嘉看來,存儲市場始終是一個動態(tài)發(fā)展的過程,短期內(nèi)市場還將維持以傳統(tǒng)機械硬盤應(yīng)用為主的局面。
系統(tǒng)智能性的優(yōu)化實踐
系統(tǒng)智能性的最佳實踐,是希捷在OCP具有引領(lǐng)地位的另一個項目。
希捷正在與浪潮等服務(wù)器廠商一起探索在硬盤磁道密度不斷增加的同時,化解類似于風扇、機箱等高頻噪聲和機械振動給硬盤在性能方面帶來的影響。據(jù)介紹,希捷的對策,除了在初期跟服務(wù)器廠商聯(lián)合對機箱進行設(shè)計,還把Surrogate Acoustic Drive等技術(shù)置于服務(wù)器中,通過驅(qū)動麥克風捕捉到噪聲的振動,實現(xiàn)對服務(wù)器的設(shè)計的優(yōu)化。
優(yōu)化后的數(shù)據(jù)顯示,硬盤的性能能達到了100%。
對微軟數(shù)據(jù)中心的JBOD部署模式和Facebook數(shù)據(jù)中心服務(wù)器機箱的設(shè)計,是OCP落地的兩個非常成功案例。包括微軟,美國所有大型CSP都通過JBOD/JBOF方式部署磁盤,通過計算和存儲分離,確保最大的資源利用率與提供最佳的TCO;而在Facebook,通過對機架和機箱進行優(yōu)化,實現(xiàn)了最佳的散熱管理,降低了噪聲和振動的影響,并提升了硬盤性能和存儲容量。
此外希捷還提供相關(guān)的硬件和測試套件,以提升自己在相關(guān)領(lǐng)域的領(lǐng)導(dǎo)能力。