圖1:用于本次測(cè)試的東芝MG10-D系列磁盤,容量8TB

圖2:硬盤背面;

圖3:硬盤接口為SATA 3.0規(guī)格,最大速率6Gb/s;

圖4:主軸電機(jī),帶動(dòng)內(nèi)部盤片高速旋轉(zhuǎn)(7200轉(zhuǎn)/分鐘),并“托”起磁頭實(shí)現(xiàn)數(shù)據(jù)存??;

圖5:主軸電機(jī)上方的通氣孔,用以保持內(nèi)外部氣壓平衡,旁邊有英文提示“請(qǐng)勿遮擋”。

基準(zhǔn)性能測(cè)試的目的是用于評(píng)估HDD自身所能發(fā)揮出的性能,即 “裸盤性能”。根據(jù)海量文件存儲(chǔ)、數(shù)據(jù)備份、云歸檔等場景的數(shù)據(jù)存取特點(diǎn),測(cè)試選擇用64K、128K及以上尺寸的數(shù)據(jù)塊,通過常用的硬盤基準(zhǔn)性能測(cè)試工具Iometer下發(fā)順序讀寫負(fù)載來評(píng)估HDD的帶寬表現(xiàn)。圖6為東芝MG10-D系列8TB硬盤在128K數(shù)據(jù)塊下的順序讀寫性能。

圖6:東芝MG10-D系列8TB硬盤的128K順序讀寫性能

本節(jié)測(cè)試使用單一線程對(duì)東芝MG10-D系列8TB硬盤下發(fā)讀寫負(fù)載,從測(cè)試結(jié)果可以看出,在單線程、1隊(duì)列深度時(shí),硬盤達(dá)到最大讀寫帶寬,均在290MB/s左右,此時(shí)的平均響應(yīng)時(shí)間僅為0.46ms。

此測(cè)試結(jié)果表明了以下多層含義:

1、 順序讀寫性能均衡,不管是順序讀(綠色柱狀)還是順序?qū)懀ǔ壬鶢睿?,在不同?duì)列深度下的吞吐率都近乎相似,保持在290MB/s左右;

2、 在隊(duì)列深度為1時(shí),硬盤已達(dá)到最大的讀寫帶寬290MB/s,應(yīng)用體驗(yàn)穩(wěn)定流暢。

3、 在達(dá)到最大帶寬后,隨著負(fù)載(隊(duì)列深度)的增加,吞吐率保持平穩(wěn),響應(yīng)時(shí)間隨負(fù)載的增加而增長,這表明即使在密集負(fù)載情況下,東芝MG10-D 8TB硬盤依然能夠發(fā)揮出最大帶寬性能,且保持平穩(wěn),具有很好的性能可預(yù)測(cè)性,以便企業(yè)存儲(chǔ)系統(tǒng)能更好地匹配業(yè)務(wù)需求。

值得注意的是,東芝官網(wǎng)公布的MG10-D系列HDD的順序讀寫帶寬為268MiB/s,為二進(jìn)制。而本測(cè)試中的290MB/s使用十進(jìn)制,換算成二進(jìn)制大約為278MiB/s。

圖7:不同數(shù)據(jù)塊大小的順序讀寫性能(吞吐率與響應(yīng)時(shí)間)

上圖7是東芝MG10-D系列8TB硬盤在使用64K、128K、256K、512K、1024K等不同大小數(shù)據(jù)塊下的順序讀寫帶寬和響應(yīng)時(shí)間表現(xiàn)。其性能表現(xiàn)趨勢(shì)與上一測(cè)試結(jié)果近乎相似,在1隊(duì)列深度時(shí)可達(dá)到最大吞吐率,且隨著負(fù)載的繼續(xù)增加,吞吐率保持不變,響應(yīng)時(shí)間隨數(shù)據(jù)塊大小而變化。

圖8:東芝MG10-D系列8TB硬盤穩(wěn)定性測(cè)試結(jié)果

上圖8為128K數(shù)據(jù)塊在持續(xù)讀寫下的響應(yīng)時(shí)間散布,在1分鐘持續(xù)的讀寫負(fù)載下發(fā)中,響應(yīng)時(shí)間大多散布在0.4~0.5ms之間,只有極少數(shù)分散在0.5ms之外,但均未超過0.6ms,這從另一方面顯示了東芝MG10-D系列硬盤的性能穩(wěn)定性與可預(yù)測(cè)性。

從基準(zhǔn)測(cè)試的結(jié)果數(shù)據(jù)來看,東芝MG10-D系列8TB硬盤僅需單線程單隊(duì)列的情況下就能達(dá)到最大吞吐率,即使在密集讀寫負(fù)載情況下也能保持穩(wěn)定的最大帶寬性能,所具備的性能可預(yù)測(cè)性,有助于企業(yè)用戶簡化存儲(chǔ)系統(tǒng)的優(yōu)化與管理工作。

基準(zhǔn)性能測(cè)試反映的是東芝8TB硬盤本身所能發(fā)揮的最大性能,并不代表其在實(shí)際應(yīng)用中的性能表現(xiàn)。接下來進(jìn)行的文件性能測(cè)試將展示東芝8TB硬盤的實(shí)際應(yīng)用性能表現(xiàn)。

2.如何讓海量小文件存儲(chǔ)更有效率?

文件存儲(chǔ)是企業(yè)最常見的應(yīng)用場景,典型如日志存儲(chǔ)、文件共享、云數(shù)據(jù)備份與歸檔等,隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,海量文件存儲(chǔ)也逐漸成為企業(yè)的典型應(yīng)用場景,尤其是近幾年掀起的又一輪AI狂潮,為AI模型訓(xùn)練所需的海量數(shù)據(jù)提供存儲(chǔ)能力也是HDD的重要應(yīng)用場景。

我們使用VDbench創(chuàng)建模擬企業(yè)實(shí)際數(shù)據(jù)環(huán)境,來測(cè)試東芝10-D系列8TB硬盤,評(píng)估在處理海量小文件場景下,硬盤的每秒文件讀寫數(shù),每秒吞吐率,以及響應(yīng)時(shí)間等多項(xiàng)表現(xiàn)。將東芝MG10-D系列8TB硬盤用作企業(yè)文件系統(tǒng),并創(chuàng)建兩層目錄,每層10個(gè)目錄,在第二層的所有目錄中都創(chuàng)建2000個(gè)半/非結(jié)構(gòu)化文件,總計(jì)20萬個(gè)文件(即2000x10x10)。在不同的測(cè)試環(huán)節(jié),VDbench會(huì)重新生成不同大小的20萬個(gè)文件(如64K、128K、256K、512K、1024K),用以評(píng)估東芝MG10-D系列8TB硬盤在不同文件大小情況下的每秒文件讀寫數(shù)量和帶寬吞吐。

圖9展示的是64K、128K、256K及以上不同尺寸大小文件的順序讀取與寫入性能:

圖9:海量小文件的順序讀取/寫入性能測(cè)試結(jié)果

從上圖展示的測(cè)試結(jié)果來看,在64K和128K小文件測(cè)試中,MG10-D每秒可成功打開并傳輸?shù)奈募?000個(gè)以上,隨著文件尺寸的增大,每秒文件傳輸數(shù)開始下降,帶寬則快速提升,在256K時(shí)達(dá)到最大帶寬171MB/s;之后隨著文件尺寸的增加,每秒文件傳輸數(shù)逐漸下降,帶寬隨之對(duì)應(yīng)下降。

在文件順序?qū)懭霚y(cè)試中(實(shí)際是重寫),64K文件每秒可寫入近950個(gè),隨著文件尺寸的增大,每秒寫入數(shù)量逐步降低,寫入帶寬則隨之提高。在1MB文件時(shí)達(dá)到最大帶寬111MB/s。

在企業(yè)數(shù)據(jù)中心內(nèi),更多應(yīng)用場景的數(shù)據(jù)傳輸特點(diǎn)是文件隨機(jī)讀寫,圖10展示的是不同尺寸大小文件的隨機(jī)讀取與寫入性能測(cè)試結(jié)果:

圖10:海量小文件隨機(jī)讀取/寫入性能測(cè)試結(jié)果

圖10測(cè)試結(jié)果顯示,在20萬小文件隨機(jī)讀取性能測(cè)試中,東芝MG10-D系列8TB硬盤在128K尺寸大小文件時(shí),每秒成功打開并傳輸?shù)奈募?shù)量最多,達(dá)到137個(gè),對(duì)于HDD而言,這是一個(gè)極出色的性能成績。隨后,隨著文件尺寸的增大,每秒打開數(shù)量降低,但帶寬隨之提高,在1MB尺寸文件時(shí)獲得最大帶寬38MB/s。

同理,在隨機(jī)寫入測(cè)試中,東芝MG10-D系列8TB硬盤在64K尺寸文件獲得最大文件寫入數(shù)量——每秒寫入519個(gè)文件,隨著測(cè)試文件尺寸的增大,每秒寫入數(shù)量下降,但寫入帶寬逐漸上升,到1MB尺寸文件時(shí)獲得最大帶寬——97MB/s。

為何在文件性能測(cè)試中,隨機(jī)寫入性能遠(yuǎn)超隨機(jī)讀取性能?這是因?yàn)樵跍y(cè)試中啟用了硬盤寫入緩存(Write Cache)。通常情況下,為了防止突然掉電導(dǎo)致緩存數(shù)據(jù)丟失,硬盤中的寫入緩存大多處于關(guān)閉狀態(tài)。而在本次測(cè)試中之所以打開寫入緩存,這是因?yàn)闁|芝MG10-D系列硬盤中集成了持久寫入緩存技術(shù),即使突然掉電,該技術(shù)也能保證硬盤緩存中的數(shù)據(jù)安全。并且,該系列硬盤緩存都為512MB,更大容量意味著可以緩存更多數(shù)據(jù),也意味著更好的性能。

以上兩個(gè)測(cè)試結(jié)果顯示,東芝MG10-D系列8TB硬盤對(duì)文件隨機(jī)讀取的加速效果低于隨機(jī)寫入,這是因?yàn)闇y(cè)試數(shù)據(jù)全部都是重新寫入的新數(shù)據(jù),沒有調(diào)用到讀緩存。而在文件隨機(jī)寫入測(cè)試中,下發(fā)的負(fù)載首先寫入硬盤的寫緩存(并經(jīng)過排序),然后以類似順序?qū)懭氲姆绞綄懭胗脖P,從測(cè)試結(jié)果來看,其加速效果非常明顯,在64K文件大小時(shí),每秒隨機(jī)寫入的文件數(shù)量約為順序?qū)懭氲?5%,隨著文件尺寸的增大,加速效果越發(fā)明顯,在1MB文件大小時(shí),隨機(jī)寫入帶寬接近順序?qū)懭霂挼?0%(87%)。

在海量小文件存儲(chǔ)系統(tǒng)中,存儲(chǔ)的文件數(shù)量也會(huì)對(duì)文件讀寫性能帶來影響(其他配置不變的情況下),此測(cè)試將評(píng)估128K尺寸文件大小下,不同文件數(shù)量對(duì)讀寫性能帶來的影響,圖11為測(cè)試結(jié)果:

圖11:不同文件數(shù)量對(duì)存儲(chǔ)性能的影響

在文件隨機(jī)讀取測(cè)試中,隨著文件系統(tǒng)中文件數(shù)量的增加,每秒成功打開并傳輸?shù)奈募?shù)量會(huì)隨之下降,在超過10萬個(gè)文件后,讀取性能趨于平緩,響應(yīng)時(shí)間也維持穩(wěn)定。而在文件隨機(jī)寫入測(cè)試中,由于寫入緩存的加速,雖然文件系統(tǒng)內(nèi)文件數(shù)量顯著增加,但每秒成功寫入的文件數(shù)量依然平穩(wěn),響應(yīng)時(shí)間也沒有很大起伏,得益于緩存顯著提升了企業(yè)文件系統(tǒng)的性能,尤其是寫入性能。

上述結(jié)果均基于單機(jī)環(huán)境下對(duì)單塊東芝MG10-D系列8TB硬盤進(jìn)行測(cè)試獲得,在企業(yè)實(shí)際環(huán)境中,存儲(chǔ)系統(tǒng)通常有著數(shù)量多得多的硬盤。比如分布式存儲(chǔ),即使最小3節(jié)點(diǎn)也有多達(dá)36塊硬盤,如果按上述測(cè)試數(shù)據(jù)推算,其能支持每秒最多3.6萬個(gè)文件的并發(fā)訪問。即使部署在傳統(tǒng)雙控陣列(12塊硬盤)中,也能支持每秒最多近1.2萬個(gè)文件的并發(fā)訪問。更何況還有存儲(chǔ)系統(tǒng)的內(nèi)存/緩存加持,實(shí)現(xiàn)的系統(tǒng)綜合實(shí)際性可高于上述數(shù)值。

本測(cè)試綜合考慮HDD的性能后選擇使用的是單機(jī)環(huán)境(i5-13600,14Core@2.7GHz,32G內(nèi)存)進(jìn)行測(cè)試,在測(cè)試中排除了系統(tǒng)內(nèi)存、網(wǎng)絡(luò)等因素的影響。在企業(yè)實(shí)際環(huán)境,如文件共享應(yīng)用中,文件系統(tǒng)(NAS)緩存將會(huì)對(duì)文件讀寫性能帶來利好,但不同的存儲(chǔ)網(wǎng)絡(luò)(GbE vs FC、10GbE vs 25GbE等)則會(huì)對(duì)測(cè)試結(jié)果帶來較大影響,同時(shí),客戶端并發(fā)數(shù)量、讀寫負(fù)載混合比例等都會(huì)不同程度上影響文件系統(tǒng)性能。

3.除了性能,硬盤還有其他優(yōu)點(diǎn)

東芝MG10-D系列硬盤是東芝專為企業(yè)存儲(chǔ)而研發(fā)改進(jìn)的傳統(tǒng)磁記錄格式(CMR)硬盤家族,除了上述測(cè)試中所反映出的性能穩(wěn)定性、可預(yù)測(cè)性外,為滿足企業(yè)存儲(chǔ)需求,東芝MG10-D系列硬盤還有著很多特點(diǎn)及可選擇的附加功能,比如:

即時(shí)清理擦除(SIE)和自加密功能(SED)。很多企業(yè),尤其是有著大規(guī)模數(shù)據(jù)中心的企業(yè),因故障更換硬盤、報(bào)廢硬盤后,如何處理被淘汰硬盤通常是一個(gè)難題,其上可能存放著企業(yè)敏感數(shù)據(jù)。而利用這兩項(xiàng)安全功能,能幫助企業(yè)更好地處理數(shù)據(jù)安全風(fēng)險(xiǎn)。東芝MG10-D全容量系列硬盤均支持這兩項(xiàng)功能。

持久寫入緩存技術(shù)。可在保證最優(yōu)寫入性能(Write Cache啟用)的基礎(chǔ)上防范由于突然掉電導(dǎo)致緩存數(shù)據(jù)丟失的風(fēng)險(xiǎn),幫助企業(yè)在保證數(shù)據(jù)安全的同時(shí)更好地應(yīng)對(duì)突發(fā)業(yè)務(wù)波峰。

存儲(chǔ)選擇更靈活。東芝MG10-D系列硬盤不僅提供用于構(gòu)建分布式存儲(chǔ)的SATA接口硬盤,還提供滿足企業(yè)存儲(chǔ)陣列需求的SAS接口硬盤;企業(yè)還可根據(jù)業(yè)務(wù)所需靈活選擇512e/4Kn或512n等不同扇區(qū)格式的硬盤,可無縫融入企業(yè)各種業(yè)務(wù)場景;1TB起步、最高10TB的容量規(guī)格也讓企業(yè)擁有更靈活的選擇。

圖12:東芝MG10-D系列提供不同規(guī)格型號(hào)的硬盤,供企業(yè)按需求靈活選擇

除上述特點(diǎn)以外,東芝MG10-D系列硬盤每年額定工作負(fù)載總傳輸率可達(dá)550TB;同時(shí)還具有很好的電源能效,在活躍待機(jī)模式下的功耗降至5.74W,相比上一代產(chǎn)品能耗節(jié)省方面也有很大提升。對(duì)于聚集了數(shù)萬臺(tái)服務(wù)器的企業(yè)數(shù)據(jù)中心,每一瓦的能耗節(jié)省都能為用戶帶來更好的成本管控制。

在很多企業(yè)數(shù)據(jù)中心的主流應(yīng)用場景,HDD以其可預(yù)測(cè)的性能、更具性價(jià)比的投入、經(jīng)驗(yàn)證的可靠性、更靈活的容量與接口選擇,以及優(yōu)異的兼容性等特點(diǎn),能夠更好地支撐企業(yè)業(yè)務(wù)的正常穩(wěn)定運(yùn)行。

(轉(zhuǎn)載自大數(shù)網(wǎng))

分享到

nina

相關(guān)推薦