2014年5月22日存儲在線阿明原創(chuàng)報道:前Facebook的存儲負責(zé)人,OCP創(chuàng)始成員Per Brashers表示,對于數(shù)據(jù)中心的部署需要一個整體策略,整體策略之下有著細分的考量。
比如在簡化氣流的設(shè)計方面,采用外部空氣來冷卻設(shè)備,從而節(jié)省能耗。節(jié)氣設(shè)計是實現(xiàn)接近pue1值。
他認為,數(shù)據(jù)中心設(shè)施、空調(diào)、氣流設(shè)計,電力分布系統(tǒng)設(shè)計,機架/服務(wù)器/存儲部署設(shè)計這三個方面的設(shè)計都可以為數(shù)據(jù)中心帶來能耗的節(jié)約。
在外部數(shù)據(jù)中心設(shè)計方面,開放式氣流交換設(shè)計帶來的能耗降低是很有價值的。
傳統(tǒng)設(shè)計在每次轉(zhuǎn)換電源過程中對電能都有損耗,而采用OCP設(shè)計中,對電源損耗非常低,到服務(wù)器總損耗為7.5%。
回顧OCP三代設(shè)計中,版本1專門為低氣流阻礙而設(shè)計;版本2的密度翻番,降低了功耗,依然采用同樣機箱;版本3專項常見的功耗分布模式,進一步改善功耗利用。可見,OCP 為數(shù)據(jù)中心用戶能耗控制帶來了一次又一次的幫助。
OCP在存儲方面的進展,早期設(shè)計為2u 30盤,采用1個或2個sas擴展器。后來有了轉(zhuǎn)變。
與傳統(tǒng)設(shè)計相比,OCP平均節(jié)省33%;智能轉(zhuǎn)接卡及網(wǎng)絡(luò),進一步降低開銷;雙層數(shù)據(jù)大幅度降低開銷。
目前,用戶在重新定義數(shù)據(jù)保護,需要安全地放數(shù)據(jù)、安全地恢復(fù)數(shù)據(jù)。
過去,采用3個備份方式,在本地、機架、跨越機架存3份,在存儲數(shù)據(jù)規(guī)模擴大之后,其存儲成本非常大。還有采取糾錯編碼方式,成本雖然小,但一旦某個節(jié)點出現(xiàn)問題,就需要重構(gòu)對處理器等開銷很大,同時重構(gòu)時間也長,其可靠性存在問題。再者,可以在節(jié)點內(nèi)采用rard5,節(jié)點外采用糾錯編碼方式,這樣的方式成本可以降低,可靠性也可以提高,開銷也比3個備份方式更低。
這種雙層數(shù)據(jù)保護方式,將照片上傳,收到相片的服務(wù)器將其切成[10,12]塊,并將每個塊,發(fā)給不同的主機。主機則在本地為數(shù)據(jù)塊提供保護,這樣以來,網(wǎng)絡(luò)和相鄰節(jié)點就不會受到驅(qū)動故障或讀故障的影響。
因此,這種方式可以幫助用戶獲得一個理想的成本與IOPs的交叉點,最適合小業(yè)務(wù)負載、如DB\KVS元倉庫等,所有io密集型復(fù)雜都使用,如cdn和熱對象高速緩存。冷閃存是我們發(fā)明的一個名詞,也在驅(qū)動SSD的應(yīng)用和部署。
OCP可以為用戶盡情施展想象的舞臺,在網(wǎng)絡(luò)、數(shù)據(jù)中心、hadoop、小文件存儲、高速緩存、冷存儲服務(wù)器應(yīng)用方面都對優(yōu)化資源配置有所幫助。采用標(biāo)準(zhǔn)構(gòu)建模塊,混搭使用以滿足應(yīng)用需求,應(yīng)用變更或增添可以復(fù)用。
高存儲與計算比方面,一臺主機上帶有更多盤片可實現(xiàn)更高的三IOPS和吞吐量。冷文檔為1:240,需要多臺控制器來維持吞吐量。
在facebook的OCP設(shè)計中,存儲解耦合方面,采用SAS連接。管理龐大盤片,采用主機直連,易于安裝和跟蹤;采用SAS交換的架構(gòu),靈活配比,減少布線,端口密度好,但是需要考慮熱插拔的服務(wù)器方面的問題;采用IP交換的架構(gòu),采用現(xiàn)有的布線,從文檔系統(tǒng)中減掉了一臺服務(wù)器,但是大量使用微服務(wù)器在功能和成本方面帶來負面影響,在IP網(wǎng)絡(luò)上運行塊存儲業(yè)務(wù),系統(tǒng)不穩(wěn)定。
因此,總體來看,OCP始終會考慮效率原因,降低大規(guī)模數(shù)據(jù)中心的建造和運營成本。采用主要部件圍繞氣流精簡、功耗分布、服務(wù)器設(shè)計、存儲設(shè)計,采取綜合的能力才能達到最終結(jié)果。進一步降低成本,可能是軟件、可能是硬件、可能是硬件和軟件的結(jié)合,如高級數(shù)據(jù)保護,幫助降低設(shè)備運維成本。(阿明)
觀點:
OCP創(chuàng)始成員Per Brashers認為:以太網(wǎng)硬盤的未來,作為接口比較理想,但現(xiàn)有存儲協(xié)議不太理想,來自標(biāo)準(zhǔn)、開銷等問題,因此以太網(wǎng)硬盤的生存價值是有質(zhì)疑的,對于以太網(wǎng)硬盤的管理成本增長,以及通過網(wǎng)絡(luò)接入盤,這個風(fēng)險很高。
PMC公司首席科學(xué)家、研發(fā)副總裁廖恒博士認為:解耦合的分離式io新架構(gòu),走向更加融合,數(shù)據(jù)中心的計算、存儲以及網(wǎng)絡(luò)資源作為資源池來作為動態(tài)靈活的調(diào)配和綁定。但解耦合與融合之路如何做?從芯片角度,選擇合適協(xié)議和互聯(lián)方式是可以做到解耦合,但要做到融合,需要一個生態(tài)系統(tǒng)的支持,需要軟件與硬件的結(jié)合。